华夏会议信财在哪次的会议上提出过“消费金融人工智能反欺诈”这样的话题?

《消费金融领域如何利用技术掱段做好反欺诈?》 精选一

近年来消费市场规模成倍的增长,居民消费信贷也呈现了高增长趋势消费金融及其延伸出来的现金贷、网貸业务一片火热,然而在资本追捧的背后黑中介骗贷、线下勾结、洗钱套现现象严重,欺诈俨然形成一条庞大的黑色产业链

国内消费金融市场风控还处于初始阶段,由于个人征信体系的缺失、风控技术薄弱加之欺诈成本较低使得消费金融成为了欺诈分子的攻击对象,身份冒用、薅羊毛、团伙骗贷欺诈手段层出不穷导致平台坏账率居高不下。

目前反欺诈开始成为消费金融风控的重点。随着大数据、人工智能等技术的日趋成熟风险量化成为了可能,金融科技开始成为反欺诈的有力武器针对消费金融的欺诈现状,通付盾整合设备指纹、深度学习、关联分析等多项核心技术在海量数据分析的基础上,搭建了一整套的智能风控体系从贷前、贷中、贷后提供全方位風险防控,包括了风控建模、反欺诈、贷前个人信用资质核验、多平台借贷预警、贷后监控等全业务周期风险管理

通过获取上网设备属性的多层次信息生成唯一的设备ID,精准标识设备在毫秒内迅速发现设备使用代理、使用VPN、参数修改、地理位置异常、恶意IP、速率异常风險行为,在注册、登录、交易、提现等不同业务环节阻断欺诈操作

在线业务结合时间、空间、行为等维度,立体探查风险规律一方面昰对业务事件数据进关联分析,通过关系的可视化呈现探查欺诈风险;另一方面,在地图上进行事件分析将事件发生的地点映射在地圖上,直观发现恶意分子行为轨迹有效防范团伙诈骗

基于深度学习技术的“风控大脑”深入分析客户业务数据,挖掘风险特征最終形成行业业务模型库,提供灵活、可自定义的语义化规则编辑器只需简单的修改即可上线使用,低成本快速实现风控建模

从地域、渠道、行业等多维度深度挖掘平台风险漏洞,全方位动态预警业务欺诈风险及时掌握风险态势。

在消费金融领域风控的大部分价值在於反欺诈。通付盾提供更加个性化的风控服务智能风控系统中预置了通用类、时间类、位置类、设备类、统计类等基本规则模板,适用於消费金融、第三方支付、银行、电商等业务领域轻松定义业务风控规则,实现精准反欺诈

在资本热捧的消费金融领域,金融科技反欺诈是大势所趋通付盾始终致力于利用设备指纹、深度学习、关系图谱等技术来提升金融反欺诈的效率。

10月通付盾六周年庆典活动正茬进行中,人脸识别、设备指纹、滑动验证、移动安全服务限时免费!

戳【阅读原文】立即使用!

《消费金融领域如何利用技术手段做恏反欺诈?》 精选二

2015年“互联网+”开始改变全行业;以“大云平移”(大数据、云计算、平台、移动互联网)为特点的新技术,吸引着各行各业的目光通付盾公司,作为领先的“互联网+”信息安全服务提供商提供覆盖“云、网、端”的全方位、一体化安全保护解决方案。通付盾从安全的角度将关注点放在移动互联的设备上,通过对设备的标识来解决网络真实度的问题为“互联网+”的各项业务提供精准的风险分析决策及数据支撑。 这项技术就是通付盾五年前率先推出的被动式全栈设备指纹技术于2014年底及2015年初得到相应发明专利授权。就像人有指纹一样上网设备也是可以有“指纹”的。早先的设备指纹技术通过安装插件获取设备信息生成设备ID,是主动进入到用户設备来采集信息的用户体验苛刻。通付盾的被动式全栈设备指纹技术对用户完全透明,通过OSI协议栈快速获取上网设备的软件、硬件、網络等多层次指纹信息为每个入网设备生成跨平台的唯一设备ID ,作为虚拟空间的“身份证”打造开放化平台的隐形账号体系。通付盾嘚被动式全栈设备指纹技术基于通付盾创始人数学博士汪德嘉先生及其团队的专业研究与十多年积累,以通付盾大数据分析云平台()通付盾于2011年10月由美国威斯康星大学博士汪德嘉先生留学归国创立, 是一家领先的互联网金融安全大数据公司精心打造开放环境的信息安全岼台“盾云”服务:“应用安全云服务”() 、“大数据分析云服务”(

和我们一起 用数据改变世界

《消费金融领域,如何利用技术手段做好反欺诈》 精选六

数据显示,截至2016年9月初央行征信系统收录的自然人数量已经超过9亿,但拥有信贷记录的仅4.1亿人没有征信记录的5亿“尛白”人群,其金融需求如何得到满足是一个亟待解决的问题,也是新的市场机遇基于互联网大数据技术的风控,就是从近10亿未被央荇征信数据所覆盖的人群中挑出“坏人”。大数据风控能够过滤掉绝大多数带恶意欺诈目的“坏人”也能动态监控到没有欺诈意图,泹实际还款能力和还款意愿出现波动的客户即使出现违约和失联情况,大数据还能重新挖掘到借款人的关联信息挽救不良。那么消費金融大数据风控到底是怎么玩的?

欺诈风险:用户信息是否被盗用或虚假注册;

信用风险:是否存在多头借贷、居所存在不真实和不稳萣等问题;

渠道风险:有时候渠道有帮助用户套现的冲动可以通过横向比较、纵向比较发现某个渠道的异常数据。

3C电商场景的风控重点

3C產品流通好、易变现需要谨防刷单和套现风险;可以监控用户的购买频率,重点关注高频使用的设备和频繁购买的用户并且通过对过往账户数据的检查发现异常黑名单或灰名单账户;如发现异常,需要和电商平台合作在发货前及时拦截。

医药分期场景的风控重点

如癌症类药品用户还款能力会受病情的影响,需要让患者的家属或朋友作为共同借款人病情通过医生核对病人实情,确认其购药行为的真實性

现金贷最大的问题是资金的去处不易把握,相对于有场景的消费行为缺乏有效的风控抓手。在反欺诈和防范信用风险上除构建嚴密的风控模型外,对较高风险的用户只做小额、短期放款对低风险客户可做大额、长期放款,并根据还款情况动态调整用户的额度和期限

关注资产方合作伙伴的信息披露问题

国内线上、线下的小贷平台有各类消费类资产,一方面需要资金支持另一方面却不完全开放洎身数据,比如A轮、B轮融资的资金实到情况、资金使用情况对方是不愿意开放给贷款资金方看的,因为创业公司一开始很多都是烧钱的而对于贷款资金方来说,看不到这些数据就无法判断该平台的经营持续性和风险兜底能力

多方合作中的劣币驱逐良币效应

如果一个资產生成平台和多个P2P资金方合作,而大家的风控标准差异较大的话这家平台很可能被风控较松的P2P公司拖下水。如果这个平台承担了太多兜底压力借款人因为渠道平台(中间链接)的倒掉而不需要还钱,其他风控严格的P2P一样会遭殃

借助合作渠道获得客户,特别是有很多门店的合作渠道其门店管理中往往存在一定的道德风险。渠道的渠道下线的下线,为了业绩激励和提成等伪造或粉饰原始资料

传统模型与大数据模型的比较

金融机构通常使用以央行征信数据为主的金融数据建模,大概10-20个强变量以与金融机构发生借贷关系的数据为主。泹是全国75%无借贷记录的用户得不到有效地信用评估,并且这些强变量中任何一个变量的缺失都会导致模型失效。

大数据公司正尝试使鼡非金融数据建模大概50万个强弱结合的变量,其中有很多数据与金融毫无关系例如,用户日常的阅读、消费、社交、旅游、娱乐等這些数据刻画出的人是完整的人,不会因为某些领域的作假而改变

总的来说,消费是相对较强的变量阅读社交较弱一些,把多种强弱變量结合起来风险建模部分变量的缺失对模型的稳定性影响会很小。

恶意欺诈用户一般不会采用真实身份借款身份真实性识别是反欺詐的核心。身份证、银行卡、姓名、手机号四要素如果无误欺诈概率是其他群体的1/3左右。

通过大数据储存用户与各种ID对应的数据库在鼡户进行借贷时进行身份匹配,能够及时辨别潜在的欺诈嫌疑用户这些数据库包括:姓名、身份证号的实名ID,手机号、地址、银行卡号等准实名IDQQ号、微博号、设备指纹(PC或手机硬件设备编号)等的匿名ID。

主要指还款能力(经济实力)与还款意愿(道德风险)大部分用户在申请阶段並非恶意,这就考验借款人对信用风险的判断而行为数据挖掘是信用风险防范的核心。

要预测借款人的信用风险更多地需要依赖于分析海量用户的行为数据(强弱变量),从中挖掘出可以多次复用的规律

数据显示,坐过商务仓以上或一年乘坐飞机四次以上的客户违约率较低;在本地生活方面花钱越多的人违约率越低;访问财经媒体天数越多违约率风险越低;同一手机号使用九年以上的用户违约率大概仅為6‰;而三四线城市打游戏花钱较多的人违约率比较高。

贷中管理方面通过及时监测借款人信用的变化、共债的新增、流水的异动、联系状态的异常等数据,采用全自动的风险识别流程提早识别风险,提高人工处理效率

消费金融不良资产,主要由道德水平不高和还款能力不强造成据统计,70%-80%的不良资产是因为债务人失联导致大数据网络可重新建立起与债务人的联系,通过关联匿名ID、联系家人朋友追囙欠债从而降低整体不良率。

辩证看待消费场景的风险

场景能便捷有效地获取客户在风险控制上,将资金支付给商家比给用户更安全但现在通行的认知是默认有场景就是低风险。殊不知除了商家在操作上存在道德风险外,线下场景也容易发生销售人员的道德风险

其次,倘若获取的资产完全依赖场景最终会限制自身的获客渠道,大场景几乎都是自己作消费金融中小场景受到资金方竞相追逐,导致获客成本不断高企

此外,基于场景获取的新客户风险难控、不良率较高,一些消费金融公司的盈利模式是通过向优质老客户二次营銷发放现金贷获利。

干货 || 车贷风控入门

干货 || 老客户续贷如何做风控才能痛快又不翻车?

风控老司机:人工智能进军风控血肉之躯会鈈会失业?

《消费金融领域如何利用技术手段做好反欺诈?》 精选七

2月7日第九期金融科技技术安全共同体学院专题讲座在恒昌技术中惢举行。此次专题讲座以 金融科技领域的风险控制与防范 为主题邀请了恒昌信息安全总经理张劲、恒昌技术中心研究院副总经理张惟师、恒昌高级算法专家徐鹏、恒昌资深系统安全治理专家张斌作为讲师,进行了主题演讲基于恒昌在信息安全和技术安全方面所做的努力囷取得的丰硕成果,共同体学院此次邀请了恒昌的安全和技术专家为共同体成员单位以及其他典型金融科技平台CTO、技术总监、安全总监等约50位嘉宾作演讲和分享,以促进金融科技安全共同体的建设在优秀的企业之间形成聚焦安全技术、相互学习、共同成长的纽带。

第九期金融科技技术安全共同体学院专题讲座合影

据了解金融科技技术安全共同体于2017年5月25日正式成立,是一个行业自发自律性组织目的是團结有实力的金融科技企业,建立行业信息分享平台提升行业整体信息安全能力,打造行业阳光化的网络空间自成立以来,已有32家金融科技平台陆续加入金融科技技术安全共同体恒昌也是其中成员之一。同时由梆梆金服打造的 梆梆课堂 2017 年召开的 金融科技技术安全共哃体 首次成员大会上,正是更名的 共同体学院 截止到2017 年底,共同体学院已累计邀请30 余位行业专家讲师、80 余家金融科技平台、300 余位学员参與到活动中来在行业内形成了广泛的影响。

固安全基石 筑就信息安全 防火墙

互联网时代网络空间所承载的信息和数据越来越庞大,这形成了人类生产生活的重要资产而这类信息数据资产的安全经常受到网络攻击、网络监听等威胁。 由于互联网金融在业务开展过程中积累了大量信息和数据这些也经常成为网络攻击的重灾区,容易导致信息数据外泄、非法窃取账户数据等问题造成对平台和消费者的损害。因此加强互联网金融行业的网络信息安全一直是行业发展的重中之重。 恒昌信息安全总经理张劲从金融科技创新与安全风险治理的宏观背景出发详细解读了监管科技技术和信息安全趋势。恒昌信息安全总经理张劲发表 金融科技创新与安全风险治理 主题演讲

恒昌一直致力于保障客户信息安全一切网络信息安全工作都以保证客户账户安全、资金安全、支付安全、数据传输安全为目的,通过专业的安全團队针对线上平台安全性进行持续安全测试同时采用业界先进的纵深防御策略进行多重安全保障。 张劲在整体介绍恒昌安全治理与行业咹全布局中表示在资金安全保障方面,2016年年末恒昌旗下的恒易融平台成为国家互联网金融安全技术专家委员会首批试点接入企业。此外恒昌还加入了 全国互联网金融阳光计划 ,恒易融也顺利入驻 国家平台理财安全助手APP 在平台安全保障方面,恒易融通过了公安部的国镓信息系统安全等级保护三级备案与评测、中国信息安全测评中心的测试以及 CFCA中国金融认证中心的安全测评在信息安全保证方面,恒昌通过了ISO27001信息安全管理体系认证、获得了ISO(质量管理体系)和ISO/IEC1(IT服务管理体系)认证经过一系列信息安全保障的部署和安排,恒昌是全国信息安全標准化技术委员会成员单位、中国云安全联盟理事单位、中国通信标准化协会全权会员、中国互联网协会标准化工作委员会首批成员单位、北京网络行业协会理事单位还成立了恒昌安全攻防实验室和安全应急响应中心。

在谈到网络信息安全中涉及的技术风险和安全管理的具体技术实现上 抗D CC攻击、系统安全漏洞管理、木马病毒管理、APP风险管理、蜜罐等是我们在日常针对技术风险会做的工作。 恒昌资深系统咹全治理专家张斌在 基于风险管理的系统安全建设 的主题演讲中提到 针对安全管理里的信息泄露问题,我们采用SSL+报文加密、GitHub防泄密、数據库加解密等技术来预防和处理 在普惠端的反欺诈方面,我们也对多个线上借款系统进行了业务层面的攻击提出了多个可能存在的安铨风险点。

定风控核心 以金融科技树风控壁垒

在金融安全上风控是核心。互联网金融有着互联网和金融两方面的风险因而要求互联网金融平台必须具备强大的风控壁垒。恒昌借助大数据、人工智能等金融科技手段构建了日渐完善的全流程风控体系。恒昌技术中心研究院副总经理张惟师发表 金融科技助力恒昌普惠金融 主题演讲

恒昌利用大数据技术进行数据存储、数据整合、数据分析、用户画像,又通過机器学习、深度学习、聚类算法等构建了信用模型、欺诈模型、违约概率分析模型、风险定价模型逐步实现了审批自动化。 恒昌技术Φ心研究院副总经理张惟师在 金融科技助力恒昌普惠金融 主题演讲中分享了研究院对于各项金融科技的研发和应用情况 用户画像、知识圖谱、数据分析/BI、大数据风控、AI/机器学习、智能服务等技术已经应用到我们风控的不同环节 ,同时他还详细介绍了各项技术在实际应用中嘚策略和关键点 对于恒昌研究院的未来规划,我们希望达到融合化、创新化、开放化、精准化具体而言,就是希望用户画像与知识图譜相互提供数据支持与效果反馈发挥更大的价值,实现融合化不断重视高端人才引进和培养,加速人工智能相关技术应用的落地以實现创新化。希望加强对内对外的技术交流对外开放技术服务,实现开放化希望开发流程、数据清洗、模型验证和上线等不断规范,朂终实现管理精准化 而只有这样,才能让信息更丰富、决策更精准、服务更智能、平台更安全

而针对一个具体技术在风控的某个具体環节的应用上,恒昌高级算法专家徐鹏深入阐释了知识图谱在反欺诈上的应用逻辑 针对伪冒申请、代办包装、组团骗贷、资料虚假等不哃类型的欺诈行为,传统的风控没有充分利用技术优势且过于依赖第三方。而设备指纹、行为侧写、人脸识别、虹膜识别、活体识别、聲纹识别、知识图谱都是其创新解决方案 其中,知识图谱可以系统化地整合其它创新方案以及整合历史上传统方案中的申请人特征,嘫后基于图计算引擎进行相应的知识融合从而建立起一个规模庞大、可信、可靠的关系网络。无论是抽取强业务规则还是提供给AI/算法團队进行算法研究,都有独到的优势 因此,恒昌基于全新图数据库技术构建起超大规模的信贷知识图谱同时,基于长期积累的数据鉯及技术团队不断优化迭代的规则模型,恒昌的知识图谱在反欺诈上也发挥了巨大作用

一直以来,恒昌不断推动智能化风控管理、金融科技创新、以信息安全发轫实现了平台的合规发展和运营服务的降本增效,为平台用户提供了便捷、安全的新金融服务同时,在新时玳大环境趋势下恒昌希望也与业界同行携手,拥抱行业机遇和面对行业挑战共同推动新金融的规范化、数字化、规模化发展,共筑金融科技安全共同体

《消费金融领域,如何利用技术手段做好反欺诈》 精选八

整理 | 薄珂 墨菲 戈森

中国的反欺诈有多难?“2011年至2015年五年囲造成经济损失550亿元,” 通付盾创始人董事长兼CEO汪德嘉在一本财经举办的“2017消费金融CRO全球峰会”上称,看看中国黑产的规模就知道反欺诈有多难。

大数据、人工智能、活体识别、人像比对、设备指纹、人脸识别……大量的风控技术都开始运用到场景之中。

技术真的能阻挡黑产脚步吗

段莹:“未来信贷是拼图式的,拼成一个生态”

我们总结2017年整个中国信贷市场上信贷资产的特点可以分为五大类:

1、線下消费贷。以场景风控为核心比如捷信,拥有几万人驻扎的门店通常经营标准化的3C、家电产品等。它的优势是因为有消费场景,所以风险相对可控;但需要大量的地面人员门槛相对高。

2、线下信用贷通过门店去获客,比如车主贷、白领贷等等这类特点是通过門店、信贷员去获客,做初步审核然后加上中央的集中风控,是比较典型的“信贷员模式”和“信贷工厂模式”的结合

这两类玩家相對比较多一点。

3、抵押贷比如车抵贷、房抵贷等,以抵押的形式控制风险风控也偏向传统,是很多传统金融机构开展的业务

4、线上尛额现金贷,Payday

不管是线上还是线下的现金贷业务,都是在2015年才开始有比较大发展payday这种模式,在2015年中旬起步随着一些公司的快速扩张,迅速兴起这类模式的特点是,额度特别小利率相对高。

为什么很多人会做payday呢

因为很多机构是偏互联网出身的,payday更多是强调高利率來覆盖高风险通过快速的风控迭代,保证存量用户就能产生利润。

线上的大额现金贷跟payday相比,最大的特点是借款额度相对大这时,机构就没有足够资金或风险忍受度能在在几万、几十万甚至上百万的用户中测试。

所以这种模式更多是通过定向邀请白名单用户来莋。比如微粒贷是把高风险、高利率的小额现金贷,往更高的额度、更低利率、更长的期限来扩展

目前,受限于种种的因素从事的夶额现金贷的机构相对少一点。

未来什么样的信贷资产更加符合这个时代的发展潮流?

从去年监管出台20万借款限额出现后,两类业务發展的特别快:一类是车抵贷一类是payday。

payday它的优势是能快速积累用户,最大的特点是必须有足够的流量通过大量“新客户变成老用户”的沉淀来建立信贷体系,可能风控更依赖催收去做

这个行业过去一年半发展非常红火,竞争很激烈也存在很多问题,比如政策风险还有共债严重。

我们从2016年初开始关注共债严重问题

从数据来看,2015年下半年payday共债率大概百分之三四十,但一年半后如今共债率涨到百分之九十以上。

这个行业竞争激烈因为它相对来讲门槛低一点,竞争激烈在所难免

payday的这些人群到底是不是只申请payday呢?是不是可能里媔也有相对好的人群会申请利率更低金额更大的产品呢从百融的数据来看,基本上印证了我们的观点我们发现payday产品的申请人还去申请別家产品的payday比例挺大的,30%左右比信用卡等一些利率更低的产品比例要高。

不过 payday人群里,其实还有不少“好人”可以给他们提供利率哽低、时间更长的信贷产品。

但其实很多人也都想到这一点问题在于如何找到这类优质人群呢?如何避免被欺诈团伙盯上呢

我们做了┅些尝试,通过邀请制的方式先找出比较好的客户,定向去邀请通过这种方式,一方面尽可能避免被欺诈团伙盯上另一方面还保证仳较好的用户体验。

太阳底下没有什么新鲜事其实这个思路也并不是独创。传统信用卡会有联名卡本质是认为某一类场景下的用户就昰资质比较好的客户,通过预筛选把风控前置不管是主动邀请被动触发,都能解决用户体验和风控的矛盾

预设白名单,一方面能改进鼡户体验更快进行额度定位、审批;对于信贷机构而言,能够做到风险前置避免风险后置的矛盾。

未来的信贷可能是拼图式的需要㈣块拼图,第一是资金第二是风控能力、技术、系统,第三是流量、获客第四是数据。所以未来任何机构之间的合作各家的核心能仂不同,把拼图拼到一块搭建一个更好的生态。

汪德嘉:“反欺诈不可能孤军作战”

通付盾创始人董事长兼CEO 汪德嘉

风控从另一个维度看就是客户关系的管理,流量就是获客精准营销就是获得流量。真正做好金融就是要做好精准的风控。什么是精准风控就是技术+数據+人工智能。

在中国用手机号做欺诈团伙的规模到金额,触目惊心2011年至2015年,五年共造成经济损失550亿元2016年电信欺诈,仅上半年就立案菦百万件造成损失逾两百亿元。

为什么会发生这种情况一是海量数据泄漏;二是新型欺诈行为更多是通过“人机对话”,有很强的隐蔽性;三是诈骗手段翻新速极快;四是金融欺诈逐步形成了包括上、中、下游结构完整黑色产业链增加了风控的难度。

举例说明黑客非法获取用户个人信息,数据拿到后大量二道贩子在中间赚取差价。每个环节每个人分工十分明确甚至有人会专门去联系相关的培训機构或诈骗团伙,从而把手上的数据卖到下游而下游这些团队,有专人负责诈骗的话术编写培训、线上通过第三方支付平台洗钱、线下ATM機提款等分工十分明确。

因此企业做反欺诈不可能孤军作战,一定要一帮朋友打群架的时代,有朋友、有渠道、有信息才能把反欺诈做好。

从移动金融风控整个链条看我们关注几点:一是账号,二是应用APP三是业务,即欺诈风险和信用风险形成一套产品,把风控防止前置做到多维度,态势感知以及风险信息共享,只有这样才能做到更精准的防控

目前互联网金融应用都以APP的形式存在。对黑愙来说只要有漏洞,就可以伪造交易窃取用户的信息,从而利用这些信息来骗贷因此,一定要对APP进行检测看是不是有病,是否健康

如何对APP进行检测?我们的做法是把移动互联网上所有的APP、安卓、IOS都集中起来放在一个库里再用不同的维度进行分析,从伪造、密码、弱点、内容等角度扫描黑客一旦通过APP发到云端,我们立刻就能知道他的具体位置从而帮助破案取证。

现在也有许多公司利用人工智能做风控我认为人工智能的算法不重要,重要的是样本例如向C端提供反欺诈机器人,可以看手机是否健康;通过深度学习技术智能分析各行业风险打造全场景风控策略。这些都是很好的尝试

乔杨:“大数据风控,既要用‘术’也得懂‘道’”

我讲两个部分大数据風控困境和突围。首先第一个问题,数据是不是越多越好

我们认为在数据质量可控、数据质量有保证的情况下,尽量引入更丰富、更哆元化的数据加入到模型中对模型提升是非常重要的。

随着互联网的普及1994年到2004年的十年期间,语音识别领域语音识别的错误率下降叻一半,机器翻译准确度提升了一倍其中,20%来自于算法的提升80%来自于数据量的提升。通过这个例子大家可以看到数据量决定了可能嘚上限。

纵观中国整个数据积累的情况和成熟度我们对这个市场并不是很乐观。目前数据共享问题并无有效的解决方案所以基于在征信、大数据风控领域的经验,我们观察到“数到用时方恨少”是非常普遍的现象

第二个问题,什么样的数据更优质

在探讨这个问题之湔,我想解释两个概念第一个概念,什么是大数据

大数据其实一定要具备三个特点,一是量大二是多元性/多维度,三是即时性百度地图的数据就具备这样的特点。

另外一个概念还需要解释一下:原始数据和加工数据的区别

很多公司之间的客群、抓取数据的方式、手段和维度都是类似的,但为什么风控表现参差不齐呢其实这个道理很简单。这些数据提供方包括这些数据使用方,在“特征工程”阶段的能力不一样

如果说数据量决定了模型的可能上限,特征工程的优劣决定了模型的实际上限

不同的特征工程对模型效果的差别昰非常大的。举个例子2016年6月,大数据分析竞赛平台Kaggle上线了全球最大的酒店预定网站Expedia 的“酒店预定预测比赛”。

这项比赛主要是要求参賽者基于Expedia提供的用户的历史搜索数据来预测客户最终会预定哪一个酒店共有1974个队伍参赛。

最终比赛结果评比标准为平均精确值(Mean Average Precision),值越夶说明模型预测的精度越高

我们以最终排名前15位的一个团队的特征工程步骤为例。在第一阶段团队做了较为简单的特征工程处理,最終得分0.04第二阶段,团队进行了精进的特征工程最终得分0.28。模型效果提升达到了6倍由此可见特征工程对模型效果的影响是非常明显的。

特征工程无非是从大量的噪声数据里面筛选出可用的、有价值的特征自从互联网诞生以来,就像我们在录音的时候产生大量的噪声一樣产生大量的垃圾信息。如何从这些海量的数据里面筛选出可用的、高效的特征其实就是考验一个建模能力的过程。

所以关键的步骤囿两个第一步,数据清洗;第二步特征变量的加工。

那么是不是召集一个技术非常强大的团队,全部是由博士和统计学的硕士组成嘚团队做出来的模型一定是非常好的这里有思维误区,特征工程其实优劣与否不只是基于一个理论知识,更多是对于业务的理解

举個我前东家的例子: Discover信用卡反欺诈做得好在业内是有口碑的。第一代反欺诈模型是vendor模型(外包模型)是由包括FICO在内的顶尖数据公司模型團队搭建的。

经济危机后美国监管机构要求金融机构能够解释自己的模型,由于模型是外包的我们对于模型的解释性是非常受限的。呮有通过自建模型才能解决这个问题

我有幸参与并领导了Discover第二代反欺诈预测模型项目。我们整个项目团队一共6个人用了6个月的时间完荿了模型的搭建,模型的效果**出乎我们的意料

所以,一个成功的风控团队不只是建立在扎实的理论知识基础上的更需要对业务的深刻悝解。

那有人会问了我花重金请一批既有技术又懂业务的大牛,这个问题不就解决了吗答案也是否定的。

在未来新数据源和新特征嘚获取会越来越难。模型的精度并不是随着特征的增长而线性提高随着人工特征工程的深入,投入的人力和时间越来越长得到的新特征对系统的提升却越来越少。换句话说人力投入的边际收益是递减的。

再举个IBM 沃森的例子IBM 沃森具备很强的语音分析能力,可以像谷歌嘚搜索软件一样迅速搜索自己巨大的知识库找出答案。美国有一个比较知名的公司以沃森作为实验,所有这些点都是实际的人类参赛點的表现跟计算机的表现完全不在一个量级上面。

随着时间的推移加入更多的数据和特征沃森表现越来越好,人力投入的边际效益是遞减的

边际效益递减达到一个边际的时候,怎么对模型和策略进行优化

我认为有两个方面:一方面,***上的Gilders Law是说尽可能多的采用便宜嘚资源,尽可能节约贵的资源另一方面,在特征工程达到效益边际之后就需要在算法和模型上做进一步的优化。

如图所示2个上限,1個途径

数据源与数据清洗是决定了这个模型能达到的可能上限,特征变量加工是决定了模型的实际上限最终模型与算法的提升是接近仩限途径。

但在模型和算法提升的过程中也有一个误区。如上图所示随着训练样本的迭代,训练误差越来越低但同时在认证样本上嘚误差达到一定复杂程度的时候会增高,这就会出现一个问题

如何从全局观,通过模型和算法提升整体决策效果将成为下一个风控难題。

总结来看大数据风控面临四大困境:数据资源壁垒,自有数据累积数据特征提炼,算法模型提升

02既要用“术”也需得“道”

那麼,这些困境有没有解决方案

以市场营销为例,解决这个问题可以通过智能推荐的算法方式对客户进行精准的评判。

以一家信用卡公司的客户触达策略为例当接通任一用户的电话时,客服代表的系统上会提示客户的基本画像可推荐的产品列表及预测的购买概率,方便客服代表进行沟通和推荐产品系统背后有多个主题模型,用来预测各个主题的产品的购买倾向并最终给出推荐产品的排序和组合。

偅要的是这些主题模型的建立,是根据真实的历史数据训练出来的而这些历史数据的积累是有着严格的实验设计规则的。

由于模型评汾Top 20%的人响应率为34%因此预计200万客户中会有约68万人开卡。而如果没有该模型随机发送(响应率10%),需要发680万人才能达到相同的开卡量

因此仅该营销活动,就为部门节省480万营销预算(近70%)

说到反欺诈,可以说目前的互联网反欺诈离不开文本挖掘最重要的是语义识别,其佽是图像的挖掘但是二者问题都是投入大,突破小极易遇到瓶颈。

机器学习数据挖掘等是大招,当对不良内容其他的方式都难以识別的时候用机器学习的方式效果最好缺点是见效慢,维护成本大样本的收集工作量大等等。但是一旦机器学习到达一定程度会是最恏的反欺诈手段。

以上说的都是“术”都是被动的去处理问题,而真正想把反欺诈做好需要的是“道”

也就是产品模式的突破,信用體系的搭建从源头使欺诈的门槛高于欺诈的收益,才会最终杜绝欺诈这也就是反欺诈领域里所有人努力的目标。

随着网络上意见型数據的爆发情感分析也被广泛研究和应用。目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法

但情感词典存在着一定弊端。词典把所有常用词都打上了唯一分数有许多不足之处:一是,不带情感色彩的停用词会影响文本情感打分;二昰由于中文的博大精深,词性的多变成为了影响模型准确度的重要原因再有就是,同一个词在不同的语境下可以是代表完全相反的情感意义

尤其是在中介言论识别方面,是否能够准确的对漏洞的大小进行衡量是平台的核心。

在反欺诈和平台舆情风险管理方面我们ZRobot囿非常多的尝试。我们从丰富的舆情来源包括网络上面的涉黑论坛、黑产、中介信息进行了文本分析、语音分析,能够为客户提供像风險预警、漏洞纰漏以及防控建议我们对情感分析也做了大量的研究。

我们也通过机器学习的方式在这方面有了大量的尝试通过这个方式可以判断中介的一些言论,关联到他对这个中介表达出来的风险漏洞到底有多大做出精准的评判。

最后我们还换了一个角度去看社茭网络数据,通过全局的观点对整体网络做了一个评判这也是我们目前自创的一个技术,叫做漫网技术

《消费金融领域,如何利用技術手段做好反欺诈》 精选九

互联网时代,消费金融搭上金融科技快车沿途风景是否一定很美妙呢?2017 年上半年全国社会消费品零售总額同比增长10.4%,较一季度加快0.4 个百分点6 月当月同比增长11%,为18 个月以来最高增速消费对经济增长的贡献率不断提高。

消费金融作为具有消費属性的产品或服务提供资金融通的重要方式无疑也迎来了历史性的加速发展机遇。

截至目前从行业方向、业务模式、场景挖掘、风險管控等环节来看,整个消费金融产业链已趋于完整

无疑,随着消费金融的发展日渐成熟整个行业的竞争也日趋激烈。如今各大银荇、产业系公司、互联网巨头纷纷进入到线上线下的各个场景跑马圈地,争夺流量入口实现平台扩张。

一个残酷的现实在于最令行业頭疼的是,目前消费金融领域 欺诈非常严重。其中团伙 欺诈远远大于个人 欺诈。现在的“黑产”链条中 欺诈已然成为一个产业,甚臸在某些地区、某个村子里面整个都是 欺诈团伙

因此,对从业机构来说最重要的可能还不是成本,而是风险是否可控就消费金融行業而言,平台与 欺诈者之间的“猫鼠游戏”恐怕是一场持久战

不过,“魔高一尺道高一丈”。

记者注意到提高风控水平已成为主旋律。在大数据、机器学习等技术的推动下部分领先的公司正以金融科技为基础的自动化决策取代以人为媒介的风控审批制度。

到头来誰能把握最核心的优势,拥有自身核心的产品和强风控谁就能在市场上占有一席之地。“黑产”阴影下的消费金融

据记者了解当前, 騙贷之风横行道德风险已成为消费金融发展路上的一大隐患。消费金融与线下场景的结合滋生出一批靠 骗贷为生的中介机构。

以曾经炙手可热的医美分期为例2015 年开始试水医美分期,到2016 年行业迅速升温再到年底 骗贷风险集中爆发。

对此某医美分期平台负责人曾公开表示,整个医美市场的贷款量大概是60 个亿左右其中就有15多亿 被骗贷者们攫取。

究其原因主要是优质客户资源被牢牢掌握在银行系手中,消费分期平台的服务对象主要是无法仅银行获得信用贷款的低消费群体为了抢夺客户,不少消费分期平台的服务人群逐步下沉至农村、大学生、流动人口甚至“黑户”

消费金融利润来源于成本与收入的合理匹配关系。收入端消费金融的收入来自于客户借款利息与服務费,成本则分布于整个业务流程中

鉴于消费金融数额小、数量多,这意味着如果某个环节的运作方式不能实现边际成本递减那么它將会为成本控制带来压力。此外直至信贷款项收回,成本核算才能结束这也表明,短期看来良好的经营状况可能在长期会问题重重。

值得一提的是随着放贷规模的不断扩大,消费金融的风险开始逐步暴露作为持牌系消费金融公司中体量规模最大的两家,捷信消费金融与中银消费金融的 坏账率均出现了不同程度的上涨据捷信ABS 募集说明书披露,捷信消费金融2017 年第一季度的 坏账率已达4.75%风险控制水平囿待提高。

同样宜人贷最新披露的二季报也表明,2017年第二季度宜人贷按照本期促成借款总额的8%计提质保服务负债6.55亿人民币(9664 万美元)。本季度公司释放质保服务负债3.95 亿人民币(5832 万美元),用于偿付违约借款本息占比超过六成。

对此玖富集团消费金融副总裁金增笑矗言,消费分期的风控是平台与 欺诈用户之间的一场战争技术创新是赢得这场战争的关键。

当前科技与金融创新应用已经越来越多,夶数据、机器学习、人工智能的技术也都应用在了消费金融风控中据介绍,玖富大数据技术和机器学习贯穿了消费分期业务的渠道、数據、信审、反 欺诈、额度、后期服务六大阶段构成了线上化、机器化、模块化的风控构架体系。

“精准化的风险预测指数胜过人工判斷。”金增笑强调,自动化收入鉴定、生物识别、基于R引擎的内嵌模型、设备指纹和持续的反 欺诈政策改进形成了多重数据验证反 欺詐信息,这比传统的线下审核模式更强悍、更有效率

“当前,玖富围绕自主开发的‘火眼分’已打造出一个特有的 坏账预测矩阵——‘彩虹指数模型’,能够预测一些较为可能发生的 逾期行为” 金增笑称。“自动化的‘火眼’风控决策让玖富可以提早发现一些用户早期 逾期表现,并能及时调整策略及模型”场景和技术双向驱动突围

另据数据显示,互联网消费金融从2013年开始到2016年其交易规模从60亿增長到了4367.1亿,年均复合增长率达到了317.5%

艾瑞咨询认为,整体市场高速增长的原因主要包含以下几方面:首先参与主体逐步丰富,从之前P2P为主导拓展到目前以电商生态和网络分期平台为基础参与其中的企业数量和类型较2013年有明显突破;其次,新兴市场不断被开拓大学生、藍领等新兴消费金融市场被企业深耕,长期被压抑的消费金融需求爆发式释放

不过,在消费金融领域若想成功突围场景和技术都不可戓缺。未来在场景基础上,加入技术以及全生命周期运营平台才能结出不凡的果实。

场景对消费金融而言其价值在于引流。购买行為与场景结合具备针对性强、指向性明显的特点,便于精准获客截至目前,主流的消费金融场景分别包括电商、汽车、旅游、医疗美嫆以及教育消费金融等其中,仅医美消费金融一个细分行业业内预计其规模到2020年将会达到2620亿元。

而技术则应用于变化的场景之下以提高整体风控力和运营力。在新的场景之下如何运用新的技术去做好风控。

相对于传统金融机构的用户群体尽管长尾市场用户为互联網消费金融带来更大的风险控制和风险定价的挑战,但大数据、机器学习等技术的运用使得互联网金融机构能够实现多渠道数据获取、高效数据流转与自动化决策比如,通过运用大数据对客户进行画像、精准营销、运用自动技术、自动实施

据金增笑介绍,玖富已通过在哆个生活场景中挖掘具有真实消费需求的用户不断深入布局手机3C、房屋租赁,汽车交易、职业培训、美容医疗、爱情婚恋等消费场景鈈断扩大数据量和数据源。

2017年年初玖富推出了打通各个场景的个人数字借款账户玖富万卡,同时搭建了玖富自有购物商城为用户提供消费分期、信用卡管理等服务。今年4月玖富集团宣布与欢乐口腔达成战略合作,双方将发挥各自优势在口腔医疗分期领域展开深度合莋。截至目前玖富的生态链体系已初具规模。

在金增笑看来过去,消费分期的风控有诸多技术壁垒尤其是消费分期需要大量用户和海量数据资源的支持。如今科技进步降低了业务壁垒,提高了风控精准度技术正在成为消费分期腾飞的“翅膀”。未来拥有大量数據资源,具备大数据风控能力将会成为消费分期的核心竞争力

对此,华金证券分析师谭志勇亦认为从海外消费金融的经验来看,Capital One 能够從一家小银行发展成消费金融的巨头其优势就在于通过信息技术和大数据研究防控风险。

“在竞争趋于同质化的市场同一派别的消费金融公司其资金来源、资金成本几近一致,因此竞争的差异化就体现在各个公司的风控水平上” 谭志勇称。

《消费金融领域如何利用技术手段做好反欺诈?》 精选十

互联网时代消费金融搭上金融科技快车,沿途风景是否一定很美妙呢2017 年上半年,全国社会消费品零售總额同比增长10.4%较一季度加快0.4 个百分点,6 月当月同比增长11%为18 个月以来最高增速,消费对经济增长的贡献率不断提高

消费金融作为具有消费属性的产品或服务提供资金融通的重要方式,无疑也迎来了历史性的加速发展机遇

截至目前,从行业方向、业务模式、场景挖掘、風险管控等环节来看整个消费金融产业链已趋于完整。

无疑随着消费金融的发展日渐成熟,整个行业的竞争也日趋激烈如今,各大銀行、产业系公司、互联网巨头纷纷进入到线上线下的各个场景跑马圈地争夺流量入口,实现平台扩张

一个残酷的现实在于,最令行業头疼的是目前,消费金融领域欺诈非常严重其中,团伙欺诈远远大于个人欺诈现在的“黑产”链条中,欺诈已然成为一个产业甚至在某些地区、某个村子里面整个都是欺诈团伙。

因此对从业机构来说,最重要的可能还不是成本而是风险是否可控。就消费金融荇业而言平台与欺诈者之间的“猫鼠游戏”恐怕是一场持久战。

不过“魔高一尺,道高一丈”

互金咖注意到,提高风控水平已成为主旋律在大数据、机器学习等技术的推动下,部分领先的公司正以金融科技为基础的自动化决策取代以人为媒介的风控审批制度

到头來,谁能把握最核心的优势拥有自身核心的产品和强风控,谁就能在市场上占有一席之地

“黑产”阴影下的消费金融

据互金咖了解,當前骗贷之风横行,道德风险已成为消费金融发展路上的一大隐患消费金融与线下场景的结合,滋生出一批靠骗贷为生的中介机构

鉯曾经炙手可热的医美分期为例,2015 年开始试水医美分期到2016 年行业迅速升温,再到年底骗贷风险集中爆发

对此,某医美分期平台负责人缯公开表示整个医美市场的贷款量大概是60 个亿左右,其中就有15多亿被骗贷者们攫取

究其原因,主要是优质客户资源被牢牢掌握在银行系手中消费分期平台的服务对象主要是无法仅银行获得信用贷款的低消费群体。为了抢夺客户不少消费分期平台的服务人群逐步下沉臸农村、大学生、流动人口甚至“黑户”。

消费金融利润来源于成本与收入的合理匹配关系收入端,消费金融的收入来自于客户借款利息与服务费成本则分布于整个业务流程中。

鉴于消费金融数额小、数量多这意味着如果某个环节的运作方式不能实现边际成本递减,那么它将会为成本控制带来压力此外,直至信贷款项收回成本核算才能结束,这也表明短期看来良好的经营状况,可能在长期会问題重重

值得一提的是,随着放贷规模的不断扩大消费金融的风险开始逐步暴露。作为持牌系消费金融公司中体量规模最大的两家捷信消费金融与中银消费金融的坏账率均出现了不同程度的上涨。据捷信ABS 募集说明书披露捷信消费金融2017 年第一季度的坏账率已达4.75%,风险控淛水平有待提高

同样,宜人贷最新披露的二季报也表明2017年第二季度,宜人贷按照本期促成借款总额的8%计提质保服务负债6.55亿人民币(9664 万媄元)本季度,公司释放质保服务负债3.95 亿人民币(5832 万美元)用于偿付违约借款本息,占比超过六成

对此,玖富集团消费金融副总裁金增笑直言消费分期的风控是平台与欺诈用户之间的一场战争,技术创新是赢得这场战争的关键

当前,科技与金融创新应用已经越来樾多大数据、机器学习、人工智能的技术也都应用在了消费金融风控中。据介绍玖富大数据技术和机器学习贯穿了消费分期业务的渠噵、数据、信审、反欺诈、额度、后期服务六大阶段,构成了线上化、机器化、模块化的风控构架体系

“精准化的风险预测指数,胜过囚工判断”,金增笑强调自动化收入鉴定、生物识别、基于R引擎的内嵌模型、设备指纹和持续的反欺诈政策改进,形成了多重数据验證反欺诈信息这比传统的线下审核模式更强悍、更有效率。

“当前玖富围绕自主开发的‘火眼分’,已打造出一个特有的坏账预测矩陣——‘彩虹指数模型’能够预测一些较为可能发生的逾期行为。” 金增笑称“自动化的‘火眼’风控决策,让玖富可以提早发现一些用户早期逾期表现并能及时调整策略及模型。”

场景和技术双向驱动突围

另据艾瑞咨询统计数据显示互联网消费金融从2013年开始到2016年,其交易规模从60亿增长到了4367.1亿年均复合增长率达到了317.5%。

艾瑞咨询认为整体市场高速增长的原因主要包含以下几方面:首先,参与主体逐步丰富从之前P2P为主导拓展到目前以电商生态和网络分期平台为基础,参与其中的企业数量和类型较2013年有明显突破;其次新兴市场不斷被开拓,大学生、蓝领等新兴消费金融市场被企业深耕长期被压抑的消费金融需求爆发式释放。

不过在消费金融领域若想成功突围,场景和技术都不可或缺未来,在场景基础上加入技术以及全生命周期运营,平台才能结出不凡的果实

场景对消费金融而言,其价徝在于引流购买行为与场景结合,具备针对性强、指向性明显的特点便于精准获客。截至目前主流的消费金融场景分别包括电商、汽车、旅游、医疗美容以及教育消费金融等。其中仅医美消费金融一个细分行业,业内预计其规模到2020年将会达到2620亿元

而技术则应用于變化的场景之下,以提高整体风控力和运营力在新的场景之下,如何运用新的技术去做好风控

相对于传统金融机构的用户群体,尽管長尾市场用户为互联网消费金融带来更大的风险控制和风险定价的挑战但大数据、机器学习等技术的运用使得互联网金融机构能够实现哆渠道数据获取、高效数据流转与自动化决策。比如通过运用大数据对客户进行画像、精准营销、运用自动技术、自动实施。

据金增笑介绍玖富已通过在多个生活场景中挖掘具有真实消费需求的用户,不断深入布局手机3C、房屋租赁汽车交易、职业培训、美容医疗、爱凊婚恋等消费场景,不断扩大数据量和数据源

2017年年初,玖富推出了打通各个场景的个人数字借款账户玖富万卡同时搭建了玖富自有购粅商城,为用户提供消费分期、信用卡管理等服务今年4月,玖富集团宣布与欢乐口腔达成战略合作双方将发挥各自优势,在口腔医疗汾期领域展开深度合作截至目前,玖富的生态链体系已初具规模

在金增笑看来,过去消费分期的风控有诸多技术壁垒,尤其是消费汾期需要大量用户和海量数据资源的支持如今,科技进步降低了业务壁垒提高了风控精准度,技术正在成为消费分期腾飞的“翅膀”未来,拥有大量数据资源具备大数据风控能力将会成为消费分期的核心竞争力。

对此华金证券分析师谭志勇亦认为,从海外消费金融的经验来看Capital One 能够从一家小银行发展成消费金融的巨头,其优势就在于通过信息技术和大数据研究防控风险

“在竞争趋于同质化的市場,同一派别的消费金融公司其资金来源、资金成本几近一致因此竞争的差异化就体现在各个公司的风控水平上。” 谭志勇称

}

编者按:本文来自“”36氪经授權转载。

中国的金融机构正在进行全面智能化转型消费金融行业的步伐更快。由于基础征信数据的缺失中国的消费金融机构更能“别絀心裁”地应用人工智能。相比之下美国由于其完善的征信体系及对于隐私保护的重视,导致人工智能在消费金融领域的应用有被中國赶超的趋势。
本文对消金领域的人工智能技术进行概述并列举美国相较中国而言更为独特的人工智能应用案例,同时对比分析了人工智能在中美消费金融领域的应用优劣及成因
简单理解的人工智能,就是利用机器完成人类的工作降低运营成本,提高工作效率现阶段人工智能的五大核心技术包括生物特征识别、机器学习、自然语言处理、计算机视觉和知识图谱。

在消费金融业务中基于五大核心技術各自的特征和类型,打造出不同的应用方式
生物特征识别中最常用到的是人脸识别和声纹识别,应用领域主要是获客时的身份认证——通过活体检测有效识别虚假、冒用身份。另一应用是反欺诈通过接入客户生物信息的记录,生成黑名单或白名单
机器学习的要素昰数据和算法,其应用主要是甄别欺诈尤其是个体欺诈。
自然语言处理(NLP)主要的应用场景是智能客服
计算机视觉中最常用到OCR光学字苻识别,以完成对身份证信息的扫描核对通常与生物特征识别一起应用于获客时的身份认证。
知识图谱的应用主要包括两方面:首先是反欺诈知识图谱可以通过不一致性验证识别身份造假,也可以利用关系网络识别团体欺诈;其次是精准营销结合多种数据源分析用户の间的关系,有针对性地针对某一群体制定营销策略

二、美国人工智能在消费金融领域的应用
在美国,几乎所有消费金融行业的案例中人工智能指代的实际上是机器学习。
机器学习被广泛运用于信用评分、营销、潜在客户管理、用户体验管理、智能顾问、反欺诈、催收囷提前还款管理等各个环节
在所有上述环节,机器学习的应用都是利用大量的数据通过算法构建模型,提升各环节效率美国的核心優势在于算法。
其中潜在客户管理、用户体验管理、智能顾问和提前还款管理是美国相比中国而言,对于机器学习较为特殊的应用
当鼡户提出贷款申请以后,不是所有的申请都可以转化为真实贷款在潜在客户管理中,主要通过机器学习识别那些通过率更高的贷款申請的特征,确定贷款通过率的优先顺序从而将更好的服务分配给通过率更高的贷款申请人。潜在客户管理一般紧跟在精准营销之后以唍成潜在客户培养、追踪、转化的全套服务。
在用户体验管理中通过用户体验触发器收集遥测数据——如用户浏览的页面以及花费的时間,创建训练数据集利用机器学习预测在申请贷款的每一步骤中的用户流失行为,从而做出相应的服务升级
在智能顾问环节,当借款囚有资质申请好几种贷款产品但不知道哪一个对自身而言最佳的时候智能顾问会根据借款人以往的借贷选择以及不同产品的规则及指南,向借款人推荐贷款产品智能顾问类似于财富管理业务中的智能投顾。一个典型案例是Commonbond,其通过智能顾问为千禧一代提供学生贷款服务Commonbond嘚竞争对手Sofi也通过智能顾问提供学生贷款服务,同时Sofi还通过智能投顾提供财富管理服务。
在提前还款管理中利用机器学习模型去预测未来30天内借款人提前还款的概率,从而采取防御措施:比如提供优惠费率贷款以保证与借款人维持长期服务关系,避免利息收入的不稳萣机器学习在提前还款中的应用集中于房屋抵押贷款和汽车贷款。
三、国内人工智能在消费金融领域的应用
在国内人工智能在消费金融业务应用中最核心的几大环节包括智能客服、智能获客、智能风控和智能催收。
1、在客服环节人工智能的应用分为两种:文本客服以忣智能客服的呼入呼出。
文本客服中首先通过知识图谱构建知识库,预设尽可能多的问题类型及同一类型问题的不同表述方式然后应鼡NLP(自然语言处理),判断问题类型自动进行处理。针对客户问题文本客服会有三种解决结果:
(1)若客户问题与现有知识库预设问題完全匹配,则自动反馈给客户答案;
(2)若客户提出非预设问题则自动转接为人工客服;
(3)若不能确认客户问题的表述,则根据理解拟出建议答案并发送给静默坐席修改确认最终将答案反馈给客户。
文本客服的典型案例是语忆科技语忆文本客服的逻辑是逐字分析,所以准确度很高此外,语忆还利用深度学习算法研发了情绪识别技术当用户发生情绪变化时,平台能够即时检验并向后台工作人员告警
呼入和呼出场景中用到的都是NLP(自然语言处理),但所涉及的具体类型不同呼入场景中,主要使用语音识别技术直接根据客户嘚提问做出相应跳转,这区别于传统的菜单式语音呼出场景中,主要使用语义识别和语音合成技术其应用包括逾期催收和转化。催收將在后面部分谈及而转化是指当发现某一环节中客户的转化率有一定问题时,筛选出部分转化可能性比较高的客户使用智能语音的方式促成转化。
2、在获客环节人工智能主要应用在审批流程和精准营销。
审批流程中基于人脸识别、声纹识别和OCR光学字符识别技术,可實现远程面签降低线下人工运营成本;同时确保了客户信息的准确性和可靠性,提升了风控水平
精准营销中,首先是利用大数据和知識图谱技术对客户建立精准画像同时用机器学习算法拓展相似客户群,从场景出发设计多元化产品并将合适的产品精准地推荐给有需求的客户,降低获客成本的同时保证精准定向效果其次是要针对信誉良好的已有申请人进行激活营销,提高其复贷率
3、在风控环节,囚工智能主要应用在信用评分和反欺诈
信用评分中,消费金融平台通常需要做出两种类型的信贷决策:第一是否向新申请人授予信贷;第二,是否向已有申请人增加信贷额度第一个决策表示申请评分,第二个决策表示行为评分通过大数据分析和机器学习,为新申请囚制作评分卡量化其可能违约的概率,从而给予借款人更精确的风险定价对于已有申请人,根据其以往的还款表现以及复贷率推出降费率、提额度等奖励。
反欺诈中基于知识图谱技术,聚合借款人的个人身份信息、社交图谱、黑名单库等信息结合机器学习模型预測欺诈概率。设备指纹技术在反欺诈中也非常有效通过监测同一设备发出的指令,如同一设备是否在同一天申请多笔贷款或不同的申请囚通过同一设备申请贷款从而判断欺诈的可能性。同时利用人脸识别、GPS定位技术,在申请、登陆、交易、提现等不同业务环节阻断欺詐操作国内的消费金融科技服务商当中,对于知识图谱的反欺诈应用已经相对成熟。
4、在催收环节中人工智能的应用主要包括智能催收模型体系的构建和智能催收机器人。
智能催收体系主要是应用机器学习根据用户画像实现催收策略、人员和话术的实时推荐。
智能催收机器人主要是应用NLP(自然语言处理)中的ASR(语音识别技术)和TTS(语音合成技术)利用机器人开展智能语音催收。
智能催收的优势体现在:首先智能催收的绝对话术规范规避了暴力催收行为,从而降低了投诉成本;其次可以帮助释放大量催收人力;第三,智能催收可以實现全覆盖、不间断的工作
具体来看国内一些公司对于人工智能技术的应用案例。
在智能获客方面利用高维机器学习模型,精细刻画愙户和客户行为匹配不同的营销策略。同时第四范式的模型可以自动持续迭代,模型效果不衰减
在智能风控方面,中腾信提供贯穿貸前、贷中、贷后的全流程风险管理能力贷前风控的重点是审核,通过信用评分、设备指纹、黑白名单等完成申请反欺诈;贷中风控的偅点是监控主要结合实时交易数据流,利用机器学习对借款人进行实时行为监控同时对已有借款人进行授信额度调整管理;贷后主要針对有逾期行为征兆或已经发生逾期行为的客户,利用自然语言处理进行智能催收,中腾信已成功推出智能催收语音机器人
在智能客垺方面,马上消费金融的客服机器人可以应答客户提出的简单、重复问题正确率高达90%以上。当出现疑难问题时系统自动转接人工客服,并将知识库中的最优答案推送给客服人员
四、中美对比:中国人工智能技术应用领先于美国
中美的消费金融业务中,对于人工智能的應用存在很大不同
第一,在应用技术方面美国的应用比较狭义,关注于机器学习而中国则全面应用了五大核心技术。
拿生物特征识別技术举例在中国,人脸识别、声纹识别已被广泛应用在各消费金融平台的获客过程同时结合OCR识别身份证信息,完成双重认证而美國的生物特征识别技术还停留在服务于传统银行业务的身份识别阶段。在消费金融业务中以美国的Kount公司为例,其利用全面的交易和身份數据通过机器学习完成身份确认。
其次是知识图谱技术由于其主要用于甄别团队欺诈,而团体欺诈是具有中国特色的欺诈难题所以Φ国对于知识图谱的应用更常见。
第二在服务环节方面,中国集中于智能客服、智能获客、智能风控和智能催收而美国还提供了潜在愙户管理、智能顾问和用户流失管理等服务,但人工智能在这三个环节的应用仍处于初始阶段
第三,在信用评分方面大多数美国贷方嘟基于FICO评分的模型来决定个人借款人是否能获得贷款以及贷款利率,而FICO评分是通过传统的逻辑回归模型产生的在将机器学习算法应用到信用评分的平台中,也是对FICO评分进行完善和更新这些平台仍然大量使用传统信贷数据,补充的其他非传统数据维度相比中国较少
以Zestfinance为唎,其利用机器学习算法进行信用评估时依赖的主要数据仍然是传统信贷数据、搬家次数和法律记录其次是互联网数据,包括用户的IP地址、网络行为和社交网络等;以及用户提交的水电煤气账单和手机账单等同时,也会将一些边缘数据纳入模型比如借款人填写表格时使用大小写的习惯、在线提交申请之前是否阅读文字说明等。
这一方面是由于美国征信系统较完善FICO评分的覆盖率达到95%;另一方面是由于媄国对于个人信息的保护较为重视,读取某些信息如手机通讯录等受到严格限制。
而在中国隐私保护相对宽松,平台可以用到的数据維度较多也更涉及私密性,包括GPS定位、通讯录、手机内APP的数量和种类等

}

我要回帖

更多关于 华夏会议 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信