您的当前位置:首页正文

大数据在征信领域应用的国际经验及启示

来源:帮我找美食网
金融实务2018.01大数据在征信领域应用的国际经验及启示

戴 洋 季琳琳

摘要:近年来,采用大数据评估个人信用状况这一新手段逐渐进入公众视野,通过大数据评估个人信用如何开展、哪些信息能反映信用水平、评估中个人信息如何有效保护等问题广受公众关注。本文介绍了当前大数据在征信领域运用的基本情况,归纳总结了国外最新的做法和有益经验,对大数据在征信领域的应用提出了相应建议。

关键词:大数据 传统征信 信用评估

F832.1 文献标识码:A 文章编号:1009 - 1246(2018)01 - 0082 - 07中图分类号:

一、大数据在征信领域应用的国外实践大数据应用到传统征信领域是指:采集、整理、分析和挖掘海量、多样化且有价值的实时数据,依靠大数据技术重新设计征信评价模型算法,多角度反映信用主体的征信情况。其原理是通过建立征信评估数据模型,全方位搜集整理信用主体的行为习惯数据,通过征信模型测算出征信主体的信用特征,以此得出信用评估结果。与传统征信相比,其特点在于突出大数据技术在征信活动中的应用,并成为传统征信体系的有益补充(见表1)。

大数据技术运用到征信领域,主要是将该技术与传统征信的三个基本环节相结合:一是采集和存储大量的信用相关数据环节,二是深入挖掘和加工征信数据环节,三是为客户提供个性化的征信服务环节。大数据应用过程并非是对传统征信的颠覆,而是在上述三82

个阶段实现革命性改变,使各类非金融信息数据得以有效利用,从而拓宽传统征信外延,形成更加全面、精准的信用评价。

大数据技术已经在欧美等发达国家征信市场中得到广泛的应用,其中,传统的征信机构对于大数据征信的态度比较谨慎,主要以研发为主,推进步伐较缓。而新兴的征信公司应用大数据技术的进展比较快,甚至直接利用大数据技术替代传统征信技术,在此基础上进行信用风险评估(见表2)。

一是传统征信机构引入大数据技术丰富信用评价手段。全球最大的个人征信机构Experian(益博睿)通过自主研发的跨渠道身份识别引擎,将征信主体不同渠道的消费行为进行关联,以此评估个人客户征信情况。此外,该机构多年之前就开始就社交关系等互联网大数据对征信的影响开展研究;美国征信机构

2018.01金融实务表1 传统征信与大数据应用的比较情况

比较项征信理念信息来源信息形式信息量

传统征信

通过对信息主体的历史数据进行因果逻辑分析来评估征信状况

信息来源渠道较狭窄,主要是信用交易数据和公共信息

由于非结构化数据较少且难以处理,主要存储结构化数据

数据规模相对较小,数据积累较慢

大数据在征信领域的应用

通过对信息主体的社交数据、互联网行为数据等数据类型的分析,挖掘信息主体历史行为与信用之间的相关性,以此评估征信状况信息来源渠道更广,在传统信息的基础上,增加了互联网信息除结构化数据以外,还包括半结构化、非结构化数据,由于大数据技术的介入,这类数据能够快速进行处理数据规模较大,数据积累很快

通过云技术和大数据技术的快速发展,在提高运输效率的同时,大幅降低了对设备的要求

对设备的当数据运算量增大时,则会对处理设备提出要求

更高要求,相应的也会提高成本

表2 国外大数据在征信领域应用的最新情况

国家

公司名称

数据来源

技术手段

应用方向

主要应用于信用贷款审批,未来还将拓展到汽车金融、医疗服务、学生贷款等

主要特点

为传统征信评估无法覆盖的人群提供服务

ZestFinanc

历史信贷数据、网络及机器学习预测模社交数据、非传统数据型和集成学习法

构建数据评估模型

应用于风险管理、身份验证、通过收购高科技公司来组建欺诈检测、决策分析和市场营自有的创新团队,以加快产销等领域

为金融机构、非金融企业的市场营销提供决策分析产品

品的研发和布局

信用报告直接向消费者报告

Equifax

美国

TransUnion

信贷数据、公共记录

传统信用数据、替代信基础大数据技用数据、消费者公共记术、增强的大数录、专有数据库电商平台交易数据、物

Kabbage

流公司配送数据、社交动态大数据评估网络行为数据

Experian

信用账户信息

据匹配连接能力

确定电商卖家的经营状况,向以互联网数据为主,推行动符合资格的商家提供信用贷款态信用评分

跨渠道身份识别应用于管理信贷风险、防止欺整合公开信息,作为独立的引擎连接客户消诈行为、确定营销目标、实现第三方机构提供有关信用信费接触点

Bigdatascoring网络行为数据

技术

自动化决策质量和撮合率

信用评分的客户提供服务信息量与预测精确度以及客户的信用额度呈现正相关态势

利用非传统信用数据进行信用评估

依靠会员数量优势以及企业

乐天银行信用卡额度审批

本身特点,为自身业务发展提供数据

云计算和大数据通过大数据为出借人提升贷款为传统信用评分低或不存在

英国

德国Kreditech公开信息、社交信息社交媒体和智能手机记录等非传统数据自身会员数据库

大数据技术、人利用大数据分析客户信用度、工智能算法机器学习算法企业内部对客户数据分析和收集

确定是否发放小额短期贷款用于信用贷款审批

新加坡Lenddo

日本乐天

83

金融实务2018.01Equifax(艾克飞)通过收购高科技公司组建自己的创新团队,以加快产品的研发和布局;TransUnion(环联)通过收购数据提供商以及与多家机构合作,形成专有数据库,连接多种信息,更好地进行数据挖掘、风险评估;征信数据挖掘公司FICO(费埃哲)在传统征信数据的基础上,整合客户的网络消费、社交媒体及手机使用数据,建立全面的信用评估模型,在保持较低拒贷率的同时,强化了信用风险防范。

二是金融科技企业直接提供大数据征信服务。美国ZestFinanc公司采集了大量与消费者信用弱相关的数据变量,为缺乏传统征信数据而只能接受高利贷的人群进行信用评估服务。利用基于机器学习的分析模型,评估效率提高了近90%,相关贷款人的违约率降低了将近50%;美国Kabbage公司运用商业规模、从业时间、交易量、社交媒体活跃程度等多元化数据,重构信用评估体系,向小型网商提供信用贷款、风控技术支持等服务。

二、国外大数据在征信领域应用的主要经验

目前,Experian、Equifax、ZestFinance等知名征信公司都在积极尝试选取新的变量,开发新的评分体系,不断提高大数据在征信领域的运用水平。在数据采集、筛选、应用、保护等各个方面,国外均形成了较为规范和专业的做法。

(一)数据采集方面:除了传统征信体系的决策变量外,导入了大量的非传统数据

从发达国家征信实践看,除传统的金融信贷信息外,大数据征信体系采用了大量的84

非传统信用数据,如社交媒体数据、消费及财务数据、日常活动数据、特定行为数据等。多维度的征信大数据使征信公司不完全依赖于传统数据,从而多角度、多维度地对征信个体的信用状况进行深入量化评估。美国TransUnion公司的大数据资产由四部分组成,分别是传统信用数据(如身份信息、金融数据、信用数据等)、替代信用数据(可代替用于消费者信用描述和信用评估的数据,如租赁支付、公共设施支付信息等)、消费者公共记录驶、犯罪等信息)和专有数据库(与其他机构合作生成的诸如医疗资格信息、商业数据、房租交付等信息),公司定期对征信数据库进行更新、复核。美国ZestFinance公司的数据来源十分丰富,既包含信贷消费等数据,也涵盖房租缴纳记录、典当记录、网络行为数据、搬家次数等非传统数据,甚至创造性地将借款人书写习惯等信息作为信用评价的考量因素。

(二)数据筛选方面:首选和信用风险强相关的大数据

对于各类非金融信贷信息,国外征信机构并非全部采用,而是首先收集采用和信用强相关的大数据(如通讯预付费、房租缴费、公共事业缴费等支付数据),且在运用的过程中逐步深入,显得较为谨慎。如Experian公司于2011年开始将房租数据纳入个人征信产品和服务中,使得个人信用评分平均提升了9%,之后才于2014年开始逐渐广泛使用。TransUnion公司通过对大数据进行整合,只采纳了消费者搬家频率、账单日数据、账户历史(如账户状态或是否超过限额)等数据,

(从法庭、政府等公共机构获取的诸如违规驾从而使美国超过90%的成年贷款人获得信用评分。ZestFinance公司着重运用与消费者信用风险相关性较强的大数据,对于社交媒体数据等相关性较弱的复杂大数据则使用较少。LendingClub早期借助Facebook平台进入信贷市场,初衷是希望利用社交网络的数据进行信贷审批,但实际运用效果并不理想,最后又回归传统的信贷手段。

(三)数据处理技术方面:构建新的信用风险评估体系

目前,各国进行大数据挖掘主要基于机器学习技术的预测模型和集成学习策略。第一步,输入借贷者的原始数据以及大量第三方数据(如话费账单、租赁记录等);第二步,发现数据间的关联性,并以此为依据对数据进行转换;第三步,在关联性的基础上将变量重新整合成较大的测量指标,每一类变量反映借款人的某一方面特点,如不同期限的信用风险和偿还能力、诈骗概率等,然后将这些较大的变量输入到不同的数据分析模型中去;第四步,将每一个模型输出的结论按照模型投票的原则,形成最终的信用分数。比如ZestFinance公司目前采用10种分析模型,这些分析模型均基于机器学习技术。通过这些模型,ZestFinance可以在5秒钟内,对每位征信对象的1万多条数据进行分析,同时得出7万多个测量指标。德国Kreditech、美国Kabbage等征信公司均在采用此类基于大数据的信用风险评估框架。

(四)应用场景方面:征信产品更加丰富、多元,提供更加个性化、客户体验更好的征信信息服务

2018.01金融实务大数据使国外征信公司的服务范围由传统的金融服务业转向保险、汽车、医疗护理、电信、零售、出租审查、消费和法律执行等领域,帮助客户做出关于信用和风险管理方面的决策。如Experian公司于2012年在英国作出的创新,将客户的房租支付情况包含在信用报告中,使得租客凭借良好的房租支付记录,享受到更低廉的租房服务。TransUnion(环联)提供的面向金融机构的征信产品Credit-Vision,基于30个月的时间序列数据,向金融机构客户呈现个人消费者的风险,随时间变化的速度和程度;面向保险公司的征信产品Driver-Risk,整合了三年以上的司机驾驶违规记录,用以衡量司机违规可能性,降低保险公司成本。除此之外,还推出了面向商业机构的市场营销产品Ad-Surety、决策分析产品Decision-Edge等。

(五)数据提供和使用方面:注重保护消费者合法权益

在保护信用信息主体权益方面,相关国家的法律法规要求非常严格。美国《公平信用报告法》允许个人征信机构向商业促销者出售消费者的信用报告,但同时赋予消费者“选择退出”的权利,即消费者可明确通知个人征信机构删除促销名单上的本人信息。美国《个人隐私法》规定,如果没有得到消费者的正式书面同意,禁止泄露消费者的信用信息。德国情形下,公共机构才可向私营主体传输个人数据:一是履行传输机构的职责和满足《联邦数据保护法》第十四条规定的需要;二是有充分的证据证明接收数据的第三方具有合法权利,

85

《联邦数据保护法》规定,只有在法定的两种金融实务2018.01且不会对数据主体的合法利益造成影响。因此,在实际操作中,为了保证信息的透明,各征信公司在利用大数据进行信用评分时,还会同时将信用报告免费提供给消费者本人。消费者可以对信用报告中的内容进行检查和纠错,征信公司针对提出的问题进行处理和更正。

三、我国大数据在征信领域的应用情况及存在的问题

(一)我国大数据融入征信领域的情况近年来,大数据征信的出现,不仅将用以信用评估的数据拓宽至非金融领域,而且征信产品和服务的种类得到很大丰富。国内目前从事相关业务主要是芝麻信用、腾讯征信、考拉征信等大型互联网公司,以及一些积极探索转型的传统征信机构(见表3)。

一是深入挖掘信用主体非金融数据的信用价值。通过收集信用主体的网络数据(如社交媒体行为信息、网络消费信息等)、公共数据等,分析消费者的收支状况、社交关系、企业生产经营状况等信息,对传统的信用记录进行补充,使得缺少传统信用数据的人群能够获得信用服务。如腾讯征信的数据,部分来源于QQ、微信的社交数据以及其支付工具财付通的交易数据;鹏元征信则几乎覆盖了深圳地区所有小贷公司的数据。

二是推出信用报告、信用认证等多种征信产品。如前海征信自助研发推出的涵盖贷款业务全流程的征信产品;上海资信有限公司于2013年推出的网络金融征信系统(NFCS),收集整理P2P平台借贷双方客户的基本信息、贷款申请信息、贷款还款信息和特殊交易信息,向加入该系统的P2P平台提供信息咨询86

服务,有效帮助P2P平台了解授信对象的真实资信情况,在防范恶意欺诈和借款人过度负债等方面起到很好的效果。

三是搭建信用金融和信用生活场景。如芝麻信用评分从身份特质、履约能力、行为偏好、信用历史和人脉关系五大维度,结合大规模机器学习等算法,量化评估个人信用状况,主要解决信贷、租赁、交易等场景中用户的违约风险识别问题;腾讯信用金融服务涵盖了现金借贷、消费分期、先用后付、申请信用卡等领域,同时还应用于免押骑行、免押租房等业务模式中。

四是提供系统化反欺诈服务。如芝麻信用推出的反欺诈服务,基于对已发生的欺诈案件的分析研究,提供科学的欺诈风险评分和欺诈信息验证服务,为加入服务网络的商户提供基于协同防御的反欺诈服务,降低风险损失。

(二)存在的主要问题

一是信息敏感度未存在明确规定。一方面,个人社交网络数据(微信朋友圈、微博信息)、电商交易数据、通话记录等信息是否属于敏感信息目前没有明确规定,可能会遭到过度采集。另一方面,网络爬虫抓取等技术的广泛运用,使得征信公司在信息主体不知情的情况下即可完成信息采集,而不需履行告知义务,没有获得信息主体的合法授权。

二是征信主体信息数据面临被泄露、篡改的可能。个人征信机构拥有大量敏感的消费者信息,包括个人身份信息、金融信息、财务信息和受保护医疗信息等。个人征信机构收集、存储和传送的消费者信息数据,虽然通常可在专用网络中进行安全传输,但个人征

2018.01金融实务表3 我国个人征信业务试点机构运用大数据的基本情况

公司

侧重领域通用信用分

数据来源“阿里系”电商、“阿

芝麻信用

生活场景芝麻信用分里系”参股企业、

支付宝财付通数据以及社

交数据“平安系”内部的

前海征信

信贷审批

好信度

数据、50多家合作50家信贷机构,如宜信、金融机构和普金融公司、“平安系”移动APP

鹏元征信

信贷审批

鹏元800

深圳和广州的深入金融征信数据

融科贷等P2P网贷平台

机构客户

搜易贷等

通客户

合作机构

客户群

优势

30余家行业龙头、融360金融机构和普依托阿里电商系的交易

等P2P平台微众银行、建设银行、光大银行、众安保险、浦发

银行、招联金融等

通用户

数据闭环

腾讯征信生活场景腾讯信用分

金融机构和普通客户

社交关系有极大的优势

银行+保险的模式获取了大量金融服务的客户

数据

几乎覆盖了深圳地区所有的小贷公司数据

中诚信征信信贷审批万象分百余家中小银行8家联盟银行的数据

共享第三方支付拉卡拉数据、40余万家线

下便利店

“信用联盟”的70余家机构以及百家中小银行

主要是机构客大量的企业和企业主信户,个人仅提息,与运营商数据有深供查询服务P2P平台和小微企业个人客户

入合作几十万诈骗者黑名单大量真实线下交易及其

他交易数据有大型企业资源,可获

取独占数据

中智诚征信反欺诈平台—

拉卡拉信用生活场景考拉评分超市、酒店和租车行业

华道征信反欺诈平台猪猪分——租房者和房东

信机构仍无法保证服务器和数据库不受影响或破坏,未经授权的人员试图进入系统获取、篡改数据的事件可能会发生。

三是信用评价模型的有效性仍有待检验。一方面,互联网上的数据大多不完整,数据的准确性和权威性也较难得到验证;另一方面,算法模型的有效性仍待检验。如社交媒体数据与信用状况的相关性、对非活跃客户是否存在歧视等,都应考虑纳入信用评价模型中。

四是独立性难以保证。目前,将大数据运用到征信领域的大都是互联网企业,这些企业掌握了大量用户数据,既生产数据,又评估

数据,还使用数据,不是“独立第三方”,推出的征信产品在公正性和独立性方面得不到有效保证。以某征信机构为例,评价模型中关联企业提供的数据占到30—40%,在关联企业购物、购买理财产品等可以提高信用评分,对不常使用关联企业产品的消费者而言有失公允。

四、相关启示及建议

(一)加快完善征信管理领域的法律法规一方面,根据征信行业发展的新情况,修订完善现有征信管理领域的法律法规,出台适应大数据征信发展的实施细则。另一方面,

87

金融实务2018.01制定出台专门的《个人信息保护法》,规范大数据征信中个人信用信息的采集范围、使用授权、披露要求、信息主体的权利和义务等,避免个人信息遭到过度采集和违规使用,防止信用信息被滥用或泄密,损害个人隐私。

(二)加快构建适应大数据征信发展模式的监管体系

一是加强对个人征信服务商的监督管理,定期调查和评估信用产品的准确性和完整性,并予以纠正处置。严格监督消费者个人信息的采集、使用行为。二是多部门联合对数据采集使用、个人隐私安全、网络安全风险、消费者权益保护等各方面开展联合监管,加强相互间的沟通协调,形成有效的监管合力。三是发挥信用行业协会的组织和自律作用,强化日常经营行为的约束,形成良好的行业发展氛围。

(三)推进征信标准化建设,促进跨领域信息共享

一是建立完整的征信技术规范标准,为信用信息共享提供统一技术参考,为跨行业、跨部门、跨区域采集信息扫除技术性障碍。二是严格落实《政府信息公开条例》,为获取政府公开信息提供必要条件,并在保护信息安全和信息主体合法权益的前提下,通过商业合作的形式推进公共部门信息采集。三是支持大数据征信平台与金融信用信息基础数据库建设,通过映射关联方式共享信息。

(四)提高数据采集质量,升级完善大数据技术

一是不断更新和优化数据清洗、交叉验证等技术手段,更好地识别用户身份,解决客户信息不完整、不准确等问题,确保数据的真实性、完整性和有效性。二是不断完善和更新信用评估模型,持续大力发展云存储系统、数据挖掘技术、机器学习等相关技术,提高评估模型的准确性和有效性。

参考文献:

[ 1 ]王秋香. 大数据征信的发展、创新及监管[ J ]. 国际金融, 2015,(9).[ 2 ]李辰. 我国大数据征信发展的现状、困境和经验借鉴[ J ]. 征信, 2016,(9).[ 3 ]林平. 大数据背景下加快我国征信市场发展的思考[ J ]. 南方金融, 2014,(11).

[ 4 ]刘新海,丁伟. 大数据征信运用及启示——以美国互联网金融公司ZestFinance为例[ J ]. 清华金融评论, 2014,(10).

[ 5 ]任姝雯. 发挥大数据在互联网金融发展中的核心作用[ J ]. 北京金融评论, 2016,(1).

作者简介:

戴洋,男,供职于中国人民银行南通市中心支行;季琳琳,女,供职于中国人民银行通州支行。

(责任编辑:彭恒文 校对:ZQL)

88

因篇幅问题不能全部显示,请点此查看更多更全内容

Top