征信是现代金融的基础设施。现代征信借助“数据互联”、“信息共享”,更能及时有效地降低风险信息不对称,提升风险定价准确性以及信贷监测和风险预警能力。而进入互联网时代,融入信息科技与大数据技术的现代征信对信息主体的认知会比传统征信更加靠谱吗?
什么是大数据? “大数据(Big Data)”这个概念是由谁最早提出的,众说纷纭。而大数据的特点,总结来说就是5V:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实)*。大数据时代,每个人都是数据源,每个人也是数据的接收者。截止到2012年,全球产生的数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。麦肯锡指出,数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。毫无疑问的是,大数据时代已经到来。 图片来源:http://iot.10086.cn/2014-07-22/1396596571307.html
大数据目前得到广泛的运用。在应用于零售业(打折促销、库存管理...)、制造业(优化供应链、预测需求......)、政府(犯罪管理、城市规划.....)等,都已经发展出越来越成熟的商业模式,而结合心理、数学、分析、经济、政治、货币等学科领域的金融行业,在商品定价、利润分析、信用评级等应用上,也逐渐将大数据技术引入分析甚至决策环节。
随着2015年初,中国人民银行印发《关于做好个人征信业务准备工作的通知》,我国个人征信行业在市场化的政策驱动下进入蓬勃发展期。“大数据征信”这一概念逐渐成为各个互联网跨界巨头、P2P机构、征信公司做基于征信的产品的标签和噱头。(eg:宜信商贷通,京东金融小白卡......)
早在互联网金融行业的腾飞之初,风控关乎中国的互联网金融的生死存亡,而科学严谨的征信体系则是风控的核心。《现代征信学》将征信的本质列为4大原则,下面,将结合大数据技术逐一分析其与征信是否能相辅相成,比翼双飞。
第一,真实性原则,要求征信过程中采集的信用信息准确、真实、可靠。只有正确反映被征信人的信用状况,才能公平公正的对被征信人的信用等级给出评价。而人为设计的大数据采集或分析技术,很难做到百分百的客观。比如,电商平台的交易消费行为,即便是经过身份验证,也很难保证每一笔交易都是本人意愿和亲自操作,可能是家人,可能是亲近的朋友。运营商数据方面,手机中的敏感网站浏览记录或标记诈骗的通讯记录,也许是穿插广告的手滑点开,或是误接的联系。还有被热议的从网络平台上采集的社交行为数据,并不能完全还原在实际生活中的社交状态,社交信用与金融信用有距离。大数据的价值特性体现在价值总量高、单位价值低两大维度^,因此,如何在海量大数据中区分垃圾失实信息和价值真实信息,需要技术积累和算法更新。
第二,完整性原则,即采集的数据完整、共享程度高,那么对信息主体的判断越准确。整体来看,互联网、云计算等信息行业的不断技术革新,使得大数据技术对传统征信方式的数据来源和处理方式的得到很好的补充。可是,由于中国征信市场处在各机构跑马圈地的阶段,数据资产作为核心竞争力,暂时很难做到市场共享。例如P2P机构与银行在一些业务模式上存在竞争关系,因此银行很难讲贷款记录、工资流水等核心数据拿出来,与此同时,出于个人隐私和安全因素,拥有社保、公积金数据的政府部门,也不会轻易把这些征信核心数据开放。因此,不同于美国成熟征信市场中,各征信机构和P2P巨头相对透明的数据共享机制,国内在征信数据采集的完整度和共享机制上还有待发展。
图片来源:http://www./2015/0104/9730.shtml
第三,及时性原则,以确保采集的信息能反映信息主体最新的信用状况。大数据技术很好的弥补了传统征信方式中人为采集或实地采集后难以做到实时更新的尴尬和较高的成本。数据传输快、时效性强的大数据特性为征信采集、处理过程装上油门。
第四,安全性原则,强调保护信息主体的信息安全,是信息主体和监管部门的重中之重,是大数据机构和金融机构的从业道德底线。大数据技术改变传统的存储模式,通过服务器、网络等技术,替代传统本地数据库,已存储整合海量信息数据。然而,这使得敏感的隐私数据依赖在“云”端中,大规模的严重信息泄露事件时有发生。必须具备最先进的信息技术,重视征信从业人员的职业道德培养,大数据技术才能更好的为征信体系保驾护航。 图片来源:http://www./lcjtww/445068/445237/2197928/index.html
因此,在当前市场状况下,大数据技术与征信体系还在不断磨合中,大数据征信概念目前的噱头成分强过实际意义。
征信本质讲求准,人为设定的数据模型和机器学习,都带有一定主观意识,需要在市场的不断检验中进步。从业有一定年限的金融企业和征信机构,可以用其拥有历史沉淀的数据作为样本进行数据分析模型的检验,而新杀入的互联网金融企业在数据来源上不占优势。此外,各方利益存在冲突,撬动掌握核心征信数据资源的各种社会机构,达到社会大数据资源共享,在短时间内并不现实。
然而,不可否认,大数据技术在数据来源、存储处理和行业拓宽方面都起着传统模式不可替代的优势,大数据征信的发展是不可逆转的。从拥有成熟征信体系的美国征信行业发展中可以看出,没能及时准确抓住互联网、信息技术大趋势的企业,很快会被市场淘汰,活跃着的,不乏乘着大数据趋势顺风车冲入大众眼帘的机构(zestfinance),更有前瞻的发展大数据征信技术而壮大变强的互联网金融企业(lendingclub)。
市场不规范,业务体系不健全,是国内大数据征信趋势的整体阻碍。央行即将下发第一批个人征信业务牌照,结合着互联网金融行业的逐渐规范,征信行业前所未有的活跃,谁家大数据采集分析模型能越早通过市场的检验,谁家的大数据来源能探索更多的业务场景,谁家就能更快占领市场,最快度过大数据技术与征信的磨合期。
*/^摘自《现代征信学》P30-31; |
|