假设你是银行,要判断是否发放信贷资金给某个借款人,你需要哪些数据辅助判断? 在传统的决策机制中,最重要的几个数据维度无非信贷历史、个人资产、个人收入,抵押担保等几个方面。这些维度最直接地反映了借款人的还款能力和还款意愿。根据这些维度,商业银行将不良贷款率长期维持在2%左右。 但这种决策方式也有其局限: 其一,集中以几个核心维度决策,有时会因为规则引擎里面某些规则过强而拒绝掉很多优质客户;其二,过度强调贷前审查,而对放款之后借款人的动态情况无法实时监控,风险预警不够有效;其三,要获取这些数据依赖于银行网点客户经理的调查,成本高不说,很容易出现人为的风险。 这就是为什么各个互联网信贷机构潜心研究并大肆宣传自己的大数据风控技术。那么,到底大数据风控能做些什么呢? 数据种类和处理方式的变化 和文章开头提到的几个传统的数据维度不同,随着互联网深入人们的生活,我们在网络上留下的轨迹也越来越多:购物、打车、租房、职业,学历,社保——这些数据才是大数据风控所要搜集的信息。这些信息虽然无法直接反应一个人的信贷属性,但无疑能够间接反映这是一个怎样的人。这些数据经过处理和分析,就能够对金融机构的贷款决策起到很好的辅助作用。而且,这些信息并不像传统的做法,需要客户自己亲自搜集后提供给金融机构,而是通过客户授权,金融机构可以获得客户在互联网的轨迹。从客户的角度看,似乎是只提供了姓名和身份证,大大提高了客户申请贷款的便捷性。 数据种类不同,处理数据的方式也相应有所变化。举个栗子。芝麻信用团队应用了一种改进的树模型GBDT(Gradient Boosting Decision Tree),通过这个模型深入挖掘特征之间的关联性,衍生出具备较强信用预测能力的组合特征。比如,张小小经常在网上购买母婴类用品,反映出一定的生活稳定性和家庭责任感,加1分。同时,如果张小小还每个月通过支付宝参加公益捐款,两个条件一组合,更能确认张小小是个“好人”,就可以再加2分。当然,实际上这些模型的具体运算和规则是价值上亿的商业机密,只有很少一部分人才知道。但我们能够确认的是,有信贷价值的数据维度越来越多,也越来越有价值了。 从“因果关系”到“相关关系” 大数据的“大”除了体现现代科技对海量数据的储存处理能力之外,最重要的,还是在思维方式和工作方法角度为信贷风险管理注入了新血液。 以往,我们会通过日常观察做出决策判断的假设,再去验证这个假设是否是正确的。比如人们从事的职业是否和逾期率有因果关系。这些假设往往是基于历史的数据,推测未来可能发生的预期(就这个逻辑而言,深究其实也有问题,这里不细说)。 大数据则提供了新的思维方式。我们理解世界不再建立在假设的基础上,而是从海量数据的本身出发,看看数据本身能够给出什么样的结论。这个结论可能是可笑的——也许经常买啤酒的人将更有可能逾期,也许做保姆的人一般都不会贷款。而我们是无法从正常逻辑推断出这些因果关系的。我们只知道他们有关而已。但无疑这种分析方法范围更广,不容易受偏见的影响,而且往往能给人意向不到的准确率。 从重视“因果关系”到“相关关系”的转变,从关注“已知关联”到“未知关联”的转变,是大数据风控和传统风控最主要的区别。 大数据风控应用场景 如果足够幸运,我们将会见证大数据从以下几个方面对信贷风险管理的改变: 1、反欺诈领域 如果一个身份证号和一个名字还不足以让我认识你,那么你的设备号,IP地址,所在地,社交账号和电商购买信息应该足以让我了解你是不是真正的你想要借款,还是只是是你的身份证丢了被人盗用信息。 2、信贷准入审批及征信评分 房子、车子、工作和工资能够说明一个人的还款能力,但也赶走了很多资质差一些但也会准时还款的客户。加入更多维度的自动信贷审批将会帮助挖掘这部分客户的潜力。正如有句话所说,“All data is credit data'。Zest Finance就是此类公司的典型:十个模型,上千个变量,70000个信号源,250毫秒出结果。有机会再继续写写这个很牛很酷的公司。 3、风险定价: 根据贷款申请人的互联网数据进行评分,分数更高的申请人将能够申请更低利率或更高金额。风险管理不是把可能逾期的人拦在门外,而是即使把可能逾期的人放进来,却能获得更高的盈利。 4、贷中及贷后的动态监测 这是大数据风控相对于传统风控的优势之一。对于传统风控模式下的贷中、贷后管理来说,对一笔贷款的追踪和监测需要耗费很多人力,查看固定资产状况,亲自和贷款人定期沟通看是否有异常情况等等。但大数据的使用可以减少部分的成本,而且更有时效性。如比对贷款申请人的IP地址有无异常,通过互联网交易数据监测贷款人的公司/店铺是不是正常经营等,并且对不同类型的客户使用不同的催收策略。 5、简化贷款审批程序 只需填写姓名、身份证号以及手机,就能够在15分钟内得到周转现金——已经不止一家互联网信贷公司能够提供这样的产品。申请材料的简化并不意味着金融机构不再需要更多信息,而是这些信息不再从申请人本人处获取。在数据维度和处理速度方面,大数据风控完胜人工审批。这不仅能够减少贷款审批的人力投入,还与互联网产品追求用户体验的价值观不谋而合,做到“零感知审批”。 既然关于大数据风控的研究如火如荼,是不是意味着互联网信贷平台很快就会有大数据风控的能力了呢?未必。一方面,数据质量参差不齐,准确性、时效性难以保证,是否能够获取足够有效的样本作为建立模型的基础还很难说。另一方面,数据分布在各家公司和渠道,互相之间因为竞争关系或保密原因无法共享数据,形成一个个数据孤岛,很难发挥大数据的价值。至于如何对涉及个人隐私的数据的保护和使用,又是另外一个谜の问题。最后的最后,大数据风控从无到有,还需要很长时间的积累和发展,虽然现在每个平台都声称自己有这方面能力,但实际上谁也离不开人工的审批和调查。目前通过大数据分析得出来的结果,只能作为一个辅助判断手段。 这也就是为什么,在我查阅有关大数据风控的文章的时候,发现很多内容很虚,自顾自描述着未来美好的蓝图,却没有介绍具体的方法论。到后来却也理解了,风控这东西就只能是这样,像一个黑匣子,我只能告诉你我有一个很厉害的黑匣子,但具体匣子里面有什么,是不能说的—— 'Big data is like teenage sex:everyone talks about it,nobody really knows how to do it,everyone thinks everyone else is doing it,so everyone claims they are doing it…” 本文系融360专栏作者“雪小梨(微信号:373794849)”原创作品,仅代表作者个人观点,不代表融360官方立场。 想获取更多理财技能,请微信搜索关注“融360财秘”(rong360licai),关注后回复【P2P】可获取【P2P投资攻略】 |
|