查看原文
其他

【大数据专栏】P2P大数据的争议与悖论

2014-09-18 科技杂谈
科技杂谈keji_zatan

新谈友,请点击题目下蓝字关注我

中国通信行业影响力最大的自媒体


本文来源新浪网


  作为互联网金融的一种模式,P2P行业如何发展一直是舆论的焦点。其中最被大家推崇的一种观点是P2P的发展必须结合大数据,无论监管、媒体、还是我们从业者,都达成了共识,许多公司为之努力并且做了尝试。但是我却认为,P2P不能迷信大数据,大数据并不是万能的,与其执着于用大数据做风控,不如用来做营销。


  一、P2P的大数据为什么做不了风控?


  目前,在国内金融领域,用大数据做风控,成功的案例只有两家,一家是阿里小贷,另一家是证监会。阿里小贷通过卖家海量的交易信息和流水,在几秒钟内完成对商家的授信;证监会通过海量的交易信息挖掘出关联交易,捕捉老鼠仓的基金经理。也有其他一些电商平台号称利用大数据做风控审核,但是其模式的实质是应收账款质押融资(类似保理)或者是货物质押式融资。其实阿里和证监会之所以成功,原因在于两点,一、数据可以做到即时更新,既数据是鲜活的;二是平台本身对用户有约束力。这两点也被人们称为闭环的数据。那么问题就来了,目前国内的P2P公司并没有闭环的交易数据,对用户的约束力也不足够,那么又何来跟大数据结合一说呢?


  有人说利用客户多维度的信息,例如近千个维度,对借款人做综合的评估。这种方式听起来不错,但实际情况是,对一个人信用的评估如果用这样的手段,会发现维度和维度之间并非相互独立的,而是有逻辑关系的,1000个维度中实际有用的维度可能只有100个,900个是没用的,也就是说这样一个风控模型几乎是建立不起来的,纬度的逻辑关系会有冲突,就算真的建立起来了,能通过该模型验证的也极可能是人格完美的人,例如耶稣和甘地,而不是金融信用良好的客户,不同的数据纬度应该对应一个人不同的方面,绝大多数的纬度根本体现和一个人金融信用的相关性。


  再说数据来源,有一种说法是互联网上的社交数据可以作为参考依据,这其实牵涉到两个问题。其一,在互联网上人性是被放大的,现实中不敢说的话,在网络上却敢说,现实中内向的人在网络上或许会非常外向。也就是说互联网上的社交信息很难还原现实中人的信用;其二,社交信用并不一定能代表金融信用。据征信公司根据以往的征信记录来看,人的信用是多方面的,例如朋友信用、爱情信用、事业信用、其他社会信用和金融信用等,如果把每一类信用都看成一个面,其他几个面的信用与金融信用并不一定存在相关性。最近我去英国考察,国外有朋友用facebook上的社交数据做金融的尝试,即利用互联网上的个人信息评估其信用,并作授信。目前这项服务的相关数据还未披露,但是通过一些国外的朋友间接打听,网络上的社交金融可能并不成功,原因就在于此。


  二、P2P的大数据如何做创新?


  如果说P2P执着于数据风控,不如尝试用大数据做营销。事实上,大数据的提出者谷歌就是利用大数据做营销的。打比方说,现在新新贷有一位借款用户,如果他的借款次数在2次以上,且还款情况良好,可以通过数据分析,我们可以用系统的方式为他量身定制贷款方案,利率、手续费、还款方式、期限、额度等都会和原来的服务不同。


  这个看似简单,背后要做的工作很多,首先要看过往的借款记录,新新贷会通过他的以往数据信息推算出他在什么时间节点需要资金周转,例如一个借款人申请借款的时间是8月,但可以通过计算得知他资金周转其实发生在6月,再分析数据,是因为5月份的货物滞压造成,再进一步分析造成货物滞压的原因。贷后管理中,客户经理会了解借款人的经营情况,根据更新过的数据,利用系统的方式推算出可能造成他下一次资金周转的时间,提前推送定制的服务方案。这种服务方案更像量身定制,而非让客户被动接受他不一定适合的信贷产品。在服务方案的制定过程中会根据他的年龄、学历、所在地区、交易流水等情况和数据库中类似的借款人做对比分析,评估他的优势劣势,和同行业企业的相似程度,根据以往借款人的额度、利率、还款方式等信息,重新评估当下借款人的额度、利率、还款方式等等。目前,我们已经尝试了几个这样的服务方案,做到了客户自己还没有发觉有融资问题是,我们就提前推送服务。


  三、没有大数据,还能做数据挖掘


  但是P2P最终还是希望用大数据完成授信和风险控制以降低服务成本。刚才已经谈到,那除非是用闭环的大数据才有可能,也就是说必须有数据即时更新和平台约束力两点。如果P2P无法直接做到这两点怎么办?我觉得可以通过其他的方式无限接近这两个特征。其一,不定期更新用户的数据,以我们来说,风控人员在客户贷后3个月后必须对客户进行2次尽职调查,对用户的信息做更新,重新评估其违约的概率。有人说这么做会增加成本,但P2P本来就在做商业银行和BAT都不做的脏活累活。对一家P2P公司来说,现在正处在数据原始积累的过程中,获取借款人越多真实数据越有利。未来P2P的核心竞争力与其说是风控能力,不如说是数据的积累和数据的处理能力。


  另一方面,小微企业客户的账目往往混乱,在实际的风险控制中还需要还原他们的资产负债表和现金流量表,对他们进行财务输出,建立财务的标准,这些标准的信息积累就为数据积累做好了度量衡统一的准备。这些工作看似不够互联网化,不够科技化,但是只有这样的工作才能获得用户精准的数据,有效的数据,否则用系统的手段处理,就会在大量的洗脏数据的过程中,增加机会成本。


  我个人认为,与其执着于在线上获取数据,不如脚踏实地在线下做好借款人的数据分析。例如,我们在数据积累的过程中,发现抽烟的借款人逾期率高于不抽烟的人,有宗教信仰的借款人逾期率低于没有宗教信仰的借款人,世界杯期间看足球的借款人违约率高于不看足球比赛的借款人。借款人的这些信息和数据几乎是没办法在线上获取的,即使获取也无法核实真伪,但是通过线下实地走访,这些信息很容易获得。这些有参考价值的数据对大数据和风险控制结合是有帮助,排除对借款人最有影响的地区、行业等因素,用户自身的一些行为是否存在相关性,是对风险控制审核的重要参考。


  P2P结合大数据的路还很漫长,目前国内还没有成功的案例,大数据对P2P来说首先用于营销,其次用于风险控制,在数据的积累过程中去做更多深入的挖掘,可能才是真正的未来。


  欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:点击左下方“阅读原文”填写您的加入信息,科技杂谈通过审核后,会添加入群。


本文仅代表作者观点,科技杂谈授权刊登。

转载必须注明作者与科技杂谈,侵权必究。

科技杂谈文章,均同步发布于犀牛财经网。

已入驻搜狐新闻客户端,网易阅读客户端。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存