查看原文
其他

科普 | 数据共享困局:数据造假、私下买卖,上百平台市场混战

2018-01-02 菲凡烽火台

12月,金融强监管到来,行业逾期全面爆发。


这背后的深层次原因,无疑是“多头借贷”太过严重。


“经历过这次下行周期,市场被教育了一次,意识到了共享的重要性。”多位业内人士称。


中国共享意识,全面觉醒。


目前,市面上已出现上百家数据共享平台,未来,这个数字将呈几何级增长。


一个真正的共享时代,已徐徐而来。



01 共享觉醒


12月是金融行业风雨飘摇的一个月。


行业强监管袭来,此前对自己风控能力充满信心的公司,发现自己的逾期率和入催率在嗖嗖上涨。


“此前我们去和公司谈,参与数据共享,大多人并不理会。”某个人征信试点的商务负责人程烨发现,最近这些公司对于“共享”积极了很多,甚至很多公司主动来敲门。


共享平台们,已感知到共享意识的觉醒。


目前,市面上有上百家数据共享平台,这其中分为几大类别。


最早入场的是官方系。


早在2009年,央行征信就正式控股上海资信有限公司。


“业内都认为,上海资信是央行征信的补充,专门用来收集央行征信之外的借贷数据。”监管人士林海峰称。


此外,还有一些有官方背景的协会,也成立过数据共享平台。


比如中国支付清算协会下的,小微金融风险信息共享平台。


第二派,是企业系,是各大公司自建的平台。


比如中诚信、中智诚、京东金融、宜信旗下致诚信用的阿福平台、算话征信、同盾、91征信等平台。


除此之外,还有一些有数据的支付公司、短信平台都纷纷做起了数据共享平台。


“知名平台有30多家,大大小小的平台都算上得有100多家。”林海峰预估,这一切才是刚刚开始,未来将出现更多细分垂直的数据共享平台。


而这一轮新的爆发,偶尔中也带有必然。


中国的征信体系,在曲折中盘桓多年。


2015年,国家正式开放了民间个人征信市场,号令枪一响,第一批试点的8家机构,开始撒丫狂奔。


大家望穿秋水,等待着牌照,最终等来了却是监管的“全盘否定”。


“8家进行个人征信开业准备的机构,目前没有一家合格。”中国人民银行征信管理局局长万存知在会议上称。


两年探索,一夜归零。


无疑,征信建设是一个漫长而风雪交加的征途,急不得。


但互联网金融等不了。


对于金融行业来说,征信太过重要,可节约大量风控成本。


行业开始自救,市面陆续出现一批数据共享平台。


在最早期,数据共享平台都喜欢收集“黑名单”,就是逾期数据。


随着消费金融的普及,很多用户开始多头借贷,借新还旧,以贷养贷。


黑名单数据开始“失效”。


“2015年,网贷很火,平台几千家,导致行业的共债已非常严重。”致诚信用总经理赵卉称,过度负债的结局,有太多前车之鉴,比如韩国的信用卡危机、台湾的卡债风暴等。


“债务会累积,像雪球一样越滚越大,等支撑不住崩盘的时候,债务危机才会集中爆发,一个好用户,也会突然间崩盘而不还钱。”林海峰称。


说到底,借贷需要评判两个要素:还款能力和还款意愿。如果共债严重,就很难正确判断一个人的还款能力。


不久,整个行业调转船头,从只收集“逾期数 43 35346 43 15232 0 0 2397 0 0:00:14 0:00:06 0:00:08 3090”的黑名单,转到了收集借贷的“全周期数据”,以此缓解“多头借贷”严重的现状。


“征信的精髓,就是共享。”林海峰称,因此,行业共享平台的建立,是必然,也是趋势。



02 困难重重


2016年下半年开始,数据共享平台大量出现,一时间行业百舸争流。


但总体来说,发展不尽人意。


先来说说官方派。


因为是官方机构或半官方机构,吓得部分存在问题的公司不敢来共享。


“谁能说自己是一张白纸,没有一点问题?”林海峰笑称。


另一方面,因为官方派缺乏互联网基因,服务和运营意识并不太好,“前期共享完了,后期的服务体验不好”。


而企业派,则是问题重重。


林海峰注意到,大家做共享平台的出发目的,不太相同。


“有一些是为了利益而来。”林海峰发现,一些平台的规则是,共享了数据的,查询不收费,但是其他公司要想来查,就得收费,“几毛到几块不等”。


还有一部分,是为了数据而来。


林海峰就曾经调查到,一家数据平台收集到数据后,再偷偷拿到各地的大数据交易中心去买卖。


或者直接成立一家“关联公司”,在市面卖数据。


还有一些玩家,当了裁判员,还同时当运动员。


“一家头部的数据共享平台,公司负责人的直系亲属,又成立了一家贷款公司,拿着各家的金融数据再去放款。”程烨称,这在圈内,早就成为了公开秘密。


因此,在最早期,金融公司并不太愿意共享数据。


第一,他们也无法判断平台动机是否纯良;第二,数据是他们的“核心机密”,他们也不愿意拿出来。


“谈一个共享用户太难,反反复复去磕。”程烨一度认为,共享在中国不太可能做起来,大家“自扫门前雪”的心态太严重,相互敌视,不信任。


在如此利益交集的江湖,“相互不信任”,成为数据共享最大阻力。


为了消除金融公司的顾虑,各家公司都打出了新的底牌。


第一种方式,就是不需要金融公司上交数据,只要提供一个接口,每次有人查询时,直接反馈一个脱敏结果。


但这依旧没有消除金融公司的顾虑,“这个接口是否安全?共享平台是否能以此为抓手,伸进底层数据库?谁都不敢保证。”程烨称。


市面上有人提出了,用技术来解决。


林海峰最近参加了很多大数据峰会,发现很多数据共享平台都在宣称用“区块链”的技术。


他要求去看底层架构的时候,对方却变得支支吾吾。


“很多都是噱头,区块链在共享平台运营还比较早期,真正走出模式来的,没几家。”林海峰对此也不乐观。


“我们也加入了很多数据共享平台,但是调取平台数据的时候,发现效果很差。”某公司的数据模型负责人坦言。


此后,他们再也没有加入过任何数据共享平台。


数据的表现,为何不尽人意?


“数据掺沙子的问题,一直存在。”致诚信用总经理赵卉称,很多金融公司的想法是,把一些好用户,杂糅到黑名单里,“他们以为,如此别人就无法抢走自己的用户”。


“这就导致,很多平台的数据被污染,真假难辨,失效失真。”程烨称。


建造平台目的不纯、相互不信任、数据造假等多种问题,整个数据共享行业都尚在迷雾中摸索。



03 前路漫漫


行业诸多问题叠加,实际上,无非就是要解决一个“公信力”问题。


要建立公信力,出发的目的,就不能太功利。


多位共享平台的负责人认为,数据共享,应该用“纯公益”的操作思路。


“带有私心和目的,行业内的人都不会认。”小微金融风险信息共享平台的负责人透露。


赵卉持有同样的观点,所以致诚阿福的数据共享,并不收费。


“宜信的创始人、CEO唐宁在内部会议上,说要进行数据共享,大家都颇为反对,觉得这个事情吃力不讨好,很难做起来。”赵卉称,但唐宁很坚持,说这是对整个行业都有益处的事情,能够帮助整个行业降低风险。


唐宁提出方案后的2016一年,都是“让行业机构免费来查宜信的数据”。直到2016年年底,致诚阿福的共享平台才成立。


也就是说,他们花了一年多来教育市场,培育信任。


“我一直相信六度空间理论,也就是说,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”赵卉称,这个圈子很小,纸是包不住火的。


“因此,永远不要作恶。”


她在圈内听说一些大公司会数据“掺沙”,至今她都拒绝合作。


同时,加强数据的交叉验证和审核,这一步也不可少。


“我们对数据进行反查抽样,机器和人工交叉验证,一旦发现异常,就会深入查验。”赵卉认为,要爱惜羽毛,才能飞得更高更远。


“现在已有数据查验模型,容易发现数据中掺的沙子。”赵卉称,她已清退了3家数据存在问题的公司。


除了技术之外,还可通过制度来防止“数据造假”。


一家加入信联的征信机构数据共享平台称,他们将在明年开放C端用户的数据查询。


这个逻辑和查询央行征信很像。


用户本人,可以去央行申请查询个人征信,如果发现逾期等负面记录有误,可以提出异议。


这个方式可以让用户自行发现数据真伪。


共享要用“公益”思维,但这件事情并非毫无想象力。


一家金融公司不是光有数据,就可做好风控,还需要技术和经验。


比如致诚阿福,就在共享平台后已布局了“群星”和“天迹”两套系统,给金融公司提供全业务流程的风控解决方案。


前端,共享平台聚合行业,后端,又将宜信多年的经验输出。


这样的商业模式,才足够智慧。



美国征信的建立,花了近百年的时间。


中国征信出发才几年,前路漫漫。


“数据共享必须沉下心来,重运营重服务重质量,才可能成。”林海峰称,因为数据是敏感资产,尚有不慎,就可能“走偏”。


这里同样只欢迎深耕者,拒绝投机取巧的“揩油者”。




END


本文来源:一本财经




往期精彩

盘点 | 独家!2017年十大最受关注欺诈事件

曝光 | 花呗套现非法经营第一案宣判:90后男子获刑两年半

揭秘 | 60岁老人跳楼逃生,借5万竟要还180万!



点击  “阅读原文” ,查看更多项目信息。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存