查看原文
其他

对话 | 信而富科学家Thomas:中国的信用数据体系就像有很多星的晚上

2017-05-16 零壹财经 孙爽 Fintech前线

信而富成立于2013年,是专注于撮合个人消费贷款的上海老牌P2P网贷平台,曾于2014年11月联合腾讯发布中国首款移动社交平台小额信贷产品“现金贷”,又于2015年10月联合百度发布“现金贷”产品,堪称当前国内大火的现金贷产品技术的先驱,近期在纽交所上市。

 

信而富将自己的客群定位为“正在崛起的经常使用手机的中产消费者(Emerging Middle-Class Mobile Active Consumers,EMMA)”,其特征为在央行征信中心没有信贷记录、职业稳定、高度依赖互联网、喜欢网购……。

 

近日,零壹财经和信而富硅谷大数据实验室首席科学家Thomas Wang(以下简称“Thomas”)进行了对话。以下是对话精选。

 

零壹财经:信而富硅谷大数据实验室是如何运作的?

 

Thomas:我们跟斯坦福和麻省理工学院有合作,我们向他们咨询技术,也会向他们提供数据。我们使用的数据大部分来自中国,也会用美国数据(比如网贷平台Lending Club和政府的)来做对比研究。

 

零壹财经:您认为美国数据和中国数据有何不同?

 

Thomas:美国的数据非常干净,我是说很结构化。中国的信用数据体系就像在晚上,你会看到很多星星,但是它们散落于各处,你要把这些“星星”都拼起来才能决定要不要给一个人放款。

 

零壹财经:关于信贷,您现在的想法是怎样的?

 

Thomas:用人工智能、机器学习使信贷决策和反欺诈自动化。不过无监督模型应用于信贷,不是很robust(显著),因为信贷决策的环境经常改变。但是我们会继续尝试这种方法,我们知道的谷歌的Alphago应用的就是无监督学习,因为人没办法看很多数据,无监督学习能自己预测、自己判断。

 

零壹财经:关于您个人,您以前的经历是怎样的?

 

Thomas:芝加哥大学毕业后,我在华尔街做过一段时间高频交易。总体来讲,我认为美国监管很严格,在中国就可以做很多事情,有很多数据。

 

零壹财经:您现在的经历和以前的有什么不同?

 

Thomas:以前在华尔街做模型用三四十个变量。现在用机器学习,会用几千个变量,大部分又噪音,但是有用的还是比以前的多得多。


相关阅读:

网贷获客成本到底多高?信而富招股说明书这么说……


零壹财经 · 零壹学院

互联网金融刑事责任风险与防控要点(研修班)


时间:6月3日—4日

地点:北京

形式:培训+讨论+风险测试

课程特色:法官、检察官、法学专家现身说法

测试量表评测刑事风险

注重实操拿来即可使用


长按识别二维码,即可报名

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存