查看原文
其他

专访 | Maxent 张克:人工智能反欺诈是大势所趋

2016-10-08 孙爽 Fintech前线

文| 孙爽(零壹财经华中新金融研究院)


9月23日,在零壹财经·中国消费金融高峰论坛召开期间,零壹财经专访了Maxent(猛犸反欺诈)创始人兼CEO张克。 

 

受访人所在公司(Maxent猛犸反欺诈)资料: 
--2014年11月成立于上海; 
--2016年初获得祥峰资本数千万元A轮融资; 
--猛犸反欺诈拥有反欺诈解决方案Fraudynamics和ID底层技术服务ID Service两款产品; 
--员工数近40人,其中超过30人为研发人员; 
--猛犸反欺诈在金融服务业已公开的客户包括厚本金融和萨摩耶金服等; 
--正在进行A+轮融资。


受访人资料: 

--2001年起,曾先后就职于朗讯科技实验室、IBM、思科担任技术专家、高级产品经理;2010年出任思科产品亚太区总监,研发管理单个产品项目年收入超过4亿美元。2012年出任亿动传媒副总裁。 
--中国科技大学计算机科学硕士,SIMBA同济大学MBA,EcoledesPonts商学院ENPCMBA


金融服务业,尤其是借贷业,作为经营风险的行业面临着两种风险:欺诈风险和信用风险。欺诈风险主要指的是借贷申请人没有还款意愿,信用风险主要指的是借贷申请人没有还款能力。我国借贷业面临的主要是欺诈风险。 

张克说,"因为金融是一个'刀口舔血'的行业,风控是生命线。没有好的风控,金融机构很难生存下去。所以,金融业反欺诈的风控需求一直很强劲。"因此,金融服务是猛犸反欺诈除电商和游戏外的重点关注行业。 

在本次专访中,张克详述了反欺诈的流程、方式、在互联网消费金融的应用和猛犸使用的技术。 

反欺诈检测的两种方式:数据,还是技术? 

张克认为,反欺诈作为一个业务流程包括三个步骤: 

1、检测(Detect)。 

反欺诈检测有两种方式,通过数据和通过技术(其区别见下表)。
猛犸反欺诈在做的是用技术来帮助企业使用自有数据反欺诈,也就是第二种方式。



2、响应(Response)。响应指的是对异常行为采取阻断一次交易、拉黑或者其他方式。 

3、预防(Prevention)。预防指的是将异常行为收录入黑名单等,固化成规则,如果下次再有行为触碰到规则,系统会进行预设的响应。 

张克认为
通过数据和通过技术来进行反欺诈检测是互补的,因为一个企业要反欺诈既需要利用外部数据,也应该开发自有金矿--内部数据。 

对于两种反欺诈检测技术的发展前景,在张克看来,
通过黑名单进行反欺诈检测在中期来看会随着时间的推移失效,失效的速度可能会很快。他给出了两个理由: 

第一,当前很多黑名单数据来自房贷、车贷和信用贷申请人,但假如一家消费金融服务商针对的客群是蓝领,这些人群此前可能并没有申请过房贷、车贷和其他信用贷,那么这样的黑名单对蓝领客群即是失效的。 

关于这一点,张克在零壹财经·中国消费金融高峰论坛的演讲上阐述道:"黑名单是一种强规则,这种规则有它的局限性,黄鼠狼给鸡拜年不安好心,这也是帮助鸡进行识别防范风险。但是如果这时候来了一只饥饿的野狗那鸡如何进行判断呢?这需要鸡有非常强的经验,这个过程中它承担了更多的风险有可能被吃掉了。" 

第二,信用不好的人发现自己上了黑名单后要么不会再申请服务,要么不会再继续使用自己的身份借贷。不管是哪种情况,原有的黑名单中关于此人的信息会立刻失效。 

另外,张克认为
通过数据反欺诈不适合初创公司切入,因为大量数据是被巨头把持着的。 

通过技术反欺诈,张克认为这是反欺诈的发展趋势、前景广阔,他的理由是: 

首先,欺诈者的行为在某些维度上与非欺诈者一定是不一样的,如果说一个人伪造一部分信息比较容易,伪造全部信息是非常困难、成本非常高的。这种异样也是可以被技术捕捉的。 

其次,类似于银行等大型机构自身的反欺诈团队人手和技术的专业水平有限,难以跟上外部商业机会的变化,必定需要专业的第三方服务。 

另外,反欺诈有很多专门技术,市场上很难出现一家机构能将所有技术都做得很精。此处张克援引了他听到的两个数据:美国一家大型银行平均会使用30家反欺诈机构的技术,而电商平均会采用7家反欺诈机构的技术。 

那么,猛犸反欺诈拥有的是什么技术? 

被动式全栈DFP设备指纹技术 

识别和检测用户所使用的设备是反欺诈的重要环节。张克举例称,假如一家消费金融服务商只接受来自手机App的申请,如果发现有请求来自PC端,那么该申请人使用的可能是PC上的模拟器(模拟器会假装自己是手机或交易协议),有欺诈嫌疑,因为PC模拟器的特点是比手机编程的开发工具多、开发成本低、速度快。 

在终端特征检测上,猛犸反欺诈采用了被动式全栈DFP设备指纹技术。之所以采用这种技术,张克详述了原因: 

PC时代,Cookie会记录设备信息,但是各国政府和公司出于对个人隐私保护的考虑,第三方Cookie逐渐被主动式设备指纹替代掉。所谓主动式设备指纹,指的是在网站上主动运行Javascript代码来识别浏览器。 

移动时代,人的移动终端设备和他自身基本上是绑定的,所以识别移动终端行为的历史记录在某种程度上表征着识别人的行为的历史记录。识别设备是反欺诈和进行精准营销的基础。 

最早识别移动终端设备的方法是为其设置ID,但这种方法对抗性很差,因为如此产生的ID位置不隐蔽,很容易欺诈者被抹去。为了解决这一问题,持久化ID法和移动端主动式设备指纹法产生。前者只要终端持有者不刷机、不遭遇黑客攻击就会一直存在,后者是在终端上运行一段代码来记录终端信息,较前者的对抗性略强,但由于识别设备的代码在终端上,仍然容易被欺诈者抹去。 

而猛犸反欺诈所采用的被动式设备指纹技术纯粹基于机器学习,不在终端上运行任何程序,只需要终端提供可供访问的网页(HTTP通信),就可以通过分析终端通信协议中协议栈的信息来识别设备。如此,技术核心在服务器端而非终端,终端即便对信息做修改,该技术仍能将其识别出。被动式设备指纹技术对算法和数据等都有较高要求,而主动式设备指纹技术的源代码在Github等网站上可以很快找到,门槛较低。 




未来,猛犸反欺诈还会在何种技术上发力? 


非监督式机器学习 

张克表示,未来猛犸反欺诈会继续钻研非监督式机器学习技术。他介绍道,机器学习是人工智能的子集,机器学习可以根据是否需要反馈分为三种:监督式、半监督式和非监督式。监督式机器学习需要对观测到的模式中相关数据的反馈(如一个值是否应贴上类似于"欺诈者"的标签)。非监督式机器学习不需要反馈即可从数据中发现异常值,继而将其回到上层决策模型。 


张克举了个例子来说明非监督式机器学习是如何运作的。例如,对电商来说,在非购物高峰期,一个在五分钟内完成付款的人可能被基于规则的反欺诈引擎认为是欺诈者,因为他可能没有浏览商品而是直奔优惠券等而来。但在"双十一"时这条规则会失效,因为"双十一"很多购物者为了获得商品会对之前浏览过的商品立刻下单。那么,如何定义一个付款行为是不是在"异常"短的时间内完成?非监督式机器学习认为所有购物者的付款时间呈正态分布,只要偏离了正态分布较多的值即可被认为是"异常"的,这样的购物者欺诈嫌疑较重。 

猛犸反欺诈的愿景是将机器学习这种底层人工智能技术输出给客户,让后者能直接使用,张克说。 

其他 

谈及对标,张克认为猛犸反欺诈的技术和全球最大征信机构Experian近日收购的41stParameter的有些类似,都是线上设备指纹技术。 

除了反欺诈,Maxent还有营销解决方案。张克认为
在反欺诈之外开展营销业务是很自然的选择,"反欺诈是识别'坏人',那反过来就是识别出'好人',识别出'好人'后就可以对他们进行产品和服务的营销"。 

相关阅读 

Maxent猛犸反欺诈CEO张克:用户的线上数据将是反欺诈的金矿 

(阅读请点击左文末左下方“阅读原文”)






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存