查看原文
其他

数博会专访AI科学家谢映莲:收集更少的隐私信息,也能反欺诈

李玲 隐私护卫队 2019-07-07

去年12月,星巴克发起免费注册换咖啡的活动,结果遭遇黑产疯狂“薅羊毛”,营销活动不到一天,紧急下线。一个月后,拼多多也报警称,推出的百元优惠券遭黑灰产批量盗取,“实际资损大概率低于千万元”。 


原本为用户准备的优惠折扣,却被“羊毛党”盯上,利用平台的优惠漏洞低价买进高价卖出,大量获利。其实,这是企业遭遇在线欺诈的缩影。 


“平台上线推广活动,面对的是成百上万的用户。黑产只要有机会就来,反欺诈是企业面临的核心问题。”近日在数博会上,DataVisor维择科技创始人兼CEO、硅谷AI科学家谢映莲接受南都记者采访时表示,网络欺诈已形成完整的黑色产业链,企业有必要引起重视,提前预测和应对未知的欺诈风险。 


DataVisor维择科技创始人兼CEO、硅谷AI科学家谢映莲。受访者供图


网络欺诈手段变幻复杂,已成产业链1


5月26-29日,2019中国国际大数据产业博览会在贵阳举行。连续举办5年的数博会,吸引来了越来越多的国内外企业及大数据从业者参与。 


今年带着无监督机器学习技术和最新的反欺诈风控产品,谢映莲及其公司DataVisor维择科技首次亮相数博会。


谢映莲是一名AI科学家,毕业于北京大学计算机系,拥有美国卡内基梅隆大学计算机科学系博士学位。2013年底,从微软研究院辞职后,谢映莲在美国加州创立了网络安全公司,专注提供线上反欺诈服务。 


“像在解侦探小说一样。”谢映莲将网络安全攻防过程作了这样的比喻,不法分子躲在暗处,抓住平台漏洞发起攻击,而安全人员在复杂变幻的场景中,循着蛛丝马迹逐一破解。 


据谢映莲介绍,随着互联网行业的飞速发展,网络欺诈衍生出更多更复杂的场景,已形成一条商业化非常成熟的黑色产业链。 


在这条产业链上,欺诈团伙在发起攻击前潜伏并不断测试平台安全规则,随后通过虚假注册等方式批量开通恶意账户,当发现购物网站、游戏或金融等平台存在漏洞,便会大规模发起攻击。由此产生的后果是,不法分子疯狂“薅羊毛”,或恶意骗贷套现、非法集资洗钱、实施网络诈骗等。 


“大规模,有组织的协同作案,欺诈手段多样,是当前网络欺诈表现出的特点。”26日,在数博会的一场网络安全论坛上,谢映莲表示,移动互联网的全面普及给企业带来新的欺诈挑战。 


黑产收购App获取真实用户数据,用于欺诈2


在微软的7年里,谢映莲化解了一个个安全难题,开发了一系列诸如基于微软Hotmail社交图以对用户进行认证的系统架构,以及降低信用卡实时交易风险算法等产品,拥有超过20项技术专利。 


然而,当安全研究者在不断创新技术抵御攻击时,网络攻击者也在变幻手段试图绕过防线。南都此前报道,有黑产人员已用上AI技术可在毫秒级内破解验证码,从而绕过互联网公司设置的账户登录安全策略。 


“黑产越做越复杂,甚至用上了高科技。”谢映莲告诉南都记者,欺诈团伙的一项策略是批量复制。 


以前黑产使用虚拟机注册号码,后来发展出猫池批量注册。所谓猫池(Modem POOL)是指将相当数量的Modem使用特殊的拨号请求接入设备连接在一起,可同时接受多个用户拨号连接的设备。 


为了逃避平台监管,一些黑产人员还会借助“群控”设备,将恶意注册的虚拟账号模拟正常用户行为,比如定期更新朋友圈、发布消息、加好友等,俗称“养号”。 


据谢映莲介绍,前段时间,国外某大型企业遭受的一次网络攻击显示,有黑产分子专门大量收购App以获得真实的用户信息,然后借此复制发起大规模的网络攻击。 


如何应对日益“高明”的网络欺诈?过去常见的欺诈检测方式是基于好用户和坏用户的不同特征,然后撰写相应的规则判别异常。举例来说,一个真实的用户使用社交软件,通常会有互动点赞和发布更新的记录,但一个虚假账户可能不存在这样的行为。 


但是规则的撰写和改进并不容易,需要建立在充分了解攻击者特征的基础上。而攻击者不断变化,很多时候早已通过测试洞悉平台的规则和模型,巧妙地绕开了监控。可见,这种方式对快速变化的欺诈攻击反应缓慢。 


无需过度收集个人信息,也能达到安全效果3


面对复杂变幻的网络欺诈,传统“头痛医头,脚痛医脚”的防御方式似乎很难跟上攻击者的速度。于是7年前,谢映莲和她在微软的同事俞舫试图通过一套通用的方法论——无监督机器学习,提前应对快速演变的欺诈模式。 


在26日数博会的一场分论坛上,谢映莲介绍了无监督机器学习技术在风控管理中的创新应用。简单来说,无监督是机器学习的一种方式,对应的是有监督学习,二者的不同大致可以从是否需要特定标签输出区分。 


有监督学习的技术逻辑是,机器先大量习得攻击模式然后标记数据,通过标签来检测异常。而无监督学习的特点在于不需要标签,也不需要知道攻击者是谁,就能从巨量数据中自动识别与攻击活动相关的模式。 


谢映莲介绍,通过对用户脱敏的行为数据进行运算分析,无监督学习算法可识别可疑群集,为模型培训自动生成标签和规则,从而提前检测未知攻击。 


“之前,无监督机器学习一直停留在学术理论层面,因为它对算法和投入生产的要求高。我们的贡献在于加入了自己的方法论,并作了一些智能提升,可以批量实时地应用于不同场景。”谢映莲对南都记者表示。 


在无监督机器学习的基础上,谢映莲及其团队推出了dCube全面反欺诈管理解决方案,并在数博会展馆展出。这项产品可帮助企业根据自身业务逻辑来调整机器学习的方法论,生成机器模型应对网络欺诈。 


随着互联网发展,很多企业将业务搬到线上,一旦联网所面临的安全风险大大增加。南都记者注意到,一些网络借贷平台为了查看借款人是否有还款能力,让借款人提交身份证、手机号码、银行卡、通话记录、网购记录、教育信息等,用户提交的隐私信息越多,能贷取的额度越高。 


但平台真的需要这么多个人信息才能防止欺诈吗?谢映莲告诉南都记者,收集更少的信息也能达到同样安全效果。这正是无监督机器学习倡导的理念,通过分析账户之间的隐藏连接来识别可疑的群集,将所有恶意用户进行关联分析进而发掘出整个犯罪团伙,提前发现未知的欺诈威胁。 


“用户经常困惑我的数据被收集用于何处,”谢映莲说,基于安全公司的经验,企业应对掌握的数据进行脱敏加密或模糊匹配的处理,保障数据不被外泄。同时重视用户体验,通过透明、可选择的方式让用户清楚信息收集的方式,以此建立互信机制。 



报料请点击 

推荐阅读:

详解《数据安全管理办法(征求意见稿)》:备案时代即将到来?

地方政府数据开放报告:上海、贵阳第一,广东山东是开放大省

易到“余额被清零”故障后再遭攻击致系统瘫痪 被勒索巨额比特币

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存