数博会专访AI科学家谢映莲：收集更少的隐私信息，也能反欺诈

Original: 李玲隐私护卫队 2019-07-07

去年12月，星巴克发起免费注册换咖啡的活动，结果遭遇黑产疯狂“薅羊毛”，营销活动不到一天，紧急下线。一个月后，拼多多也报警称，推出的百元优惠券遭黑灰产批量盗取，“实际资损大概率低于千万元”。

原本为用户准备的优惠折扣，却被“羊毛党”盯上，利用平台的优惠漏洞低价买进高价卖出，大量获利。其实，这是企业遭遇在线欺诈的缩影。

“平台上线推广活动，面对的是成百上万的用户。黑产只要有机会就来，反欺诈是企业面临的核心问题。”近日在数博会上，DataVisor维择科技创始人兼CEO、硅谷AI科学家谢映莲接受南都记者采访时表示，网络欺诈已形成完整的黑色产业链，企业有必要引起重视，提前预测和应对未知的欺诈风险。

DataVisor维择科技创始人兼CEO、硅谷AI科学家谢映莲。受访者供图

网络欺诈手段变幻复杂，已成产业链1

5月26-29日，2019中国国际大数据产业博览会在贵阳举行。连续举办5年的数博会，吸引来了越来越多的国内外企业及大数据从业者参与。

今年带着无监督机器学习技术和最新的反欺诈风控产品，谢映莲及其公司DataVisor维择科技首次亮相数博会。

谢映莲是一名AI科学家，毕业于北京大学计算机系，拥有美国卡内基梅隆大学计算机科学系博士学位。2013年底，从微软研究院辞职后，谢映莲在美国加州创立了网络安全公司，专注提供线上反欺诈服务。

“像在解侦探小说一样。”谢映莲将网络安全攻防过程作了这样的比喻，不法分子躲在暗处，抓住平台漏洞发起攻击，而安全人员在复杂变幻的场景中，循着蛛丝马迹逐一破解。

据谢映莲介绍，随着互联网行业的飞速发展，网络欺诈衍生出更多更复杂的场景，已形成一条商业化非常成熟的黑色产业链。

在这条产业链上，欺诈团伙在发起攻击前潜伏并不断测试平台安全规则，随后通过虚假注册等方式批量开通恶意账户，当发现购物网站、游戏或金融等平台存在漏洞，便会大规模发起攻击。由此产生的后果是，不法分子疯狂“薅羊毛”，或恶意骗贷套现、非法集资洗钱、实施网络诈骗等。

“大规模，有组织的协同作案，欺诈手段多样，是当前网络欺诈表现出的特点。”26日，在数博会的一场网络安全论坛上，谢映莲表示，移动互联网的全面普及给企业带来新的欺诈挑战。

黑产收购App获取真实用户数据，用于欺诈2

在微软的7年里，谢映莲化解了一个个安全难题，开发了一系列诸如基于微软Hotmail社交图以对用户进行认证的系统架构，以及降低信用卡实时交易风险算法等产品，拥有超过20项技术专利。

然而，当安全研究者在不断创新技术抵御攻击时，网络攻击者也在变幻手段试图绕过防线。南都此前报道，有黑产人员已用上AI技术可在毫秒级内破解验证码，从而绕过互联网公司设置的账户登录安全策略。

“黑产越做越复杂，甚至用上了高科技。”谢映莲告诉南都记者，欺诈团伙的一项策略是批量复制。

以前黑产使用虚拟机注册号码，后来发展出猫池批量注册。所谓猫池（Modem POOL）是指将相当数量的Modem使用特殊的拨号请求接入设备连接在一起，可同时接受多个用户拨号连接的设备。

为了逃避平台监管，一些黑产人员还会借助“群控”设备，将恶意注册的虚拟账号模拟正常用户行为，比如定期更新朋友圈、发布消息、加好友等，俗称“养号”。

据谢映莲介绍，前段时间，国外某大型企业遭受的一次网络攻击显示，有黑产分子专门大量收购App以获得真实的用户信息，然后借此复制发起大规模的网络攻击。

如何应对日益“高明”的网络欺诈？过去常见的欺诈检测方式是基于好用户和坏用户的不同特征，然后撰写相应的规则判别异常。举例来说，一个真实的用户使用社交软件，通常会有互动点赞和发布更新的记录，但一个虚假账户可能不存在这样的行为。

但是规则的撰写和改进并不容易，需要建立在充分了解攻击者特征的基础上。而攻击者不断变化，很多时候早已通过测试洞悉平台的规则和模型，巧妙地绕开了监控。可见，这种方式对快速变化的欺诈攻击反应缓慢。

无需过度收集个人信息，也能达到安全效果3

面对复杂变幻的网络欺诈，传统“头痛医头，脚痛医脚”的防御方式似乎很难跟上攻击者的速度。于是7年前，谢映莲和她在微软的同事俞舫试图通过一套通用的方法论——无监督机器学习，提前应对快速演变的欺诈模式。

在26日数博会的一场分论坛上，谢映莲介绍了无监督机器学习技术在风控管理中的创新应用。简单来说，无监督是机器学习的一种方式，对应的是有监督学习，二者的不同大致可以从是否需要特定标签输出区分。

有监督学习的技术逻辑是，机器先大量习得攻击模式然后标记数据，通过标签来检测异常。而无监督学习的特点在于不需要标签，也不需要知道攻击者是谁，就能从巨量数据中自动识别与攻击活动相关的模式。

谢映莲介绍，通过对用户脱敏的行为数据进行运算分析，无监督学习算法可识别可疑群集，为模型培训自动生成标签和规则，从而提前检测未知攻击。

“之前，无监督机器学习一直停留在学术理论层面，因为它对算法和投入生产的要求高。我们的贡献在于加入了自己的方法论，并作了一些智能提升，可以批量实时地应用于不同场景。”谢映莲对南都记者表示。

在无监督机器学习的基础上，谢映莲及其团队推出了dCube全面反欺诈管理解决方案，并在数博会展馆展出。这项产品可帮助企业根据自身业务逻辑来调整机器学习的方法论，生成机器模型应对网络欺诈。

随着互联网发展，很多企业将业务搬到线上，一旦联网所面临的安全风险大大增加。南都记者注意到，一些网络借贷平台为了查看借款人是否有还款能力，让借款人提交身份证、手机号码、银行卡、通话记录、网购记录、教育信息等，用户提交的隐私信息越多，能贷取的额度越高。

但平台真的需要这么多个人信息才能防止欺诈吗？谢映莲告诉南都记者，收集更少的信息也能达到同样安全效果。这正是无监督机器学习倡导的理念，通过分析账户之间的隐藏连接来识别可疑的群集，将所有恶意用户进行关联分析进而发掘出整个犯罪团伙，提前发现未知的欺诈威胁。

“用户经常困惑我的数据被收集用于何处，”谢映莲说，基于安全公司的经验，企业应对掌握的数据进行脱敏加密或模糊匹配的处理，保障数据不被外泄。同时重视用户体验，通过透明、可选择的方式让用户清楚信息收集的方式，以此建立互信机制。

报料请点击

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

瘦皇被指“爱C女主播”！破防诅咒“小SS父母”：煤气厂爆炸！鱼皇下场开喷！

斗鱼老板已经“Q保H审”？多家知名媒体爆料！律师预计进去五到七年！