查看原文
其他

连黄牛党都开始玩AI了,春节抢票不加钱是回不去了

2017-12-07 Donna AI科技大本营


采写 | Donna

编辑 | 波波,鸽子



最近,中国铁路总公司发布消息,暂不开放今年12月25日之后的火车票预售。若想购买12月25日之后的车票,最早要等到12月上旬。这就意味着,在12月,火车票预售情况将比往年更火(kong)爆(bu)!


票已然很难抢了,可12306还不断搬出各种神招来让你哭晕在厕所:比如那一年,“请点击下图中所有的白百合”……据某网站统计,上述验证码一次性输入准确的比例仅为8%,也就是说,在热门车票“秒光”的瞬间,92%的人会直接被这些图片验证挡在门外,连回家车票的面都见不上。



你抱怨眼神不好,抱怨手脚太慢,抱怨大脑走神......你以为这些真的是你自己的问题吗?


No.No.No~~


与你一起抢票的,是无数你看得见的看不见的新兴网络黄牛。他们规模作战,经验丰富,搭配高配电脑高配光纤,外加专业抢票软件及专业服务器。你的单兵作战,哪里敌得过有组织有纪律的团队作战。



专业化的网络黄牛抢票党


在淘宝上,一搜“抢票”,竟有多达2000多家店铺,专业做着这门帮人抢票的生意。



甚至,这条专业之路上,还形成了自己的鄙视链:


团队协作淘宝店鄙视老板兼客服淘宝店,高端抢票软件鄙视三流抢票软件,固定价格淘宝店鄙视浮动价格淘宝店。


还有了人格担保:“没有金刚钻,不揽瓷器活,专业的事情还需交给专业的人来做。”



所以,面对已经如此专业的团队,你再火眼金睛,眼疾手快,也比不过一秒就能抢光一车厢票的机器。


12306本意用来阻挡黄牛的设计,如“识别白百合”的图片验证码,反倒成为黄牛在抢票速度上碾压普通人的一大杀器。因为图片验证码的出现,让黄牛和规模化的抢票平台也速度AI化,其加大自动化图像识别的机器训练规模,让普通用户在这场速度竞赛中远远落在后面。


于是,想要抢得票,就得加价。想要抢到票的几率大点,就得狠狠地往上加价。



网络黄牛党越演越烈,就连飞猪、携程也加入了这场网络倒票的大潮中。抢票还抢出了三六九等,VIP级抢票一次收80元。


面对如今越来越疯狂的网络抢票黄牛党,有没有技术可以治治这些猖狂的行为呢?

有。


传统的机器学习,可以对用户进行分类和预测。它能够针对有欺诈行为的用户建立模型,然后根据模型来预测哪些用户有问题,哪些用户没有问题。


但是,由于抢票往往都躲在暗处,传统的机器学习想做出他们的模型,并非易事。


不仅如此,整个黑产链条上的各个环节,都伴随着AI不断进化,“与时俱进”。


  • 验证码自动识别在机器大规模训练后,变得火眼金睛;

  • 从业人员在进行虚假注册后,通过AI辅助模仿正常用户来刷留存;

  • 此外,AI还被用于自动生成所需的用户资料和虚假评论内容等等;

  • 最后,AI还可以被用来探查某平台的风控规则、模型的边界和漏洞。


最新的方式是用无监督学习,这种方式目前是更有效的。”在对抗网络黄牛党这件事情上,DataVisor技术总监兼中国区负责人吴中在接受AI科技大本营的采访时,提到了新的技术对抗手段。



治网络黄牛的新招——无监督学习


据他描述,对于反欺诈的一方来说,基于固定标签和规则的传统有监督学习在应变性方面就比较弱,挖掘未知风险能力也相对较差。为了应对欺诈手段的不断进化,基于无监督学习的防欺诈技术逐渐开始实装。它能够自己学习异常账号的关联和聚集性,当欺诈者的手段出现变化或是能力出现增强之后,无监督学习的系统可以自行做出相应的改进。也就是说,一套系统就可以解决不同的欺诈行为。


为什么无监督学习会表现得相对有效呢?


吴中告诉AI科技大本营,正常用户同异常用户之间的差别,简单来说就是“坏人扎堆,好人分散”:


一般来说,正常的人是基于独立的意志和偏好在电脑或是App上进行操作。而有欺诈行为的异常用户,大部分是团伙作案,比如某犯罪团伙控制了100个用户,然后去进行批量操作。


虽然在作案过程中,黑产人员会通过一些手段来把操作掩饰得相当逼真,比如换一下设备。但是从行为模式和很多纬度上面,还是很容易漏出马脚的,比如头像很奇怪,或者前后名字不一样,抑或是时间间隔有异常……平台日志会记录用户的行为,包括他叫什么、什么时候注册、什么时候登陆、在什么时间做了什么事情、评论了谁、评论的内容是什么,等等。此后,无监督学习便通过读取所有这些数据,把相似的行为归为一组,把异常的行为甄别出来,从而判断出各种各样的欺诈行为。


而具体到网络黄牛,无监督学习又是如何发挥效力呢?


我们知道,传统的监督学习是要用黄牛抢票行为的模型来甄别异常购票行为的。但是,在倒票暴利的刺激下,他们有着极大的动力去不断变化策略,以避免被锁定出来遭受打击。这就是为什么这样的模型建立起来会相当难,而且即便是建立出来,也未必能有效应对黄牛们的新策略。


“不过,非正常的抢票、刷票行为,跟普通用户正常的在线购票终究是不一样的。”吴中继续解释到:


“一秒钟买光一车厢票”的背后,是由软件所执行的批量化操作;只有额外出钱才肯为你排队的购票平台,本质上也是靠后台软件来执行它对普通购票人群的群体控制。无监督学习,可以把这类群体性的、时常变化的抢票行为,同普通用户个体化的、相对零散的行为区分开来。它所做的可能只是读取各个用户在注册、下单、登陆等关键事件上的数据,但在下单付费的环节就能主动去拦截和封堵那些有欺诈行为的操作。



结语


技术的内容终究归技术。网络黄牛这件事情,只能是说起来轻松。就算有一些现成的技术,12306也未必能够拉起一支懂机器学习的队伍天天来跟抢票黄牛们斗智斗勇,实时监控他们的策略变动并加以应对。就算12306能做到这样,真的把黄牛封堵光了,想必还是会有很多人因为火车没了回不了家……不过到那时,铁老大就只有老老实实挨骂的份了。


那么,我们普通人买票时,到底是希望彻底地消灭黄牛呢?还是从黄牛的口中分一点残羹冷炙也无所谓?请投票表达你的想法~~





热文精选


不被邀请又怎样!马云都快买下中国AI芯片的半壁江山了,直怼腾讯和百度

听完李厂长和雷布斯在乌镇讲AI段子,我突然理解为什么这两个男人选择在一起了

Reddit热点 | 想看被打码的羞羞图片怎么办?CNN帮你解决

详解 | 如何用Python实现机器学习算法

经验 | 如何高效学Python?

深度学习高手该怎样炼成?这位拿下阿里天池大赛冠军的中科院博士为你规划了一份专业成长路径

何恺明团队推出Mask^X R-CNN,将实例分割扩展到3000类

AI人才缺失催生的“跨境猎头”,人才年薪高达300万,猎头直赚100万

Twitter大牛写给你的机器学习进阶手册


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存