中国西北大学和北京大学的研究结果是否将终结CAPTCHA验证码时代？

AMiner 我爱计算机视觉 2019-06-22

在互联网上进行沟通时，你如何证明自己不是机器？这是一个棘手的问题，但多年以来的解决方案就是你能够成功地读取一系列机器无法识别的扭曲字符。这种安全工具称为CAPTCHAs。

CAPTCHA项目是Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试)的简称，卡内基梅隆大学试图将其注册为商标，但2008年请求被驳回。 CAPTCHA的目的是区分计算机和人类的一种程序算法，是一种区分用户是计算机和人的计算程序，这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试。用于阻止自动垃圾邮件发送者到停止机器人在社交媒体网站上创建欺诈性配置文件的所有内容。在过去的20多年里，它已经发挥作用 - 可能到现在为止。

在中国西北大学、北京大学和英国兰开斯特大学研究人员的共同努力下，计算机科学家开发出了一种能够在短短0.5秒内破解文本CAPTCHA系统的人工智能。它已在不同的33个CAPTCHA计划中成功测试，其中11个来自世界上最受欢迎的网站，包括eBay、微软、谷歌和维基百科。该论文发表于今年的ACM会议上，并是最佳论文奖的入围者。

兰卡斯特大学计算与通信学院副教授Zheng Wang表示：“我们认为我们的研究可能会对CAPTCHA文本进行死刑判决。”

尽管已经提出了几种攻击，基于文本的CAPTCHAs1仍被广泛用作安全机制。其中一个普遍使用文本验证码的原因是很多以前的攻击是针对特定方案的，需要劳动密集型的建设耗时的过程。

但是此次研究人员开发的攻击基于深度神经网络的图像分类器。深度神经网络在图像识别方面表现出令人印象深刻。但是，成功的模型通常需要数百万个手动标记的图像才能学习。这项最新工作的新颖之处在于它使用生成对抗网络（GAN）来创建此训练数据。该系统不需要收集和标记数以百万计的CAPTCHA示例，而只需要500个就可以学习。然后，它可以使用它来生成数百万甚至数十亿的合成训练数据，以创建其成功的图像分类器。结果是比迄今为止所见的任何CAPTCHA识别器系统具有更高的精度。

这种方法对于需要大量训练数据的任何图像识别任务都是有用的。然而，CAPTCHAs在某种程度上是独一无二的，因为它们不断发展。基于文本的早期CAPTCHA是该技术的第一次迭代。但是，到目前为止，您可能更习惯于广泛使用的基于交通标志的CAPTCHA。这种不断变化使收集训练数据变得很痛苦。

这种方法意味着，当攻击者收集到足够的训练数据时，CAPTCHA计划将会发生变化，这将使这些努力无效，”Zheng Wang说。“我们的工作提供了一种以更低的成本生成CAPTCHA识别器的新方法。因此，它对CAPTCHA计划构成了真正的威胁，因为它可以更快地学习CAPTCHA解算器。”

信息来源：

https://www.digitaltrends.com/cool-tech/ai-cracks-captcha-05-seconds/

论文下载

在“我爱计算机视觉”微信公众号对话界面回复“验证码”，即可收到该论文的百度云下载地址。

加群交流

关注计算机视觉与机器学习技术，欢迎加入52CV群，扫码添加52CV君拉你入群（请务必注明:加群）：

喜欢在QQ交流的童鞋，可以加52CV官方QQ群：928997753。

（不会时时在线，如果没能及时通过验证还请见谅）

更多前沿CVML技术请浏览：

52CV精华文章分类汇总（2018年12月1日）

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

中央批准朱军同志职务调整

三联，刺痛了多少中国人

戴上这手表，不止优雅，蛇年好运连连来

古琴养身：为什么弹古琴的女人会更有气质？99%的人都不知道！