Kaggle 涂鸦识别挑战赛 “Quick, Draw!” 重磅来袭

Original Google 谷歌开发者 2018-12-14

文 / 高级软件工程师 Thomas Deselaers、机器感知产品经理 Jake Walker

在线手写识别包括识别自由手写输入的规整图案。虽然 Translate、Keep 和手写输入等 Google 产品均运用此技术来识别手写文本，但实际上，这项技术适用于任何具有足够训练数据的预定义图案。除 “数字化” 手写文本以外，这项技术还可用于提高人们的绘画能力以及构建虚拟世界，它代表着一个令人兴奋的研究方向，即探索以手写作为人机交互方式的可能性。例如，“Quick, Draw!” 游戏生成了一个包含 5000 万幅绘画的数据集（从超过 10 亿幅绘画中选出），而游戏本身又为很多其他新项目提供了灵感来源。

为鼓励大家进一步探索这一令人兴奋的领域，我们推出了 Kaggle 涂鸦识别挑战赛 “Quick, Draw!”，任务参与者需要为现有的 “Quick, Draw!” 数据集构建更出色的机器学习分类器。值得一提的是，由于训练数据来源于游戏本身（在游戏中，绘画作品可以不完整，或与标签不匹配），因此参赛者需要开发一款分类器，该分类器不仅要能够运用噪声数据高效地学习，而且要能出色地处理分布情况不同的手动标记的测试集。

数据集

在原来的 “Quick, Draw!” 游戏中，程序会提示玩家绘制特定类别（狗、奶牛、汽车等）的图像。然后，玩家要在 20 秒内完成绘画，如果计算机在规定时间内正确识别出绘画，则玩家获得一分。每次游戏包含 6 个随机选择的类别。

鉴于游戏机制，“Quick, Draw!” 数据集中的标签分为以下几类：

正确：玩家按提示的类别绘画，计算机在玩家画好后才正确地识别出来。
正确，但不完整：玩家按提示的类别绘画，计算机没等玩家画完就正确地识别了出来。不完整的绘画各不相同，可能还差一点就完成了，也可能只按提示的类别绘制了一小部分。这种情况在标记为识别正确的图像中可能很常见。
正确，但计算机识别错误：玩家绘制的类别正确，但是 AI 无法识别。这时，有些玩家会补充更多细节，还有些玩家会乱画一通，然后再试一次。
不正确：一些玩家在看到某个词语的时候，脑海中会产生不同的想法，如，在 “跷跷板” 类别中，我们发现有很多人画的是 “锯子”。

除了上述标签外，我们赋予每幅画一系列笔画，而每一个笔画就是一系列接触点。虽然依靠这些笔画很容易呈现出图像，但是使用笔画的顺序和方向通常更有助于手写识别器进行识别。

开始参与

我们之前已发布过使用此数据集的教程（https://www.tensorflow.org/tutorials/sequences/recurrent_quickdraw），这次，我们将邀请社区开发人员在此基础上构建，或者采用其他方法，以达到更高的准确度。您可以访问挑战赛网站（https://www.kaggle.com/c/quickdraw-doodle-recognition），并浏览现有的内核，对数据进行分析和可视化。我们期待了解社区开发人员会在比赛中采用哪些方法，您能够在多大程度上改进我们的原始生产模型。

致谢

衷心感谢与我们协力举办这项活动的各位，特别感谢创意实验室团队的 Jonas Jongejan 和 Brenda、Kaggle 团队的 Julia Elliott 和 Walter Reade，以及手写识别团队的成员。

更多 AI 相关阅读：

· 通过 Google 照片库 API 打造新体验

· 构建 Google Dataset Search 和打造开放数据生态系统

· 针对资源匮乏语言的文字转语音系统：任重而道远

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

看个病要排队两年，癌症都被拖成晚期

中共中央批准：作出对高朋逮捕决定

不仅要看已抓谁，还须一直抓到没