Kaggle 涂鸦识别挑战赛 “Quick, Draw!” 重磅来袭
文 / 高级软件工程师 Thomas Deselaers、机器感知产品经理 Jake Walker
在线手写识别包括识别自由手写输入的规整图案。虽然 Translate、Keep 和手写输入等 Google 产品均运用此技术来识别手写文本,但实际上,这项技术适用于任何具有足够训练数据的预定义图案。除 “数字化” 手写文本以外,这项技术还可用于提高人们的绘画能力以及构建虚拟世界,它代表着一个令人兴奋的研究方向,即探索以手写作为人机交互方式的可能性。例如,“Quick, Draw!” 游戏生成了一个包含 5000 万幅绘画的数据集(从超过 10 亿幅绘画中选出),而游戏本身又为很多其他新项目提供了灵感来源。
为鼓励大家进一步探索这一令人兴奋的领域,我们推出了 Kaggle 涂鸦识别挑战赛 “Quick, Draw!”,任务参与者需要为现有的 “Quick, Draw!” 数据集构建更出色的机器学习分类器。值得一提的是,由于训练数据来源于游戏本身(在游戏中,绘画作品可以不完整,或与标签不匹配),因此参赛者需要开发一款分类器,该分类器不仅要能够运用噪声数据高效地学习,而且要能出色地处理分布情况不同的手动标记的测试集。
数据集
在原来的 “Quick, Draw!” 游戏中,程序会提示玩家绘制特定类别(狗、奶牛、汽车等)的图像。然后,玩家要在 20 秒内完成绘画,如果计算机在规定时间内正确识别出绘画,则玩家获得一分。每次游戏包含 6 个随机选择的类别。
鉴于游戏机制,“Quick, Draw!” 数据集中的标签分为以下几类:
正确:玩家按提示的类别绘画,计算机在玩家画好后才正确地识别出来。
正确,但不完整:玩家按提示的类别绘画,计算机没等玩家画完就正确地识别了出来。不完整的绘画各不相同,可能还差一点就完成了,也可能只按提示的类别绘制了一小部分。这种情况在标记为识别正确的图像中可能很常见。
正确,但计算机识别错误:玩家绘制的类别正确,但是 AI 无法识别。这时,有些玩家会补充更多细节,还有些玩家会乱画一通,然后再试一次。
不正确:一些玩家在看到某个词语的时候,脑海中会产生不同的想法,如,在 “跷跷板” 类别中,我们发现有很多人画的是 “锯子”。
除了上述标签外,我们赋予每幅画一系列笔画,而每一个笔画就是一系列接触点。虽然依靠这些笔画很容易呈现出图像,但是使用笔画的顺序和方向通常更有助于手写识别器进行识别。
开始参与
我们之前已发布过使用此数据集的教程(https://www.tensorflow.org/tutorials/sequences/recurrent_quickdraw),这次,我们将邀请社区开发人员在此基础上构建,或者采用其他方法,以达到更高的准确度。您可以访问挑战赛网站(https://www.kaggle.com/c/quickdraw-doodle-recognition),并浏览现有的内核,对数据进行分析和可视化。我们期待了解社区开发人员会在比赛中采用哪些方法,您能够在多大程度上改进我们的原始生产模型。
致谢
衷心感谢与我们协力举办这项活动的各位,特别感谢创意实验室团队的 Jonas Jongejan 和 Brenda、Kaggle 团队的 Julia Elliott 和 Walter Reade,以及手写识别团队的成员。
更多 AI 相关阅读:
· 构建 Google Dataset Search 和打造开放数据生态系统