查看原文
其他

使用 Open Images Extended 增加图像多样性

Google 谷歌开发者 2019-02-15

文 / Anurag Batra 和 Parker Barnes,Google AI 产品经理

前不久,我们推出了 Kaggle 包容性图像竞赛,这是神经信息处理系统大会 (NeurIPS) 2018 年竞赛赛项的一部分,旨在推动关于训练数据集中地理倾斜对 ML 模型性能的影响的研究,同时激发创新,开发更具包容性的模型。竞赛的帷幕已然落下,但构建多样化数据集的更广泛运动才刚刚开始。 

我们将发布 Open Images Extended,这是 Google Open Images 数据集的一个新分支,我们希望它能成为一个补充数据集集合,收集更多能够更好地代表全球多样性的图像和/或注释。我们首先要添加的是 Crowdsourced 扩展数据集,其中包含由全球各地 Crowdsource 应用用户提供的图像,总量超过 478000 张。 



关于 Open Images Extended 的 Crowdsource 扩展数据集

为了促进 Open Images 的地理多样性,我们发动全球各地的 Crowdsource 应用用户拍摄身边的世界,并将这些照片作为 Open Images Extended 数据集的一部分提供给研究人员和开发者使用。大多数图像来自印度,有些具代表性的图像来自中东、非洲和拉丁美洲。 

这些图像聚焦一些主要类别,例如家用物品、动植物、食物以及各行各业的人(为保护隐私,所有人的面部均作了模糊处理)。您可以在 https://ai.google/static/documents/datasets/open-images-extended-crowdsourced.pdf  找到关于数据集构成的详细信息。


来自印度和新加坡的图片,由 Crowdsource 应用用户供稿



参与计划

这只是万里长征迈出的第一步。要打造具有包容性的 ML 产品,训练数据必须从多个维度展现全球多样性。为此,我们邀请全球社群提供您家乡和社区的影像,帮助扩展 Open Images Extended 数据集。快来下载 Crowdsource Android 应用,投出您用手机拍摄的图片。



致谢

Open Images Extended 之所以能成功发布,离不开许多人的勤勉工作,包括但不限于以下人士(以姓氏字母排序):James Atwood、Pallavi Baljekar、Peggy Chi、Tulsee Doshi、Tom Duerig、Vittorio Ferrari、Akshay Gaur、Victor Gomes、Yoni Halpern、Gursheesh Kaur、Mahima Pushkarna、Jigyasa Saxena、D. Sculley、Richa Singh、Rachelle Summers。



更多 AI 相关阅读:

NeurIPS 2018 “时间检验奖”:《大规模学习的权衡》

在 Pixel 3 手机上学习预测深度

深度学习,提高前列腺癌诊断正确率




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存