FaceX:一个包含500万张简笔画的开源人工智能训练数据集
人工智能的发展主要取决于三大要素的推进:算法、算力、以及数据。在很多情况下数据集的缺失往往成为制约人工智能发展的重要壁垒。最近,同济大学“智能大数据可视化实验室”(iDVX Lab) 开源了一个包含500余万张卡通人脸表情的高质量简笔画数据集 – FaceX。该数据集由专业设计师绘制生成,不同于以往的图像数据集(例如,ImageNet [1]),此次公开的数据全部为 SVG 格式,完整记录了设计师绘制过程中的一笔一画, 旨在帮助人工智能领域的研究人员训练高质量的绘图机器人。
https://facex.idvxlab.com
FaceX数据集的绘制过程严格遵循了相关的设计规范与准则,以保证所生成数据的质量。同时,该数据集的构建也充分考虑到了机器学习算法对训练数据多样性的需求,从性别(男、女),视角(正面、左侧面、右侧面),情绪(中立、开心、伤心、生气、害怕、惊讶、厌恶),以及绘画风格(写实、卡通、极简)四个维度全面确保数据的多样性(如图1所示) 。
图 1 : FaceX所包含的四个维度
在数据集的创作过程中,设计师们参照美学标准绘制了多样化的五官图片(图2),再根据人脸比例框架,通过组合不同的五官,最终拼合成了500余万张各不相同、并带有生动表情的卡通人脸。
图 2 : 设计师绘制的人脸五官样例
目前,FaceX数据集已被用来训练AI-Sketcher [2],一款由智能大数据可视化实验室设计开发的绘图机器人。此数据的开放希望能够进一步促进人工智能技术在艺术设计等领域的应用。更多详情与资源,请登录FaceX官方网站进行查看与下载,https://facex.idvxlab.com。
FaceX官方网站二维码
[1] Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. Imagenet: A large-scale hierarchical image database. CVPR 2009.
[2] Nan Cao, Xin Yan, Yang Shi, and Chaoran Chen. AI-Sketcher: A Deep Generative Model for Producing High Quality Sketches. AAAI 2019(accepted).
同济大学智能大数据可视化实验室(Intelligent Big Data Visualization Lab,即iDVX Lab)成立于2016年9月,是同济大学中一个横跨“设计创意学院”及“软件学院”的以信息及数据科学为研究方向的创新科研型实验室。实验室常年招收优秀硕士及博士研究生,详细信息请查阅实验室官网。
联系方式:
网站:https://idvxlab.com/
邮箱:idvx.lab@tongji.edu.cn
关注iDVx Lab,关注大数据,关注未来智能生活!
公众号二维码
官网二维码