查看原文
其他

【知识星球】这几年人脸都有哪些有意思的数据集?

言有三 有三AI 2020-09-07

欢迎大家来到《知识星球》专栏,人脸一直是整个图像领域里最大的方向,最近几个月咱们在知识星球里分享了非常多的这几年新出的人脸数据集,简单介绍其中几个如下。



作者&编辑 | 言有三

有三AI知识星球-数据集

MeGlass

MeGlass是一个仿真的带眼镜的人脸识别数据集,包括1710个人的14 832张有眼镜图和33087张无眼镜图,各自至少有两张。

作者/编辑 言有三

眼镜对人脸识别问题会造成一定的困扰,MeGlass是一个仿真的戴眼镜人脸识别数据集,包括1710个人的14 832张有眼镜图和33087张无眼镜图,所有的图片来自于MegaFace。


统计信息如下:

一些图片案例如下:

参考文献

[1] Guo J, Zhu X, Lei Z, et al. Face synthesis for eyeglass-robust face recognition[C]//Chinese Conference on Biometric Recognition. Springer, Cham, 2018: 275-284.

有三AI知识星球-数据集

Makeup Transfer

Makeup Transfer是一个妆造迁移人脸数据集,有3384张女性人脸图。

作者/编辑 言有三

Makeup Transfer包括3834张女性人脸图,其中1115张无妆造人脸,2719张有妆造人脸。妆造类型包括不同程度的烟熏妆(smoky-eyes makeup style), 华丽妆(flashy makeup style),复古妆(Retro makeup style),韩式妆(Korean makeup style)以及日式妆(Japanese makeup style)。

参考文献

[1] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//Proceedings of the 26th ACM international conference on Multimedia. 2018: 645-653.

有三AI知识星球-数据集

DFW 

DFW(Disguised Faces in the Wild)是一个妆造和伪造人脸数据集,有1000个人的11157张图。

作者/编辑 言有三

DFW是IBM发布的一个妆造人脸数据集,有1000人的11157 张图片,主要包括遮挡和伪造人脸。每一个人都有一张正脸图,其中903张人有一个验证图,两者构成正常的人脸验证对。所有1000个人都有一些包括妆造图,874个人有一些被识别成该人(故意的或者非故意的)的伪造图,最终总共1000张整成图, 903张验证图,4814张妆造图, 4440张伪造(另一个人)图。

上图是一些样本,第一张是正常图,黄色底色是验证图,绿色底色是妆造图,蓝色底色是伪造(另一个人)图。


参考文献

[1] Kushwaha V, Singh M, Singh R, et al. Disguised faces in the wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2018: 1-9.

有三AI知识星球-数据集

Cartoonset10k/100k

Cartoonset10k/100k是一个漫画人脸数据集,包括100000张具有不同艺术风格的人脸头像,可以用于人脸风格化等应用。

作者/编辑 言有三

CartoonSet10k和CartoonSet100k,分别包含10000和100000张卡通人脸图。每一张卡通人脸图都有16个组件,其中12个面部属性和4个颜色属性。


下面是它的样本和属性标注,其中csv内容每一行是名字,属性index,以及该属性的种类。

参考文献

[1] Royer A, Bousmalis K, Gouws S, et al. Xgan: Unsupervised image-to-image translation for many-to-many mappings[M]//Domain Adaptation for Visual Understanding. Springer, Cham, 2020: 33-49.

有三AI知识星球-数据集

FairFace

由于当前很多的人脸数据集中存在人种的不均衡,比如白人居多黑人居少,fairface建立了一个更加均衡的数据集。

作者/编辑 言有三

目前很多开源数据集中人种比例非常不平衡,下面是一个统计。

针对这个现象,FairFace数据集被整理出来,它是一个人脸属性数据集,共包括white,black,Indian,East Asian,Southeast Asian,Middle East以及Latino7类人种,图片来源于YFCC-100M Flickr数据集,标注属性包括人种(race),性别(gender),年龄组(age group)。


数据集共有108501张图,和其他数据集对比一览如下:

参考文献

[1] Kärkkäinen K, Joo J. FairFace: Face Attribute Dataset for Balanced Race, Gender, and Age[J]. arXiv preprint arXiv:1908.04913, 2019.

除了上面这些,我们还分享了数十个各种各样的大型小型人脸数据集,下面是其中一些预览案例,供感兴趣的你获取,所有数据集在星球中提供下载,经常会更新!

6 关于数据集

有三AI知识星球是我们继公众号之后重点打造的原创知识学习社区,其中数据集板块专注于给大家介绍重要数据集和新奇好玩的数据集,包括


(1) 经典大型数据集,ImageNet,CityScape,AffectNet,AVA等。

(2) 各类新奇好玩的数据集,等你来发掘啦。


超过1T的资源,还可以进行数据集求助!希望你喜欢。

知识星球其他内容板块如下,强烈建议不熟悉的同学读一下以下的生态介绍(最近快一周年,加入半价噢,年费低至138!)


【杂谈】为什么邀请大家加入硬核知识星球有三AI

【年终总结】2019年有三AI知识星球做了什么,明年又会做什么


以上所有内容

加入有三AI知识星球即可获取

来日方长

点击加入

不见不散

更多精彩

每日更新



转载文章请后台联系

侵权必究

往期精选


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存