查看原文
其他

人脸识别技术综述,出自OPPO研究院

CV君 我爱计算机视觉 2023-01-12



关注公众号,发现CV技术之美





现如今人脸识别应用已经大规模走进我们的的生活,但人脸识别技术的研究仍然是计算机视觉的热点,还有哪些待解的问题?从应用的角度哪些新技术更值得关注?


向大家介绍一篇最近新出的人脸识别技术综述,作者来自工业界:OPPO研究院,其从工业应用的角度看待近年人脸识别技术的发展,值得关注。


作者信息:


论文地址:

https://arxiv.org/pdf/2212.13038.pdf


作者在文中介绍了人脸识别的历史、流程、基于传统人工设计特征或深度学习的算法、主流训练、评估数据集和相关应用。另外,作者们还尽力分析和比较了最先进的工作,通过实验研究主干大小和数据分布对系统性能的影响。


下图展示了人脸识别算法训练和推理的流程:


图一:人脸识别中的训练和推理流程


训练阶段,要经过人脸检测、人脸对齐,然后使用深度学习网络训练,提取特征。


特别值得一提的是,现如今针对人脸识别系统的攻击也越来越普遍,在人脸识别推理中,检测到人脸后,要进行系统反欺诈的真/假人脸的判断,这也成为人脸识别系统的重要标配。


人脸检测是人脸识别的第一步,现如今使用特征金字塔方法的人脸检测方法已经相对成熟,比如SRN、RetinaFace:


图二:SRN (AAAI 2019)

图三:RetinaFace (arXiv 2019)


论文中称,人脸检测的精度在实际使用中已经相对成熟,在自然视频等场景中已经可以较为准确的检测出人脸位置,而近几年的顶会也较少出现创新性的人脸检测方向论文。


人脸反欺诈已经成为人脸识别系统的必备步骤,这一步往往在人脸检测获取到人脸图像后。


图四:人脸反欺诈算法STDN (ECCV 2020)


人脸对齐(Face alignment)是为了消除人脸空间上的角度变化带来的类内扰动。但现在也有算法不再做对齐,由系统自动学习不随人脸角度变化的表示。


在训练和测试人脸识别模型部分,作者给出了一些实用技巧。比如,训练阶段,数据的增广是真实有效的,加噪声、模糊、颜色改变均可在训练阶段提高系统性能。而随机对人脸图像裁剪则应尽量避免,因为会破坏人脸对齐的结果。而水平人脸翻转在训练阶段可以认为是数据增广,在测试阶段则可讲翻转前后图像输入模型,得到的结果取平均,这可以进一步提高性能。


在算法部分,作者重点介绍了 designing loss function 设计Loss函数, refining embedding 嵌入提精, FR with massive IDs 大ID数据量的人脸识别, Cross domain in FR 跨域人脸识别, FR pipeline acceleration 人脸识别加速方法, close-set training 闭集人脸识别训练,Mask face recognition 带口罩人脸识别 ,Privacy-Preserving FR 隐私保护的人脸识别。



作者研究了主干网络对系统性能的影响,发现网络越“大”,当样本不断增多的时候,精度提升的潜力越大。


不同主干尺寸的模型在LFW、AgeDB、CFP-FP和IJB-C测试数据集上的结果


同时,作者研究了标注样本规模对系统识别性能的影响,发现随着样本规模越大,单个个体采样越多,系统性能不断提升,但到达一定程序,精度增长有限。

LFW、AgeDB、CFP-FP和IJB-C的结果。N S意味着相应的数据集有N个身份,每个身份有S个样本。

不同比例的长尾数据在LFW、AgeDB、CFP-FP和IJB-C上的结果


下表,总结了人脸识别相关的训练数据集信息:


表1 关于FR的训练数据集信息


人脸识别测试数据集信息:


表2 关于FR的测试数据集信息


表3 在简单基准上的验证精度(%)


表4 在IJB-B和IJB-C上的验证精度(%)


作者也介绍了人脸识别相关应用,比如人脸聚类、人脸属性识别、人脸生成等


最后作者总结了人脸识别相关竞赛,比如 FRVT、MegaFace challenge、MS-Celeb-1M challenge。


整体上感觉人脸识别已经到了技术相对成熟、应用落地的程度,这份综述可作为人脸识别近期进展的概览和相关技术研发的参考。


https://arxiv.org/pdf/2212.13038.pdf


END




欢迎加入「人脸识别」交流群👇备注:Face






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存