人脸识别技术综述,出自OPPO研究院
关注公众号,发现CV技术之美
现如今人脸识别应用已经大规模走进我们的的生活,但人脸识别技术的研究仍然是计算机视觉的热点,还有哪些待解的问题?从应用的角度哪些新技术更值得关注?
向大家介绍一篇最近新出的人脸识别技术综述,作者来自工业界:OPPO研究院,其从工业应用的角度看待近年人脸识别技术的发展,值得关注。
作者信息:
论文地址:
https://arxiv.org/pdf/2212.13038.pdf
作者在文中介绍了人脸识别的历史、流程、基于传统人工设计特征或深度学习的算法、主流训练、评估数据集和相关应用。另外,作者们还尽力分析和比较了最先进的工作,通过实验研究主干大小和数据分布对系统性能的影响。
下图展示了人脸识别算法训练和推理的流程:
图一:人脸识别中的训练和推理流程
训练阶段,要经过人脸检测、人脸对齐,然后使用深度学习网络训练,提取特征。
特别值得一提的是,现如今针对人脸识别系统的攻击也越来越普遍,在人脸识别推理中,检测到人脸后,要进行系统反欺诈的真/假人脸的判断,这也成为人脸识别系统的重要标配。
人脸检测是人脸识别的第一步,现如今使用特征金字塔方法的人脸检测方法已经相对成熟,比如SRN、RetinaFace:
图二:SRN (AAAI 2019)
图三:RetinaFace (arXiv 2019)
论文中称,人脸检测的精度在实际使用中已经相对成熟,在自然视频等场景中已经可以较为准确的检测出人脸位置,而近几年的顶会也较少出现创新性的人脸检测方向论文。
人脸反欺诈已经成为人脸识别系统的必备步骤,这一步往往在人脸检测获取到人脸图像后。
图四:人脸反欺诈算法STDN (ECCV 2020)
人脸对齐(Face alignment)是为了消除人脸空间上的角度变化带来的类内扰动。但现在也有算法不再做对齐,由系统自动学习不随人脸角度变化的表示。
在训练和测试人脸识别模型部分,作者给出了一些实用技巧。比如,训练阶段,数据的增广是真实有效的,加噪声、模糊、颜色改变均可在训练阶段提高系统性能。而随机对人脸图像裁剪则应尽量避免,因为会破坏人脸对齐的结果。而水平人脸翻转在训练阶段可以认为是数据增广,在测试阶段则可讲翻转前后图像输入模型,得到的结果取平均,这可以进一步提高性能。
在算法部分,作者重点介绍了 designing loss function 设计Loss函数, refining embedding 嵌入提精, FR with massive IDs 大ID数据量的人脸识别, Cross domain in FR 跨域人脸识别, FR pipeline acceleration 人脸识别加速方法, close-set training 闭集人脸识别训练,Mask face recognition 带口罩人脸识别 ,Privacy-Preserving FR 隐私保护的人脸识别。
作者研究了主干网络对系统性能的影响,发现网络越“大”,当样本不断增多的时候,精度提升的潜力越大。
不同主干尺寸的模型在LFW、AgeDB、CFP-FP和IJB-C测试数据集上的结果
同时,作者研究了标注样本规模对系统识别性能的影响,发现随着样本规模越大,单个个体采样越多,系统性能不断提升,但到达一定程序,精度增长有限。
LFW、AgeDB、CFP-FP和IJB-C的结果。N S意味着相应的数据集有N个身份,每个身份有S个样本。
不同比例的长尾数据在LFW、AgeDB、CFP-FP和IJB-C上的结果
下表,总结了人脸识别相关的训练数据集信息:
表1 关于FR的训练数据集信息
人脸识别测试数据集信息:
表2 关于FR的测试数据集信息
表3 在简单基准上的验证精度(%)
表4 在IJB-B和IJB-C上的验证精度(%)
作者也介绍了人脸识别相关应用,比如人脸聚类、人脸属性识别、人脸生成等
最后作者总结了人脸识别相关竞赛,比如 FRVT、MegaFace challenge、MS-Celeb-1M challenge。
整体上感觉人脸识别已经到了技术相对成熟、应用落地的程度,这份综述可作为人脸识别近期进展的概览和相关技术研发的参考。
https://arxiv.org/pdf/2212.13038.pdf
END
欢迎加入「人脸识别」交流群👇备注:Face