查看原文
其他

深度 | 道破刚需,深掘潜力,AI人脸识别进入加速落地阶段!

张慧娟 核芯产业观察 2021-01-17

这一次,并不是AI主动选择的舞台,而是时代的舞台选择了AI。


突然爆发并迅速蔓延的新冠疫情下,AI充分展现出了它在人类经历重大疾病灾害时,协助人类应对突发事件的重要价值。AI在公共视野的案例,也成为我国AI应用“多点开花”的一个缩影。如果说这场疫情是对各行各业的大考,AI这位“考生”,临场发挥可圈可点。在这场战疫终于看到曙光的时候,不妨来盘点一下,AI是如何被选中,其价值又是如何与刚需结合并走向普及化。


3月19日,电子发烧友的线上直播以“口罩人脸识别、智能测温,AI助力抗疫装备升级”为主题,邀请了百度AI技术生态部高级产品经理吴延宇、OPEN AI LAB(开放智能)产品总经理孙健峰、智慧眼公共安全技术部经理/公共安全产品总监王飞,由电子发烧友分析师张慧娟主持,就疫情下AI的挑战、典型应用场景、价值、以及未来的方向等话题进行了深入探讨,三位嘉宾分享了各自的思考和精彩观点。本次活动参会人数达到9418人。



如何同时解决体温精准检测和戴口罩识别两大关键难题?


百度AI技术生态部高级产品经理吴延宇认为,难度首先在于戴口罩会导致面部信息丢失严重,会对常规的人脸识别精度造成很大影响。另外由于口罩的种类、颜色、造型有很多,甚至大家佩戴的习惯和方式也不一样,再加上护目镜等等,都给戴口罩人脸识别增加了难度。百度通过算法拟合等手段,在未佩戴口罩的图片上绘制口罩增加训练数据,即让算法见到更多的戴口罩数据;另一方面,让算法从关注脸部的全部区域特征,改成重点关注眼部这些未遮挡区域,从而减少佩戴口罩的影响。

百度AI技术生态部高级产品经理吴延宇


高精度的体温检测主要解决了三个问题:第一是测温传感器的零漂基准,模块的测温效果一致性问题;第二是测温模组在不同温度环境下的温漂问题,以及设备内部温度上升的温度补偿;第三是在测温范围内进行二次曲线拟合提升测温的精度,并且长时间使用后的二次曲线系数变化时的问题,这点通常需要黑体配合校准,或是在设备内部做恒定的温度源校准。


OPEN AI LAB(开放智能)产品总经理孙健峰认为,要同时实现戴口罩识别和高精度测温需要克服三大挑战:首先在业务逻辑上要对齐红外摄像机和RGB可见光摄像机两个逻辑,特别是在人员数量比较多的时候,如何能够测到真正需要被测的位置。比如额头这个指定区域,通过算法进行加权测出相对稳定的温度。第二是算法逻辑方面,如何在没有足够多数据的情况下进行小样本训练,是业内比较大的一个挑战。通过增广数据,特别是基于Loss函数,通过小数据获取可以支持机器学习的大样本数据量来获取自我迭代。第三在于产业化落地,他认为瓶颈并非来源于技术本身,而是在于技术真正产业化落地时,需要实现的高性价比和产业链的分工协同。这需要算法高效地运行在各种硬件平台上,和足够长的产业链条形成深度合作,这是整个产业链需要解决的问题。


OPEN AI LAB(开放智能)产品总经理孙健峰


智慧眼公共安全技术部经理/公共安全产品总监王飞谈到,对戴口罩的人脸识别可拆解为两步,首先判断有没有戴口罩,如果没有就进行模拟戴口罩的提取;如果有则再进行精确化,对这个人的关键点进行定位、分割以及识别。在这两个情况下做对应的阈值调整,可在戴口罩露出鼻尖的情况下达到99%的识别率。

智慧眼公共安全技术部经理/公共安全产品总监王飞


实现测温的精准度方面,首先测温的部位是额头,因此进行人脸识别时先对额头进行定位,再传达给感知设备,做到了在镜头内人脸跟随多次测温,降低了测温精度的偏差。其次,为了达到大范围应用,包括高密集的应用,目前主要受距离的影响较大,感温距离在超出2.5米左右会有较大的温差。下一步,在改进算法的同时,一些作为硬件设备基础的感知设备升级,以及无接触距离的提高,都将对生产的应用价值有很大提升。


应用场景、方案类型、关键设备有哪些?


人脸识别+体温检测目前主要有哪些方案类型和典型应用场景?从系统构成上来讲,需要哪些关键设备支撑?


孙健峰解释,当前的人脸识别+体温检测设备大概分两类:第一类比较简单,可以理解为平板机的形式,通常是人脸识别门禁,其系统构成包括前端感知+算法+主板+外置等。其中,前端感知层有两类:一类是红外测温,另一类是RGB可见光摄像头,来获取人的图片信息,二者配合进行活体识别和身份验证。第二类是单体式的嵌入式设备形态,广泛存在于人流密集的地方,前端是双目摄像头(包括红外摄像头和可见光摄像头),进行快速的人员检测、抓拍、识别,在边缘或终端上进行业务和算法逻辑的实现,并且通过统一的接口传到后端平台。这类嵌入式设备的配置方式很灵活,比如用于机器人无人值守、自巡逻甚至无人机。不过应用于无人机时虽然远距离测温业务逻辑和产品形态上可以实现,但是技术挑战主要在于人的身份识别和温度区间的确认。


王飞认为主要有两大应用场景:一种是需要快速筛查,像地铁、商场、园区等;另一种是一人一证、需要实名认证,如海关、酒店、车站等。智慧眼主要面向需要快速进行高温筛查、或是快速进行闸机办理的场景。后者基本采用人证图片测温一体机,根据不同的应用场景进行检查。关键设备包括可见光摄像机、测温仪,再加上智能识别系统,以及大数据关联分析等,通过这些关键要素完成高温筛查及追踪管控。


吴延宇解释了两个不同场景下的特点和需求:一类是密集人流下的多人场景,排查效率要求较高,现在的方案采用多人脸抓拍机+终点距离的测温设备。它的构成主要是俯视角度的网络摄像头,由于视角有限,所以测温距离一般在3米左右效果较好。另外一个典型场景是单人的近距离身份核验,一般是平视的角度,距离比较近,比如园区闸机、社区人脸门禁等,使用人脸识别平板+单人的测温镜头,技术难点在于需要兼顾身份核验,同时也要完成戴口罩的人脸识别,测温距离通常为30-80厘米为主。关键设备一般是RGB可见光视频相机或人脸抓拍机,加上远红外的热感应模组,实现多人脸的测温,人脸识别的抓拍更多是为了温度的校准。近距离场景通常采用双目摄像头加中短距离的测温方案,主要完成单人测温和身份核验,核心是测温传感器,一般业内采用迈来芯、海曼等公司的模组,解决测温的精度问题,也会利用黑体来实现校准。


他补充,戴口罩人脸识别在单人的近距离身份核验中是刚性需求,虽然很多社区已有一些人脸库,但是在注册时使用的是不戴口罩的人脸数据,因此难点在于如何在不修改原有的人脸数据时,保证戴口罩下的识别率。此外,单人脸和多人脸精确的检测和跟踪,定位人脸的位置,加上对测温准确度的辅助,还有无接触的中远距离的测温、近距离的测温等功能都在实际应用层面得到了实实在在的反馈。


可见光+红外双光方案还有哪些提升空间?


目前的人脸识别+测温方案多数都是可见光+红外双光系统,未来如何提升?确保测温和定位、测温数据和人脸信息更准确、及时地匹配?


王飞从人脸识别算法云边端一体化的实现角度谈到,需要在端侧把算法融入到设备中,让端侧具有大脑的信息,能够更好地去适配。另外,需要更多更灵敏的感知模块融入到前端设备中,这样在前端就可以提升感知能力和识别的精准度。


吴延宇认为,首先是戴口罩的多人脸场景下如何准确地检测到人脸,需要将测温区域和人所在的区域,做到很好的匹配,这样整体的识别精度就会好很多。第二是辅助背景分割、人体关键点的算法,对这个区域进一步做预处理。在保证精度的情况下,硬件方面提升红外测温的帧率,采用NTP对时或同步出发的方案,减少测温目标移动带来的相位差。总的来说,AI算法在其中就是锁定被测目标的具体测温位置,更好地将红外设备的温度区域和需要测温的区域做好匹配。


孙健峰认为红外摄像头和RGB摄像头的校准,特别是自动化校准,不论是技术维度还是工程维度的提升,都会成为独到的竞争力。实现方案可能会有多种,比如基于人脸框的校准,基于图像中更多关键位置的校准,如何通过视觉的后台分析,将两个不同摄像头的图片位置进行针对性地校准、对齐,这样红外识别的额头区域位置,和真实的在RGB人脸抓拍下的位置,就能有针对性地实现对齐。


疫情突发,如何在短时间迅速推出解决方案?


吴延宇介绍,百度在人脸检测与抓拍、口罩识别方面,有长期的算法和经验积累;同时,内部的AI软硬件团队,能够快速地开发和验证多种测温硬件方案,并且结合AI算法,进行场景化的调试和调优,从而快速实现基于测温传感器的高精度测温方案。


正是基于算法和软硬件结合的完整研发链,百度能够快速提供多人脸/单人脸的测温方案,以及戴口罩下的人脸识别,综合的人群跟踪和身份识别方案,并且在高铁站、地铁站、社区门禁、园区闸禁方面,快速地实现场景化落地。


孙健峰从定义研发应用的闭环流程谈起,首先是业务需求侧的驱动下,进行底层硬件的选型,包括底层芯片以及对应的载体平台;然后通过数据的自动化/半自动化标注,实现算法的快速训练;之后对算法和硬件进行适配部署及调优,这一工作和硬件、嵌入式算法、框架高度相关,在这个过程中,能够大幅提升算法在对应硬件上的运行速度和精准度;再往下就是业务派发,实现产业化落地。OPEN AI LAB实现了平台化的能力,即从算法的维度,对底层各类硬件平台做了全系列兼容,从而能够快速实现一个算法化芯片的快速部署能力。


王飞结合智慧眼的研发经验介绍,在疫情前已经在医疗、交通、海关等场景实现了手持式的人脸识别应用,只不过是在没有戴口罩的情况下。疫情发生后,针对了人脸识别做了大量的优化,大约用了2周时间,实现了人脸识别的同时能够测体温。


人脸识别落地的挑战?今年看好哪些应用?


王飞结合视觉方面的应用谈到了人脸识别存在的挑战,例如基于视频分析时容易受到外界因素的干扰,比如光照条件、人的行走姿态、拍摄角度、以及运动状态下的模糊等,这些还需技术上继续去攻克难题。


他认为现阶段最需要立法的支持,规范在商业公司或是非政府行业的应用,相对高涉密的还需要在安全方面探讨技术以外的挑战。从大的行业应用并结合智慧眼的领域来看,王飞认为,安防、民生、养老、医疗保障等领域的应用发展会更快。


孙健峰认为人脸识别要进一步实现大规模的产业化落地,最大的限制是在非常多的差异化场景下的鲁棒性,比如如何突破在过度曝光、逆光等非常细分的工程场景下的限制。具体如何去优化?正如AI商业层面以人为核心的“千人千面”,每一个智能化的设备也是差异化的,需要基于一个大模型以及它所处的场景去适配它,提升鲁棒性。例如要识别一个处于逆光状态下的摄像头拍摄到的人像,可以通过一套自动化的程序,对采集到的数据进行二次训练,并把对应算法下发到这个设备上,这样就实现了智能设备的“千人千面”。


隐私保护和数据安全是孙健峰看到的第二大挑战。一方面需要国家或相关部门牵头,制定边界限制和相应规范;另一方面从技术的维度,通过分散式的联邦学习进行算法训练是当前的一个解决思路。即:无需把前端隐私数据传到后端,而是基于这些数据在前端的算力上训练出小的参数模型,并且把这个模型贡献到集群中心,通过成千上万的小的终端获取到足够好的综合算法,再把这个算法下发到前端,这样既保证了足够好的准确性,同时保障了隐私和数据安全,这将是未来的一个发展趋势。


他认为人脸识别应用现在已经非常成熟了,下一步要解决的就是性价比。只有把单点的智能化成本降下来,其体系化的复制和网络节点的扩展空间才更大。未来,人脸识别应用更多扮演敲门砖的角色,除了在人员管控方面进行有效识别、辅助监督之外,会在很多传统行业实现产业化落地,比如农业、电力、钢铁甚至养殖行业,来帮助提升效率,降低成本。


吴延宇认为人脸识别落地有三大难点:第一是场景的泛化能力。这包括几个要点:场景的环境条件,例如暗光、逆光、阴阳光等;大面积遮挡,比如戴口罩,还有侧面、俯视、仰视,还有模糊、分辨率低等情况,这都会影响图片获取时的效果;还有年龄的跨度,从幼儿园的小朋友到八九十岁的高龄老人,算法需要具备很好的年龄跨度的分化性;还有肤色问题,不同人群的肤色识别精度有限,这对于进一步扩展全球市场存在一定挑战;还有活体检测的能力,针对高仿模具、高仿面具,还有一些成本很高的硅胶做出来的人像,对于这种级别的攻击,人脸识别如何去抵御?或是如何辅助硬件和一些策略去抵御攻击,这方面还存在挑战。


第二在于精度问题,超大库检索虽说安防领域已经用了很久了,但是对于几十万、百万甚至千万量级的检索,直接做到一比一千万、一比三千万,在精度方面还是有问题的。例如要实现人脸支付在轨道交通方面,如何在不需要任何辅助操作的情况下,就能实现刷脸直接扣费,也是一个挑战。


第三就是行业标准,包括软硬件规范、接口规范、架构规范、交付标准规范等等,只有这些规范的陆续出台,才能保证整个行业进一步蓬勃发展。


今年所看好的应用,吴延宇主要认为包括:智慧通行。例如社区门禁、园区访客管理、楼宇的人脸门禁闸机等,这些还会更进一步地火起来,需求会更加广泛、更加深入,实现更稳定的、更精准的应用。第二类是轨道交通。包括高铁、机场、各种公共设施,以及交通运输行业,例如驾驶员的行为分析(瞌睡、打电话、疲劳提前监测等),地铁和公交的人脸支付也会成为热点。第三类是民事办理。例如远程社保的身份证明,或民政大厅的自助机,这些都会进一步得到广泛应用。涉及到3D识别、RGB、NIR的跨模态识别,还有AI镜头等等,这些技术都存在一定的应用机会。


疫情中AI落地带来哪些启示?


如何看待疫情中AI所发挥的价值?这对于在落地方面一度遭遇瓶颈的AI技术有哪些启示?


吴延宇认为AI的价值主要体现在三方面:首先传统的测温方式,在无接触情况下,一是无法精确锁定到人体的固定区,二是难以进行动态跟踪测温,尤其是人群密集的场景下。通过AI技术,实现了结合人体、人脸的相关算法,配合一定的业务策略,解决了测温的准确率和有效性问题。第二,口罩下的人脸识别应用,能够确保在需要身份核验、同时又需要测温的场景下,快速进行核验和排查,提高了防疫整体的效率和安全性。第三,如OCR文字识别、语言技术识别、肺部的影像筛查等技术,在疫情中也推进了相关的落地,在病毒的基因分析方面,百度在疫情发生后迅速开放了AI算力给相关的科研机构,提升了医疗科研工作的效率。


孙健峰结合AI产业化的特点谈到,从2015年开始,国内AI技术真正实现了产业化的落地和部署,早期AI产业化的特点更多是端到端的,大家也以此为傲,既能做芯片又能做算法,还能做应用和行业部署落地。但是在这次疫情中,由于时间非常紧迫,大家更希望整个产业链协同分工,各自贡献自己最擅长的能力。在这个过程中,机器人、视觉、语音等维度都实现了产业化落地。


为什么疫情之下才有这么多的新技术得以落地使用?AI技术还有哪些瓶颈?未来如何更好地去推进产业化?


孙健峰认为疫情对于AI落地最大的启示就是,如何共同推动AI产业化、分工协同,以及如何更高效、高性价比地实现快速产业化落地。他进一步解释,当前一个非常严峻的问题在于AI落地的成本依旧偏高,从而导致没有非常迫切的触发点的时候,AI很难切实地落地到一个细分领域。企业要想做全栈方案,前期投入很高,除非这个行业能够带来足够高的回报率,否则商业逻辑上不可行。但是如果产业链能够高度协同,就像我们现在看到的电脑一样,做芯片的、做操作系统的、做整机的、做应用软件的协作起来,整个产业才会高度繁荣,AI在万千场景下的快速产业化落地,才能更好地实现。


王飞则认为AI未来要向精细化落地的方向发展,这个方向的创新及迭代速度已经在疫情中得到验证。现实生活的需求在促进技术发展,技术既要着眼于未来,也要落地于现在。如何把技术变成我们生活生产中的工具,成为普通人都用得起、都会用的接地气的东西。


吴延宇表达了类似的观点,他认为AI落地过程中的共识,就是要紧贴业务场景特点,做到接地气,从业务中寻找痛点,才能不断地解决问题。


观看本场直播精彩回放,请点击:http://webinar.elecfans.com/504.html



声明本文为电子发烧友网原创。如需转载和入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com

更多原创文章阅读

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存