起底 3D 深度摄像技术,看智能手机厂商如何攻下爆发前夜第一城 | 特稿
- shenzhenware -
伴着苹果 iPhone X 的问世,3D 深度摄像头也成为智能手机厂商追逐的热潮,国内华为、OPPO、小米等品牌均在与 3D 传感器厂商接洽。11 月 28 日,华为推出最新款 AI 手机荣耀 V10 更是配备了 3D 面部识别功能,并自称面部识别功强过苹果的 Face ID 功能。
本文中,深圳湾(微信 ID:shenzhenware)对 3D 深度摄像技术原理、在智能手机上的应用和技术难点、主流方案商及未来趋势等问题,做了深度解读。
▎领跑安卓阵营,华为挑战苹果 Face ID
与 iPhone X 直接将 3D 深度摄像系统集成到了手机头部不同,荣耀 V10 的 3D 面部识别功能需要依靠一款名为 Jupiter X 的配件——华为称之为「点云深度摄像头」的辅助,这是一款号称是全球首款「散斑结构光」手机配件。
Jupiter X
据荣耀介绍,这款点云深度摄像头与苹果的 iPhone X 一样,采用的是散斑结构光技术。其点阵发射器可以发射出 30 万的散板点阵(据说是 iPhoneX 的 10 倍),可以支持 3D 人脸建模和 3D 人脸识别。在 400ms 内即可完成 3D 人脸识别,3D 建模只需 10 秒,建模精度可以达到亚毫米级。
由于这款点云深度摄像头的存在,使得荣耀 V10 可以体验类似 iPhone X Animoji 一样的 3D 面部表情。同时,点云深度摄像头还可支持 3D 小物体建模。
华为 Jupiter 解剖图
单纯从外形看,Jupiter X 更像是一个独立于手机系统之外的配件,但不可否认的是,这款配件是当下除了苹果 TrueDepth 摄像头之外唯一应用在手机上的 3D 人脸识别产品,可以说华为已经是安卓阵营的领跑者了。
▎三种 3D 深度摄像主流方案,为什么苹果独爱红外 3D 结构光?
目前主流的 3D 深度摄像有结构光、TOF、双目成像 3 种主流方案。
结构光(Structured Light):结构光投射特定的光信息到物体表面后,由摄像头采集。根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。
TOF(Time Of Flight):TOF 系统是一种光雷达系统,可从发射极向对象发射光脉冲,接收器则可通过计算光脉冲从发射器到对象,再以像素格式返回到接收器的运行时间来确定被测量对象的距离。
双目成像(Stereo System):利用双摄像头拍摄物体,再通过三角形原理计算物体距离。
结构光、TOF、双目成像方案的对比,资料由深圳湾整理
这三种方案中,双目测距成像因为效率低、算法难、精度差、容易受到环境因素干扰;TOF 方案同样有精度缺陷,传感器体积小型化之后对分辨率影响大。
而苹果 iPhone X 采用的是红外结构光方式,iPhone X 前置 3D 摄像头模组配有 Dot Projecter (点投射器)和 Infrared Camera(红外线相机)。
iPhone X 前置 3D 结构光摄像模组
▎Kinect 出来 8 年之后,为什么手机才开始引入 3D 深度摄像头呢?
苹果 iPhone X 和华为荣耀 V10 所使用的 3D 深度摄像头均可以看作 Kinect 的微缩版——早在 2009 年,微软便推出了 Kinect,将 3D 深度摄像头大规模应用到消费电子产品上。但一直到了不久前,苹果推出 iPhone X,才有了 3D 摄像头在智能手机上的应用。
然而,这对苹果来说依然是一次非常有难度的技术挑战——先是了陆续收购 Prime Sense、Polar Rose、Faceshift、Flyby Media 等一大批 3D 感知识别相关的技术公司,同时也历经了 5 年的潜伏研发。(点击链接,查看苹果 3D 摄像头的深度报道)
3D 摄像头模组要想实现小型化并在手机上应用,RGB 模组相对来说比较容易,而激光投影模组,红外投影模组和主芯片这三个核心部件则较为棘手。
苹果的这一技术实现,首先要归功于半导体技术的密度提升,使得微型红外激光发射器可以做得很小,以 iPhone X 的公布的参数来看,在不到 25 平方毫米的空间集成了 3 万多个红外激光投射点。
另一方面则是手机运算能力的提升。3D 深度成像除了器件本身以外,实时运算中资源消耗非常大。例如为了满足运算力需求,XBox 360 采用了 8 核处理器,12 组 GPU 运算单元, 768 个流处理器,及 8G 内存空间的硬件配置。
在早年手机芯片的运算能力还不那么强大的时候,要做这个实时运算手机很快就会崩溃,而 iPhone X 和华为荣耀 V10 都是采用自家专门设计的 AI 芯片,特地针对 3D 深度成像设立独立单元做运算,这就保证了在手机上做 3D 面部识别的效率。
上面也提到过,为了提高识别能力,苹果采用的是 3D 红外结构光。但传统红外摄像头基本不能感应到 940nm 波长的红外线,为了避免阳光中红外分量的影响,iPhone X 采用了与之等波长的 940nm 红外线。
为了做到这一点,苹果曾在今年 7 月收购了一加名为 InVisage 的公司。这家公司具有一项名为 QuantumFilm (量子薄膜)的技术,能够让红外摄像器感应范围大大提升。
这大概是 iPhone X 是目前业内唯一一家能将 3D 摄像模组小型化并集成到手机中的主要原因,其他公司只能暂时望洋兴叹了。
▎国内,华为、OPPO、小米均在接洽 3D 传感器厂商,他们都是何方神圣?
在手机身份验证技术方面,人脸识别已经成为继指纹识别之后新一波手机厂商追逐的热潮。而像锤子、OPPO、vivo 等人脸识别解锁方案其实是基于前置摄像头的 2D 人脸识别,只能作为指纹及密码解锁的辅助功能,尚无法与 3D 深度摄像头相提并论。
此前有爆料称,华为、OPPO 和小米已经在与包括大立光电( iPhone 传感器供应商之一)、舜宇光学、奥比中光和奇景光电在内的多家公司接洽,商讨为它们未来的产品生产 3D 感知传感器事宜。
荣耀 V10
而由高通、奇景光电和信利光电联合开发的 3D 感知模块已经在 OPPO 和小米进行评测,预计这两家公司将尝试为 2018 年发布的手机配置 3D 感知模块。
另外也有业内人士称华为荣耀 V10 的 3D 成像模组是由舜宇光学提供。舜宇光学为华为提供了包括光学设计、结构设计 、ID 设计、图像处理等嵌入式软件系统开发在内的一整套解决方案(舜宇光学也是华为 P9 的镜头供应商)。
由于 Face ID 的人脸解锁功能也有其局限性,例如:在黑夜中或有红外线干扰的情形下很容易失灵,如果感冒戴了口罩也无法识别,以及相似度高的双胞胎有误判的可能性。
因而我们可以看到华为荣耀 V10 并没有像 iPhone X 那样去掉指纹识别,当屏下指纹技术成熟的时候,相信苹果还是可能会将指纹识别放回 iPhone 的。
目前制约结构光模组在智能手机上应用的主要问题依然在于模组的小型化,此前有分析师预测,其他手机厂商可能两年后才会用上与 iPhone X 一样的 3D 结构光模组。不过,从目前国产厂商的进度来看,华为已经率先做出了尝试,其他国产手机厂商也很可能在明年上半年推出内置 3D 结构光模组的智能手机。
▎几家公司的解决方案的介绍:PrimeSense(苹果)、微软、Intel、奥比中光,算法各有差异
可以看到,苹果、微软 、Intel 等国外巨头在近几年都集中通过并购的手段获取 3D 深度成像技术。深圳湾对以下几家主流的 3D 摄像公司及产品方案进行了梳理。
Prime Sense(已被苹果收购)
Prime Sense 可以算是 3D 传感技术「鼻祖」了,2005 年创立于色列;2006 年宣布完成 3D 感应芯片的研发,并推出一个装载 Prime Sense 3D 传感器的 RGB 红外相机;2013 年发布了当时世界上最小的 3D 传感器 Capri,同年,被苹果以 3.6 亿美元的价格收购。
微软 Kinect 一代使用的就是 Prime Sense 提供的技术。在被苹果收购之后,Prime Sense 便停止对外授权,并销声匿迹多年,直到最近以 3D 深度摄像头的形式出现在 iPhone X 上。可以看到并入 Apple 之后 ,Prime Sense 的技术得到了提升,同时 Face ID 算法也被整合到 Apple 的芯片中。
微软 Kinect
2009 年,微软推出首款基于 Prime Sense 的 Kinect,用来作为 Xbox 360 的周边辅助设备。这款产品上市后 60 天便卖出 800 万台,创造了吉尼斯消费电子销售速度记录。
Kinect
Kinect 使用一种名为光编码(Light coding)的技术,与传统结构光方法不同的是,它的红外光源抛射的不是一幅周期性变化的二维图像编码,而是一个具有三维纵深的「体编码」,这种光源叫做激光散斑(laser speckle),是当红外激光照射到物体后形成的随机衍射斑点。
在苹果收购 Prime Sense 后,微软推出自研芯片的第二代 Kinect,开始采用 TOF 结构光方案。Kinect 在 Xbox 平台运行了多年,并通过开放 SDK 积累了不少开发者。
遗憾的是,尽管曾经风光无限 , Kinect 却伴随体感游戏的衰落而日渐式微,已于今年 10 月宣告停产。
Intel RealSense
2014 年,Intel 在 CES 上宣布推出 Realsense,主要应用在 Intel RealSense 也提供了开发套件,目前已经公布了 R100、R200 及 F200 三种摄像头。只是相较 Kinect 而言,Intel RealSense 精度不够高,比起 LeapMotion 第二代(应用了红外结构光)还要差一些,只能近距离使用,建议不超过 1 米。
植入 Realsense 的 Intel 样机
不同于 Kinect 的全身骨骼跟踪,Realsense 更注重近距离的脸部、手部跟踪,所以可以毫无违和感地与笔记本、超极本捆绑在一起。
奥比中光 Astra
奥比中光成立于 2013 年,是国内最早从事 3D 传感摄像头研发的企业之一,于 2015 年相继量产了 Astra、Astra Pro、Astra mini 等 3D 深度摄像头,据称是目前继苹果、微软、英特尔之后全球第四家可以量产消费级 3D 结构光深度摄像传感器的厂商。
奥比中光在 2017 高交会上展出的 Astra 3D 体感摄像头
奥比中光研发的 Astra 3D 体感摄像头可实现人脸识别、手势识别、人体骨架识别、三维测量、环境感知、三维地图重建等数十项功能,相继应用在天猫魔盒、惠普 Sprout 2 产生。目前该家摄像头在电视机体感方面处于垄断地位,创维、康佳、爱奇异、暴风影音 、TCL 等电视机厂商的 3D 体感游戏也都是用的奥比中光摄像头。
▎结语:手机只是一个开始,未来 3-5 年是技术爆发期
人脸识别是人工智能最火热的领域之一,在短短几年里国内便崛起了商汤科技、Face++ 等一批 2D 图像识别独角兽公司。而在 iPhone X、华为等手机厂商的推动下,深度视觉技术正向更加精准的 3D 人脸识别推进。
然而 3D 深度摄像头的应用远不止人脸识别,还有 AR。据外媒报道,除了保留前置 3D TrueDepth 摄像头,苹果还将在 2019 年为 iPhone 配备后置采用 TOF 技术的 3D 传感器,用于提升 AR 体验。
随着巨头的积极布局以及技术的逐渐成熟,在可预见的未来,3D 深度传感技术还将应用到自动驾驶、电视 、AR/VR、机器人、无人机、智能家居、智能安防等多重领域。因而有业内人士预测智能手机上的应用只是一个开始,3D 深度传感技术未来还将迎来 3-5 年的技术爆发期,目前正处在一个很好的时间窗口。
市场对于深度视觉技术的需求趋于井喷,但国内能独立提供 3D 深度摄像模组整机产品及方案的厂商却寥寥无几,大都是单一的传感器配件厂商。另外国内独立厂商在软件配套开发上也还比较落后,如果能够进一步开放,在软件上提供套件给到更多开发者,将会极大促进 3D 传感产业的发展速度。■
特别感谢:
感谢深圳湾技术专家廖泽立(Jimmy Liao)为本文提供了 3D 结构光相关技术解读。
廖泽立,智能硬件超级玩家和资深技术专家,JIMTECH 创始人,同时担任深圳湾特聘技术专家、华为 2012 实验室合作伙伴、MIoT 合作伙伴。智能硬件领域连续创业者,擅长以产品经理思维来整合技术专业知识。操手过不同品类智能硬件研发、制造工作,包含智能穿戴、智能家居、智能户外产品等。
主笔:谈哲 / 深圳湾
编辑:小琳 / 深圳湾
技术顾问:廖泽立 / 深圳湾的好朋友
· ● 推荐阅读 ● ·
· ● 深圳湾招人啦!● ·
深圳湾招人啦!!!深圳湾正在招聘「真知灼见的科技记者」、「四通八达的运营编辑」、「才华横溢的市场策划」、「技能爆表的活动运营」、「热情四射的社区达人」,如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!
简历传输门👉 s@shenzhenware.com
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。