查看原文
其他

提振数字经济:虚拟现实技术的历史沿革与前景剖析(下)


在上篇《提振数字经济:虚拟现实技术的历史沿革与前景剖析》中,我们解读了虚拟现实技术的技术演进,并厘清了其中的关键要素,本篇我们重点围绕如何实现产研融合进行深度解读,全方位评估这一新兴战略方向的巨大潜力。

打破重重制约 “链”动产业发展


尽管虚拟现实技术在场景应用、产业生态等方面持续扩张,取得了一系列阶段性成果。但是,这一产业仍有待解决的技术突破难题。电池技术、近眼显示技术、感知交互技术,是阻碍 VR 技术发展的三重限制。其中,除了电池技术是众多行业的底层制约外,后两者对虚拟现实领域均有特殊性。

VR 技术的三大制约因素


>> 光学技术:多项核心参数之间的矛盾

如上期所述,光学层面影响着用户的感官体验,如视场角(FOV)大小代表着光学仪器的视野范围,过低的刷新率(FPS)则会带来晕眩感等。据此进一步分析,光学层面的核心问题其实是分辨率(清晰程度)、视场角(视野范围)、重量体积(美观舒适)存在的潜在冲突。

VR 头显的光学示意图


由于 VR 设备的分屏播放、球面渲染的实际分辨率会远远低于面板的分辨率,所以对屏幕像素密度(PPI)有着较高的要求。例如,普通视频可分为480P、720P、1080P 等不同的分辨率格式,相对应的,VR 设备要进行屏幕像素对齐,视频播放率须达到8k、12k。然而,当前主流的 VR 视频流还停留在2K、4K 阶段,无法满足需求。

从 PPI 的角度来说,普通手机屏幕大约在300ppi。VR 要达到人类肉眼看手机的清晰度,则需要近眼显示屏达到2000ppi 左右,这同样是一项超出现有水平的需求。

多项难题使近眼显示方向面临两大核心问题,一方面,没有合适的屏幕承载极高的分辨率和像素密度;另一方面,不具备对视频进行解码、传输算力以及技术的能力。

>> 感知交互技术:算法精度有待提升

在感知交互方向,虚拟现实领域主要涉及两项技术:同步定位与建图技术(SLAM)、手势交互技术。

SLAM 指在陌生的环境中,能够精准建立时空对应关系,并回答“我在哪里”“这是什么地方”“我该怎么走”等问题,换言之即完成定位、建图和路径规划。

现阶段,实现 SLAM 的方式有多种,主要分为 outside-in tracking(外向内追踪)和 inside-out tracking(内向外追踪)。前者会在制定空间内部署光学定位器,例如 HTC VIVE;后者则在 VR 头显上内置若干个(一般2~4个)摄像头,基于三角定位原理计算空间位置,例如 Quest、Pico、奇遇等主流一体机。

inside-out vs outside-in


手势交互分为基于手柄的非裸手交互控制、基于摄像机视觉算法的裸手交互。其中,裸手交互的硬件方案包括 RGB 摄像头、3D 摄像头(TOF、结构光、双目视觉)和数据手套(传感器)。

可以明确的是,目前不管 SLAM 还是手势交互,均无法满足 VR 的高需求,主要技术限制存在于算法精度层面。

技术制约是产业发展的必考题,值得一提的是,就 VR 行业的技术趋势而言,虚拟现实技术已经过了“泡沫幻灭期”,进入“缓慢爬升期”,并且即将进入“稳步增长期”。

虚拟现实技术已经在国内外形成了复杂且完备的产业链,技术的价值出口已经初步打开并扩大。当前,虚拟现实技术产业链一共分为4个分段,分别是硬件、软件、内容、以及应用(场景),而每个分段又有不同的子方向构成。

虚拟现实技术产业链一览

由此可见,虚拟现实技术已经迈入了广泛的产业化进程,这是一个不可逆的、令人兴奋的进程。

释放发展动能  明确关键支撑


虚拟现实技术是信息三维化中的一环,而信息技术的载体则是内容。因此,虚拟现实产业的本质是 VR 内容的生产和消费。

从增长飞轮的维度来看,当前虚拟现实产业正处于高速运转的模式:首先需要生产更多适配场景的 VR 内容,进而通过满足消费场景来增加用户或者说服客户;待买家增多后,吸引更多 VR 内容的制作者,从而依靠技术生态支持更多基础技术及 VR 内容工具的投入,以帮助内容生产者实现降本增效,提升 VR 内容单位固定成本的盈利。

在这样的良性循环下,收益见涨,更多 VR 内容将被生产,从而开启下一次的飞轮运转。

VR 内容的增长飞轮

围绕 VR 内容的生产和消费,三大核心技术——数据三维化、交互多人化、渲染云端化打造稳固的支撑底座。

数据三维,即如何低成本地生产三维化数据,或者如何低成本地将海量现存的二维数据三维化。该技术的作用在于降低 VR 内容的生产成本。

数据三维化的核心要素是算法层面的,以及其上下游采集、定位、算力调度等技术,主要的技术要素包括:基于 GRB 的三维重建算法、GPU 加速技术(如CUDA)、通用背景抠除算法、采集设备光学能力、SLAM 算法。

一种基于多角度 RGB 图像进行三维重建的算法示意

交互多人化,即基于三维数据的感知之外,赋予 VR 内容真实的交互反馈,乃至社交体验。人的沉浸体验来自于对三维世界的感知,以及和世界的交互反馈。交互多人化的作用在于提升 VR 内容的消费体验。

交互多人化将虚拟现实技术的体验推向了虚拟的数字平行世界,是虚拟现实技术与元宇宙结合的天然衔接,其中的主要技术要素包括:大规模状态同步、视觉(虚拟形象)、语音语义、音视频、区块链、智能导航。

百度推出的首个国产元宇宙产品希壤

渲染云端化,即基于集中的、云端的算力池子进行远端计算,终端渲染。信息密度、可交互度的提升,对应的是对终端算力、显示器件的要求提升。虚拟现实技术要成为主流的大众科技,就不能囿于高性能终端,渲染云端化的作用在于扩展 VR 内容的消费场景。

渲染云端化的核心要素主要集中在大规模后台集群方向、以及音视频方向,主要包括:分布式容器、流化技术、边缘计算、音视频、5G。

百度 VR 推出的云渲染解决方案

虚拟现实技术是典型的经过长期构思、积累,最终在各项底座依赖相对成熟后,厚积薄发的技术方向。当前,作为信息三维化浪潮的核心载体技术,虚拟现实产业需求旺盛,行业应用朝着更为丰富化、多元化迈进,在产业落地的道路上稳健前行,正在逐步进入稳步发展期。

特别是,随着元宇宙概念的兴起和产品技术实践的热潮,虚拟现实技术迎来更加广阔的未来方向,那就是成为元宇宙领域的容器型基础技术。面向未来,百度智能云将持续攻关,加速虚拟现实技术落地,并为技术进步、行业发展、生态圈壮大躬身前行,驱动数字经济发展和产业转型升级!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存