Meta几年后才面世的黑科技，这家公司要开卖了|Codec Avatars|Persona|AI|社交|电商|娱乐|办公|虚拟人

Original 黑毛警长008 AR圈 2023-10-15

收录于合集

#Meta 22 个

#苹果 52 个

不想错过精彩内容？

1、点击上方“AR圈”；2、点击右上角“…”；3、设为星标★

一、扎克伯格在元宇宙里一小时的「真人对话」，惊艳了全世界

一度让我忘记了眼前的不是真人。

“这是我与扎克伯格在元宇宙中的对话。我与扎克伯格物理距离有上百英里，但我感觉是在和他面对面……这技术太神奇了！……一度让我忘记了眼前的不是真人。我认为这就是人们未来在互联网上交流的方式”，Lex Fridman 说道。

🔺麻省理工学院（MIT）科学家Fridman“化身虚拟人”

9月30日，麻省理工学院（MIT）科学家 Lex Fridman 与 Meta （原Facebook公司）创始人兼CEO马克・扎克伯格的一番隔空对话，成为了社交网络上的大热门。

在 Lex Fridman 播客的《首次 Metaverse 对话》中，扎克伯格展示了 Meta 的 Codec Avatars（编码化身）技术。

🔺扎克伯格与Fridman“元宇宙对话”节选

扎克伯格说，在元宇宙对话时（指Codec Avatars），“平台是在通过网络发送你形象的编码版本，这种方式比传输视频的带宽效率更高”。尽管Codec Avatars技术令人印象深刻，但扎克伯格说，“未来几年”，才能把这项技术商用。

二、Codec Avatars：Meta研发逾10年的实时虚拟人技术，距离商用尚需时日

Codec Avatars本质上是一种实时虚拟人技术，其原理包括如下5个核心部分：

1. 面部（or身体）扫描：使用摄像头（及其他传感器）对用户进行多角度扫描，获取面部（及身体）的三维几何数据。这种扫描可以使用专用的设备，也可以使用手机或者XR头显本身。

🔺早期Meta实验室中的全身扫描设备，需要171个摄像头，图源：Meta

🔺简化后的面部扫描用手机实现，图源：Meta

2. 3D建模：在发送端（XR头显），使用扫描数据训练机器学习模型，学习生成个性化的面部（和身体）模型。

3. 表情和动作捕捉：在发送端（XR头显），使用传感器和计算机视觉算法捕捉面部表情(眼睛、眉毛等)和身体动作。

🔺Codec Avatars编解码过程原理图，图源：Meta，编译：AR圈

4. 实时编码：在发送端（XR头显），使用专门的编码算法，将每个时刻的表情参数转换为编码并发送。

🔺Meta研发了专用的编解码芯片，图源：IEEE

5. 实时解码：接收端设备（另外一台XR头显），接收编码，并解码，驱动Avatar模型实时进行渲染，还原面部表情（及肢体动作）。

🔺Meta的定制芯片采用了7纳米制程，图源：IEEE

Meta对于Codec Avatars的研究由来已久。从2014年至今，Meta已经在这项技术上研究了近10年时间。

2014年，Yaser Sheikh与Michael Abrash探讨在匹兹堡建立新的研究实验室。
🔺Yaser Sheikh，美国著名的计算机视觉和机器学习专家，Meta Reality Labs研究总监
2015年，Yaser Sheikh加盟Facebook，领导匹兹堡团队。
2016年F8大会，Facebook首次展示了Codec Avatars项目。
2016年下半年，Facebook在匹兹堡成立了Facebook Reality Labs。
2017年，Facebook Reality Labs完工第一个面部捕捉工作室。
2018年，Facebook Reality Labs完工身体捕捉工作室。
2018年F8大会，展示了Codec Avatars的最新进展。
2019年，Codec Avatars的质量和实时渲染能力取得长足进步。
2019年起，Codec Avatars开始从研究向实际产品应用转化。
2022年4月，在麻省理工学院的 Virtual Beings & Being Virtual 研讨会上，Codec Avatars 团队的领导者 Yaser Sheikh 展示了该项目最新版本：“Codec Avatars 2.0”
2023年9月，扎克伯格通过Codec Avatars基于与AI科学家Fridman“元宇宙对话”，扎克伯格称该技术将在“未来几年”实现。

三、苹果版Codec Avatars：Persona，明年一季度开卖

与“惊艳全球”的Meta Codec Avatars相比，苹果却显得较为低调。苹果在6月份发布Vision Pro时，仅用40秒“偷偷地”公布了其称为“Persona”的技术。而承载Persona技术的苹果XR眼镜Vision Pro，明年一季度就会上市销售。

🔺苹果Vision Pro扫描脸部效果图，图源：苹果

苹果使用Vision Pro自带的传感器对人脸进行扫描，然后通过眼动追踪、表情识别等技术进行对人像、手势、语音等信息进行实时编码，在接收端解码后生成3D人像，其原理与Codec Avatars基本一致。

🔺苹果在23年6月份披露的的Persona技术

苹果Vision Pro之所以能够具备Persona功能，主要得益于其强大的处理器、操作系统与众多的传感器。

🔺苹果Vision Pro采用了主处理芯片M2以及协处理芯片R1以及大量的传感器，图源：苹果

🔺苹果Vision Pro搭载了4颗眼动摄像头与34颗红外LED采集眼动数据，图源：苹果

在苹果Vision Pro实现实时虚拟人之前，市面上已经有很多的专业设备提供“面部捕捉”和“动作捕捉”等虚拟人制作。从阿凡达电影到初音未来，很多虚拟人都是通过此类系统生成。

🔺传统面部捕捉系统需要复杂且昂贵的面部捕捉硬件/软件，图源：JEUXACTU

🔺传统面部捕捉系统需要复杂且昂贵的面部捕捉硬件/软件，图源：digitalmediaworld

🔺阿凡达2电影中所采用的面部捕捉系统，图源：JEUXACTU

但这类系统往往需要庞大而复杂的软硬件系统，常见的面部捕捉系统包括头戴式摄像机系统、反射点（需要粘贴在面部关键部位，辅助头戴摄像机捕捉面部运动）、计算机工作站（处理和计算大量捕捉数据的工作站）、存储设备（大容量的硬盘存储设备）以及面部捕捉数据处理和动画控制的相关软件。这些系统，一套软硬件动辄数十万美元。

相比专业系统昂贵的价格以复杂的操作要求，苹果Vision Pro 3500美金的价格和傻瓜式的操作，则显得亲民许多。

四、以苹果Persona与Meta Codec Avatars为代表的实时虚拟人技术应用场景广阔

实时虚拟人技术颠覆了传统的二维人像，它让远距离的人们仿佛身处“同一个空间”，通过虚拟化身面对面交流、观察微表情，达到前所未有的互动感和亲密感。这项技术让我们联想到了科幻作品中虚拟世界的场景，其应用前景其实远不止会议，更有望广泛运用于以下领域:

1、虚拟社交。在虚拟空间里，使用数字分身进行社交互动，大幅提高沉浸感和身临其境的体验。类似看到真人一样看到其他人的虚拟形象，会给人前所未有的代入感。

2、在线演出、互动娱乐、电商直播。虚拟演唱会、虚拟人直播在疫情期间已经兴起。艺人通过虚拟形象与粉丝互动，观众的参与感会大大提升（如初音未来、洛天依）。但传统方式生成数字偶像需要极大的投入，而苹果Persona等技术把数字艺人的制作成本大幅降低。

3、教育培训。老师能够通过虚拟化身进行融入式的远程授课，与学生面对面互动，这种沉浸感比传统的视频会议要高得多。比如在讲解某个课文中的角色时，老师或者学生可以将自己化身为课文中的角色进行互动。

4、基于虚拟化身的游戏。我们可以 “化身” 游戏人物/动物并亲身体验其中的种种情节，未来甚至可能会出现专门针对虚拟人的游戏类型。

5、数字电影制作也可大规模应用虚拟演员。这不仅能够节省成本，还能实现更多视觉效果，观众也会更加投入。

6、AI驱动虚拟人。实时虚拟人可以由真人驱动，同样可以由AI驱动。AI驱动的虚拟人，不仅可以用于上述领域，还可以进一步减少人工驱动虚拟人的成本，实现7*24小时在线。

五、结语

扎克伯格的虚拟“面对面”采访，使大众对虚拟人技术有了更多的了解和关注。而苹果则通过Vision Pro和Persona，悄然将虚拟人带给普通消费者。

仅仅再过几个月时间，在苹果Vision Pro的帮助下，即使是普通人也能亲身体验拍摄《阿凡达》所用的“黑科技”了。

警长相信，随着时间的推移，随着越来越多的普通消费者真正体验到Persona或者类似技术的魅力，这项技术不仅会改变社交的方式，也将渗透到办公、学习、娱乐等方方面面，甚至催生出崭新的生活模式。

往期推荐

Meta发布会出现直播事故，倒计时后再次倒计时，大会因未知原因推迟半小时，股价急跌急涨|Quest3上手实测视频流出

Quest 3上手实测视频|中英双语|The Verge

Quest 3官方视频泄露：鼓励儿童使用，家长可监管 | Meta | 政策 | 双刃剑

从互联网时代到元宇宙时代，简述人机交互演变的30年

iPhone支持空间视频，可能利好这些公司|Spatial Video|Stereo Video|MV-HEVC

开发者自制空间视频，成功上传苹果Vision Pro|MV-HEVC|iPhone 15 Pro|Spatial Video

99.9%的人都忽视了苹果“3D拍摄”的这个细节，你注意到了吗？|空间视频|Vision Pro|iPhone 15|激光雷达

苹果官宣：iPhone15能“3D拍摄”了|空间计算|视频|照片|音频|Vision Pro|VR|AR|眼镜

腾讯三战XR|内容|游戏|任天堂|黑鲨|寒冬|Meta|Quest|娱乐

必读：这些手机/Pad将支持3D拍摄|Lidar|Vision Pro|iOS17|发布会

重磅：苹果发布会或宣布iPhone支持“3D拍摄”，解决3D内容制作难题，助推苹果眼镜发展|Lidar|Vision Pro

这项技术或将改变XR行业发展进程|空间计算|双目|Rokid|高通|XR2+|UGC|3D视频|3D照片

苹果 visionOS 交互的近 10 年研究总结

苹果眼镜大量细节漏出，测试者表示：Vision Pro是通向未来的希望，但并非每一个人都能看到|透视|续航|舒适度|热量|FOV

实拍4K MicroOLED屏幕 | 苹果眼镜 | BOE | 创维

开发者：Vision Pro 上的 WebXR 并不完美 | 多人游戏 | 跨平台 | 混合现实

苹果眼镜能看清文字吗？| MicroOLED | Apple Vision Pro | Quest Pro

Meta明年将发布其第一代AR眼镜，视场角超微软HoloLens 2，但仅生产一千台 | 碳化硅 | 军用材料 | 美国禁运

开发者体验苹果眼镜后说：它距离完美还很远

苹果眼镜传感器相关专利洞察

美军用XR设备疑似中国产品 | MicroOLED | Goovis

4K MicroOLED Pancake来了 | 歌尔光学发布新一代Pancake模组及AR-HUD PGU模组

起死回生 | 美军IVAS 1.2赢1亿美元预算

Meta二季报披露：XR业务已累计亏损超2400亿元！扎克伯格将放弃XR？

投稿/商务/转载/合作

请联系微信：XRInstitute

点个在看你最好看

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

讲座预告 | 杨松：数据跨境流动的国际法问题

地方新规：2025年1月1日起，女性35岁前登记结婚，奖励1500元（全文）

天佑开麦再赞阿哲！阿厦爆瓜老爸三亚看阿哲！阿哲开干多元赛！

老塔申请强制执行，小白龙被限高！主播要账晨一，遭警告冻结！

Meta几年后才面世的黑科技，这家公司要开卖了|Codec Avatars|Persona|AI|社交|电商|娱乐|办公|虚拟人

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

讲座预告 | 杨松：数据跨境流动的国际法问题

地方新规：2025年1月1日起，女性35岁前登记结婚，奖励1500元（全文）

天佑开麦再赞阿哲！阿厦爆瓜老爸三亚看阿哲！阿哲开干多元赛！

老塔申请强制执行，小白龙被限高！主播要账晨一，遭警告冻结！

生成图片，分享到微信朋友圈

Meta几年后才面世的黑科技，这家公司要开卖了|Codec Avatars|Persona|AI|社交|电商|娱乐|办公|虚拟人

您可能也对以下帖子感兴趣