颠覆！3分钟，做个“人”吧！

罗茂林上海证券报 2022-04-05

权威、深度、实用的财经资讯都在这里

未来，想做一个虚拟人需要多大投入？图像处理器芯片巨头英伟达给出的答案是：一段语音，3分钟时间。

日前，在英伟达举行的一场线上论坛中，一项可能颠覆大众想象的“黑科技”引发热议。当虚拟人制作门槛不断降低时，AIGC（AI生产内容）将成为可能。

这可能是传媒行业又一次技术的颠覆，也可能构成元宇宙未来的新图景。

3分钟“造人”

只需要一段语音，软件就能自动匹配口型生成一位口播数字人。如今这一愿望已然成为现实。此前，英伟达在其元宇宙平台Omniverse上亮相的Audio2face功能，一经推出便引发业内热议。日前，英伟达组织了一场线上论坛，向观众们展示了这项技术。

记者注意到，演示中，只需要往操作界面中导入一段音频文件，系统就会自动生成一个拥有丰富面部表情的3D白色模型，这一模型说话的口型与面部肌肉呈现都很自然，整个过程耗时不到3分钟。

“这套系统借助了英伟达深度学习的AI技术，”据相关负责人介绍，自然人讲话是一个相当复杂的面部运动，“比如说女生讲话，眉毛挑动的幅度可能更大，因此在适配不同的语音时，模型的面部肌肉都会有所不同。”

值得注意的是，在软件可视区域生成的模型，本身也被嵌套在英伟达整个超写实数字人的生产链条之中。“在整个Omniverse平台上，不同的组建之间是标准模块化的，因此在Audio2face软件中也可以通用。”据了解，该软件中提供了常用的3D建模功能选项，以便设计师调整设计和渲染。

“总体来看该软件比较庞大，选项功能和工具非常多，从设计到渲染，覆盖整个流程。”有试用者表示，“这并不仅仅像是一个音频驱动人脸动画的软件，更像是一个艺术设计平台，它让我们更多相关的3D建模动画制作工作更容易实现。

传媒行业将遭新颠覆？

“英伟达此次Audio2face一个很引人瞩目的点，就在于其全流程和低代码性。”一位业内人士指出，如今低代码和无代码的开发平台日益成为行业发展的主流，这将使得相关领域开发门槛大幅降低。“如果一个虚拟人的制作只需要一个人花上两三天就能完成，那么将为行业带来巨大的商业空间。”

一个典型的例子便是手语主播。据英伟达相关负责人介绍，目前国内各地手语具有区域性，因此普及国标手语任重道远。“这其实就是虚拟数字人非常好的应用场景，我们现在有技术能做到，只需要输入文本，虚拟人就会自动根据文意，按照标准手语进行演示。”这无疑将大大降低普及成本。

开发门槛和成本的迅速降低，让数字人有了巨大的应用场景。有业内人士指出，这其中AIGC（AI生产内容）的崛起，或许对媒体行业而言又是一次颠覆性的技术。

“大众对于内容的消费需求是没有止境的，因此内容损耗比一直都是整个行业需要面对的问题。”一位传媒分析师指出，回顾过去就会发现，历次传媒技术变革的背后，都是内容生产力的一次指数型爆发。

媒体行业之前是由专业生产者创造内容，此后变成用户产生内容，未来可能是人工智能生产内容。

“你可以把这类平台看做当年的互联网技术。”该分析师称，互联网让信息传播的门槛降低，从而让媒体由PGC（专业生产者生产内容）逐渐过渡到如今的UGC（用户生产内容）时代，而随着虚拟人等技术的成熟，不受时空制约的AIGC或将成为UGC后的重要内容生产力。

事实上，近年来各大媒体也纷纷上线了各类虚拟主播。比如新华社率先试水24小时数字主播，接着湖南卫视推出了综艺的虚拟主持人。“我认为第一阶段，是虚拟人将替代传统媒体中那部分重复性工作，比如快讯播报等等，从而大大降低日常运营成本。”一位行业分析师认为，新闻内容消耗速度极快，因此用数字人替代将极大降低成本，同时进一步增加内容供给。

并且，随着相关技术日渐成熟，数字分身与虚拟现实技术将为个性化定制提供可能。“我们可以畅想一下，以后每个观众也有自己的虚拟形象，那么对于新闻报道他就成为了参与者。”该分析师认为，从读者到观众，再到参与者，数字分身让新闻消费者的身份再次迭代，更加沉浸感的体验，或许会为传媒行业发展带来新思路。

元宇宙远景已现

多模态数字人技术的日渐成熟，让元宇宙的愿景逐步有了具体的落地对象。

所谓多模态数字人，指的是应用了包括语言、表情、动作等多项自然人特征于一身的虚拟人，这其中，更为抽象的“个性”与“性格”则是行业发展的难点。

不过如今，科技巨头们已经开始了这一领域的探索。试图真正做到“不仅知人知面，还要知心”。

据英伟达相关负责人介绍，“每个人讲话的风格是不一样的，包括他的停顿、语调、面部微表情等等，因此大数据无差别采集运算最终就会生成没有个性的‘平均脸’，而我们定向采集某人的一些数据，经过AI深度学习后，就会摸索出这个人的说话风格，实现虚拟人的个性化表达。”

当数字人开始逐步拥有个性，超现实的临界点或许就会被打破。

“我认为，随着虚拟人在语言、神态、动作等方面的日臻完善，未来虚拟数字人或许会朝着数字伴侣的方向发展。”一位业内人士认为，这也正是一幅元宇宙的远景。

不过遥望未来，或许技术还有很长的路要走。“目前来看，我们在算力等方面还有巨大的差距，”英伟达相关负责人表示，和所有数字技术一样，算力是支撑整个虚拟现实技术发展的基石，“我们现在距离那种沉浸式的体验从算力上来看，可能还差着10的六次方倍，而这或许还需要10到15年的时间去发展。”

编辑：全泽源

校对：孙洁华

图编：赵雁旎

制作：单凌鹤

责编：邵子怡

孟妹

监制：浦泓毅

签发：潘林青

往期回顾

基辅又传爆炸声，乌克兰多地遭攻击！欧盟正式启动审议！美将驱逐12名俄外交官！外盘避险，上证综指强势

中国稳增长如何跑赢全球通胀？深度好文，分析透彻！

2035年，德100%可再生能源发电！国内光伏概念股集体上涨！

50.2%，稳增长初见效！商务部又出硬招

“基金女婿”：丈母娘的养老金赚回了点！

不容错过！3月1日起，这些新规在长三角施行

上海证券报微信保留本作品的所有权利，未经书面授权，任何单位或个人不得转载、摘编、链接或以其他方式复制发表，否则将被依法追究法律责任。

微信热线：王老师 021-38967805；版权合作：范老师 021-38967792。

好看，你就点一下！

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

颠覆！3分钟，做个“人”吧！

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

生成图片，分享到微信朋友圈

颠覆！3分钟，做个“人”吧！

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡