成维忠
中科深智创始人兼CEO
采访、文|张孟月 编辑|李佳琪
校对|吴政希 图|由受访者提供
成维忠认为,未来虚拟人将越来越依赖AI技术生成动作和表情,而多模态动作驱动能满足多样的应用需求。
中科深智的创始人成维忠曾担任过多家上市公司的高管,也是国内移动增值业务、移动电商、移动营销等行业的连续创业者。2014—2015年的VR浪潮为成维忠及其团队提供了新的思考角度。“2016年,我们创业时VR浪潮已经在下滑了,但我们都认为下一代互联网大概率仍是以VR或其他沉浸式体验为主体的。”成维忠曾从事游戏行业,合伙人宋健在图形、图像行业也有深厚经验,多元的技术背景助推了初创团队的起步。“当时还没有元宇宙的概念,但从技术上来讲,其与移动互联网的最大差别在于二维环境将转为实时引擎的3D环境。那时我们进入这个赛道是比较冒险的,因为在该方向创业的人还极少,但我们还是杀进来做了。”“杀”进新赛道,成维忠对中科深智的定位是:围绕虚拟人动作和表情的生成技术,为各行各业提供以软件和算法为主驱动的内容生产工具。选择虚拟人作为主要突破点,既有技术的因素,也有对商业化落地场景的考虑。在他看来,虚拟人在下一代互联网的发展中,商业变现的路径相对更清晰、更容易。然而,虽确定了在虚拟赛道的基本发展思路,这家年轻的公司还是遭遇了不少困难。成维忠坦言,创业初期最大的困难就是融资。那时和VC的朋友介绍我们的项目,只能告诉对方我们的基本方向,仍缺少基础的产品模型和具体的落地场景,融资希望很小。“早期的研发费用都是创始团队自掏腰包来集齐的,投入了上千万的资金,赚到的收益也都投进了研发中。基本能省的钱都省了,团队20多人,全都是工程师。”不仅如此,在技术研发方面,他们也遇到了多方面的问题,包括硬件、软件、算法、引擎等,需要大量的时间去试错和摸索。直到2019年,公司推出第一代较为成熟的产品,自掏腰包保研发的情况才有所好转,并在2020年6月获得了来自英诺天使基金的第一笔融资。也是在这一时期,成维忠感到“春天来临了”。“新冠肺炎疫情对实体经济影响很大,我们服务的客户大多是偏网络层面的,商机很多,也促进了公司的发展。”
经过不断的技术积累,中科深智在虚拟人风口到来时,迎来了快速发展的契机。如,打造B站的虚拟偶像哈酱、Momo酱,知名IP一禅小和尚、僵小鱼等,以及网络购物平台的许多商家都开始陆续使用中科深智的产品进行虚拟直播。当前,提供虚拟人直播解决方案的公司很多,大多以直播带货作为主要业务方向。然而,大部分虚拟人直播公司技术架构较为单一,一般使用动作库,成本相对低廉,但也存在动作表情和讲话内容误差较大、动作重复等问题。成维忠表示,无论是动作驱动还是语音驱动、脚本驱动,都只适用于某一场景。选择单一领域研发产品的难度较低,但无法适应未来虚拟人以及元宇宙内容产业的发展。因此,向市场提供多模态实时动作驱动中台以适应不同业务领域、不同层级的用户需求更为重要。
中科深智自研超写实虚拟人:壬申
在他看来,中科深智的核心竞争力在于融合了XR和AI算法的多模态动作生成驱动技术。这使得研发团队可以不断通过算法优化来寻找最优解,缩短虚拟人的生产周期并降低成本。“预计未来10年,我国虚拟人的数量将超过2两三百亿,这意味着每个人平均将有3个左右的数字分身。除了语言,人类之间的互动交流更多是通过动作和表情,虚拟人和人类之间也是如此。”成维忠说。因此,动作和表情生成技术是支撑虚拟人的基石之一,也是中科深智“押宝”的细分赛道。从技术角度分析,数据输入方式的不同会导致虚拟人输出动作的精度和适用场景有差异,在虚拟人领域,有语音输入、视频输入、传感器输入等不同的数据输入方式。“无论哪种输入模式,对中科深智的数字人多模态实时驱动引擎Motionverse而言,只是输入的触发条件,最终输出的动作和表情都是算法生成的。随着时间积累,数据集越来越多,输出的动作和表情也会越来越好。”成维忠表示,多模态动作生成驱动技术使虚拟人可以接受更多输入形式以完成动作,从而能在更多场景落地。
在形成技术壁垒后,如何让技术匹配到相应领域以满足市场需求是每个初创团队都会思考的问题。 “寻找应用场景是我们团队的一大优势。”成维忠告诉记者,因核心团队的骨干都是来自大公司的高管,对虚拟人相关的变现场景都比较熟悉,例如电商、快速动画等行业,中科深智团队对业内公司的痛点和需求十分清楚,打磨出的产品便能精准地切中市场需求。此外,成维忠透露,在经过广泛的市场调研及项目接触后,有许多场景虽然看起来很美好,但变现效率偏低。相较而言,如淘宝、天猫、京东、抖音等B端用户,既有推出虚拟主播的客观需求,也有更强的付费能力。与真人主播相比,没有情感、不会生病、不需要拥有自己的生活,可以长时间不受限制地直播是虚拟人较真人而言最大的优势。此外,和对真人主播有强烈需求的服装、美妆领域不同,有的品类例如家具、家居等,主播无需展示上身效果,只需进行尺寸、功能的介绍。但是,用户的观看需求是实时存在且零碎的,这时,选择“劳模”虚拟主播就是更经济实惠且省事省心的方式。针对市场需求,中科深智推出了“自动播”虚拟直播产品,让虚拟主播们全年无休地滚动直播。据中科深智提供的数据,其虚拟主播产品已经服务了超过2000家客户,占据主流电商平台虚拟主播近70%的份额。“电商用户对价格很敏感,想在省钱的同时获得技术便利,这就对技术公司提出了很高的要求。”成维忠介绍,中科深智通过近两年的研发,除聚焦于动作与表情生成的Motionverse业务中台外,还自研了性价比较高的虚拟人云渲染架构HIVE系统。接下来,公司将在不增加客户更多成本的前提下,通过算法改进虚拟主播的表现力,并持续研究虚拟主播对客户成交数据带来的影响。提及虚拟主播对客户成交数据的影响时,成维忠说:“得益于强大的电商生态,中国在电商虚拟直播领域遥遥领先。但是电商平台并没有真正去拥抱元宇宙和虚拟人,平台对虚拟主播有一定限制,不敢让虚拟主播和真人主播公平竞争。”在他看来,许多真人主播其实是亏本的,如果平台让两类主播同台竞技,很多真人就会被淘汰掉。“现在,很多虚拟人的表现比真人主播更优秀,至少在某些品类下(尤其是交易频次较低的品类)是如此。今年双十一期间,天猫上线了 ‘未来城’元宇宙空间,在这类3D环境下,虚拟人直播带货将更有优势。”据了解,目前中科深智的商业模式以SaaS为主,除了“自动播”,还陆续推出了AIGC内容生成工具“自动画”,虚拟客服“云小七”等,同时,基于“标准产品+”战略,其在电商、传媒、广告、金融、教育、文旅等领域已实现全面落地,服务了包括中央电视台、中国电信、中国联通、腾讯、汽车之家、高德等知名客户,为其提供以多模态动作驱动和表情生成为核心的虚拟人全栈技术解决方案。“我们把自己定位在元宇宙基础设施提供商,主要做底层技术的合作产品。”成维忠如是说。在成维忠看来,中科深智积累的虚拟人技术将来还会有更多的应用场景,元宇宙的进一步发展也将带来更多虚拟人的技术需求。“我们的技术基本面已经形成,往后就是不断迭代升级的过程,调整和优化算法以满足不同场景的需要。我们将在虚拟人领域继续深耕,元宇宙也是未来的大势所趋。”
· 文章版权归本编辑部所有,未经授权不得转载。
· 如需获取转载、合作、采访等需求请到微信公众号菜单栏,获得相应信息。
· 您亦可在知网、今日头条、南方号等相关平台上关注我们。
《科技与金融》杂志2022年11月刊
已发售欢迎点击下方图片订购往期回顾