查看原文
其他

“AI复活”:有人靠技术,有人靠套路

The following article is from 定焦 Author 定焦团队

第4173期三川汇文化产业

点上方蓝字「三川汇文化产业」关注并星标


近年来,“AI复活”技术逐渐进入公众视野,成为了一个备受争议的话题。从简单的图像处理到高级的AI换脸变声技术,价格也从十元到万元不等。这种技术虽然能满足人们对逝去亲人的思念,但也存在数据隐私、法律伦理等问题。有业内人士表示,AI换脸变声技术的成熟,会让一些人借着用户对亲人的想念和信任实施诈骗。政府和相关机构应该加强监管,确保这种技术的合法、合规使用。



作者 | 苏琦

编审 | 时光

编辑 | 半岛

来源 | 定焦(ID:dingjiaoone)



“起死回生”这件事,过去只在科幻电影里见过,但今年,被“复活”的案例越来越多。


2月底,知名音乐人包晓柏用AI“复活”女儿,女儿在妈妈生日时还为她唱了一首生日歌;3月初,商汤年会上,刚去世不久的商汤科技创始人汤晓鸥以数字人的形式被“复活”,还来了一场“汤式风格”的演讲;近日,还有有网友用AI技术“复活”李玟、乔任梁等已逝明星,备受争议。


和逝去的亲人“再见面”,这门此前隐秘小众的生意,开始频繁地出现在大众眼前。但因为用到的技术不同,价格不同,效果也不同。


花10元,能让去世亲人的照片“眨眼”,背后是简单的图像处理技术;花千元,能和没来及道别就离开的亲人视频通话,用到的是AI换脸变声技术;花万元,则可以和电子屏幕里亲人的克隆数字人聊天,数字人能说会动有表情,真实感更强。


“AI复活”是一门有强烈需求的生意,酝酿着亿级市场,盯上这块蛋糕的商家却鱼龙混杂。有的下载软件就能制作“会说话的照片”进行售卖;有的本身是数字人服务商,在向B端售卖直播、会展、主持人等数字人之外,开发面向C端的数字人定制APP;还有一批商家,看准了用户复活亲人、克隆明星的需求,用自研+接入第三方技术接口的方式,为用户提供定制化服务。


“AI复活”或许在将来会成为一个像拍照一样常见的服务,但其中也存在数据隐私、法律伦理等问题。有业内人士表示,AI换脸变声技术的成熟,还会让一些人借着用户对亲人的想念和信任实施诈骗,“回忆虽好,谨防被‘割’”,他提醒道。


一、“复活”亲人,需要多少钱?


目前市面上的“AI复活”产品,根据成本高低、技术难易,可以分为三个等级,也对应着用户在AI“复活”某人之后,与亲人“再次相见”的三种方式。


其中最低一档是照片驱动,俗称talking photo(能动的照片),前几年就有类似的APP火过一阵。


利用深度学习、图像处理等技术,就能让照片里人物的嘴巴和眼睛动起来;如果让照片里的人开口说话或唱歌,则要用到对口型(唇语匹配)和语音生成。“这些技术都已经成熟且开源,量产之后,单次成本可以压缩到10元以内。”有10年AI创业经验的极链科技创始人&总裁董慧智介绍。


第二档是表情捕捉驱动的伪直播,给真人模特换上逝者的形象和声音,进行语音电话或视频电话等互动,或生成祝福短视频等。


这里面用到了语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术来变人变声。董慧智称,这是一种特别讨巧的方式,技术不新鲜,部分AI诈骗用到的是类似的技术。动捕器材及人力成本稍高一些,需要数千元。


这类“AI复活”的视频片段在短视频平台播放量很高,一般是小辈为家里的老人下订单,找人用逝者的脸和声音与老人通话,对老人谎称逝者在外工作,将“善意的谎言”继续,老人一般也看不出异样,只是频频抹泪。


△孙先生用AI换脸“复活”父亲


第三档是近期比较火的用数字人技术“复活”亲人,因为交付的产品不一样,成本也有所不同。


一般来说,通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,可与之进行实时的文字或语音交流。


51数字人有这项业务,创始人陈鸿告诉「定焦」,一般产品交付的是一个带有数字人的屏幕,大屏有电视那么大,小屏可以是iPad那么大。用户登录账号之后,就能看到逝去亲人的数字人形象,用户可以通过语音或文字与数字人互动,产品还可以提供语音电话叫醒服务。


“定制类的‘复活亲人’业务,一般要5万元以上。”陈鸿称,因为客户都是长期付费,后续还会不断在细节上调优,也有一些客户是一个家族凑钱一起做,要求更高。


“AI复活”对于数据质量的要求非常高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,比兴趣爱好,才能模拟其性格。“素材不够全,成本还会再增加。”陈鸿表示。


因此,精度越高、数据越定制化,效果也就越接近真人,价格也更贵。所谓的精度,主要体现在以下几个方面:人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。


放到数字人领域,需要完美克隆某个人的技术难度可谓“上不封顶”。商汤科技“复活”的创始人汤晓鸥,就是一个案例。


△“数字人”汤晓鸥在年会上的演讲  图源 / 视频截图


商汤科技数字空间事业群数字文娱事业部总经理栾青告诉「定焦」,为了还原汤老师的音容笑貌,用到了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。


此外,商汤如影数字人技术团队采用了汤老师之前清晰有效的视频,用商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。


受限于素材不多,以及算力、成本的考量,目前很多数字人的视频和产品看起来还是很“假”。“这些都不算是完整地‘复活’数字人,技术和服务的最高交付上限,也无法满足人们的最低需求下限”,陈鸿称。


形象不够像,就得用情绪价值来补,在数字人的设计上加入一些交互细节。他举例,比如一个客户的爷爷最喜欢老四,聊天时爷爷突然会说下个月是老四的生日了,家人要多聚、兄弟要和睦,客户就会一下子被打动。


总得来说,前两档用到的都是相对简单的图像处理、换脸和声音克隆技术,能看到人脸、模仿声音,但因为成本低,效果粗糙,市面上看到的还原度比较高且能动起来、能对话的都属于第三档数字人,越像越贵。


二、谁在靠克隆人赚钱?


从过往“复活亲人”的案例可以看到,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,“AI复活”在技术上的可行性和真实度上都变得更高,能让人投入、想哭,使得这类需求被进一步激发出来。


由此,一条产业链应运而生。在这条产业链上,一部分是跟风商家,一部分是数字人服务商,一部分是AI从业者,还有一部分是专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。


电商平台上,有不少店铺提供“AI复活”服务,让照片说话的标价多为10元、50元。短视频平台上,也有不少人以“AI造梦”“AI疗愈”的名义提供类似服务。“收费便宜、效果粗糙,但这是一个长期存在的长尾市场。”董慧智称。


△淘宝上售卖的“让照片说话”服务


这类生意也存在灰色空间,有短视频博主发布“复活”李玟、张国荣、乔任梁等已逝名人的视频,让他们开口唱歌和说话,虽然称“旨在致敬和纪念,无商业目的”,但此类视频获得的流量颇高,还有部分会借此引流做“亲人复活”生意。同时,一些提供“AI复活”服务的店铺也注明“只做怀念,人脸识别请绕道”。


目前,技术成熟的数字人服务商和AI从业者,更多是将商业模式放在B端,比如AI客服、数字人直播、AI老师、A主持人、AI医疗等,有部分推出了面向C端的类似工具,但并未大规模宣传。


有网友曾用大模型初创公司MiniMax的语音大模型,将一段90秒的音频素材进行语音克隆,并用MiniMax旗下的海螺问问APP生成智能体,与之进行语音对话。硅基智能也有“生命克隆和数字永生”业务,其旗下的炎帝大模型基于用户提供的数据克隆出数字人,用户则可以通过DUIX APP与数字人实时交互。


△硅基智能DUIX APP定制数字生命


陈鸿和团队主要做的是高精度定制市场,平均一单5万元起,围绕大客户开发场景,比如数字墓地,去墓地缅怀先人时,先人从电子屏里走出来跟大家聊天;比如纪念馆智能工程,包括建筑空间搭建等;比如名人“复活”,用初期古画“复活”了朱熹等。


△51数字人制作的朱熹


“提供定制服务的公司,不仅考验底层技术能力,更考验的是渠道深度以及服务的落地程度,这决定了能否让用户真正把数字人用起来。”陈鸿认为。


从技术提供方的角度来看,栾青认为,商汤如影的定位就是通过数字人技术赋能各个行业,谁更了解行业,谁更能下场服务好用户,谁有更深度的解决方案,谁就能吃到更多蛋糕,“复活亲人不是一个纯粹从技术角度就可以做的生意。”


“AI复活这门生意更适合中型团队去做”,董慧智分析,大公司的运营和研发成本很高,同样一套技术,他们会优先去做标准化、批量化、适用更多场景的B端生意。陈鸿也表示,大厂不愿意做,小团队没有实力做,这个市场年收入500万到1亿,是中型团队的机会”。


目前看来,“AI复活”看似门槛不高,但真正做好还要面对很多难题。


当前,“AI复活”还存在技术受限、素材储备缺乏、家中有人反对等局限,普及仍有难度。


大部分数字人需要攻克的技术难点是,能否做到人机难辨。栾青提到,数字人在说话、动作、场景衔接等方面已经向前进了一步,但在较长时间的交互过程当中,仍然未能达到真正的人机难辨,在情感传达、理解力、意识等方面还有待完善。


而真的想让一个人“复活”,细节体现在方方面面。陈鸿以一个交互场景举例说,在与数字人爷爷对话时,如果用户问到了数字人数据库里没有的信息,比如“谁是尼采”,数字人就会跳转到大模型,根据公开的答案回答,虽然可以持续进行多轮对话,但就会很假,用户的沉浸感就会被打断。


三、“AI复活”,仍需敬畏


“AI复活”的需求旺盛,但不是所有人都持支持态度,背后隐藏的隐私安全和伦理问题也不可忽视。 


支持派认可的是其提供的情绪价值,认为“复活”亲人,是对生者的慰藉和对遗憾的满足,是技术向善的例子。


质疑派则认为人永远不可能“复活”,也无法进行“授权”。即便“AI复活”得到了亲属的授权和认可,但逝者本人的意愿无从得知。


“数字永生没有那么容易,即使使用大模型,最终复刻出来的只是一个长着相同面孔的GPT,当他以相似的记忆和远胜于本人能力和智商跟你对话时,你的感受一定会好吗?”董慧智反问。


3月16日,针对儿子肖像被短视频创作者侵权使用一事,乔任梁父亲表示不能接受,感到不舒适,希望对方尽快下架,“他们未征求我们同意,是我侄女刷到视频发给我的,这是在揭伤疤。”


如果克隆数字人出现问题,对生者可能将带来二次伤害。太多影视剧作品探讨过其中的伦理困境和人性幽微。


2013年播出的《黑镜》,其中一集讲的便是女主“复活”了在车祸中去世的丈夫,虽然复制了丈夫的记忆和躯体,却无法复制情感和选择,这位AI丈夫无需睡觉、不会受伤,只会呆板地按照命令行事。女主意识到“你不是你,你只是涟漪”,最终将机器人锁在阁楼上,却怨恨自己离不开这虚假的真实。


△《黑镜》截图  图源 / 豆瓣用户Hiro


随着“AI复活”产业链的成熟,“复活亲人”“克隆明星”的需求和案例增多,其中涉及的隐私数据泄露、AI诈骗等诸多法律风险,也受到关注。


现实生活中,通过AI换脸实施诈骗的案例时有发生。今年315晚会就曝光了多起利用AI技术换脸变声成亲人,实施诈骗的案例。此外,假冒名人也是骗局中的重灾区。今年3月,刘德华经纪公司映艺娱乐通过微博发布声明,称刘德华声音被克隆伪造,提醒各方人士警惕骗局。


复刻亲人时,为了更高的还原度,用户只能对技术提供方保有更大的开放度,这就决定了用户很难保护自己,一旦遇到骗子,很难界定到底是服务还是诈骗。


对此,陈鸿建议,想要“AI复活亲人”的用户,在下单前应该签署合同,规定数字人的各项权利属于个人,以及提供的个人信息不被泄露。


“AI的发展是超速的,而安全问题不管是从法律层面、文化层面、公民意识层面还是技术层面的,都处于滞后状态。”董慧智称,最终产业的发展还是要靠从业者自律和监管条例的规范。


栾青称,行业的规范和安全是业务发展的大前提。在中国信通院牵头下,商汤联合多家AI公司共同制定了“可信数字人”的标准。


不可怀疑的是,人和AI的关系会在今后变得更加紧密和多元,“AI复活”这件事,以后有可能会成为一个标准服务,就跟打印一张照片一样简单。


随着技术进步,“AI复活”的概念还在继续升级,比起一段视频、一个聊天机器人产品,有人提出了数字永生、数字陪伴、随身亲人等概念,“有富翁在自己还活着的时候,就开始着手复制自己,搭建自己的这种数字永生库”,董慧智称。


2015年,俄罗斯亿万富翁德米特里·伊茨科夫发出倡议,宣称到2045年将为所有人打造一副机器人身体来实现永生,这项计划面临一定争议。2022年,伊隆·马斯克在推特上提到已经将自己的大脑上传到云端,并与自己的虚拟版本交谈过,但有人认为这是马斯克在宣传自己的脑机接口公司Neuralink。


随着“AI复活”褪去神秘感,行业或许也会开始进入价格内卷的时代,如果不想出现“劣币驱逐良币”的情况,行业还需保持敬畏之心。



 加入私密社区 

 推荐阅读 


 主题阅读 
Sora AI对九大旅游行业30个领域的应用潜力与设想
Sora AI技术在文化行业中的应用潜力与影响分析
2024年AI和元宇宙发展趋势与投资策略报告

 推荐收听 

 订阅关注 
行业窗口与顶尖新媒体【三川汇文化产业】已运维4000多期(持续十多年,跨越4000多天),推送文化、旅游、体育领域专业优质文章8000多篇。【三川汇文化产业】始终秉承权威、专业、准确、及时、实用的特点,聚焦文化、旅游、体育等行业前沿动态、发展思考,直面新时代行业发展重大问题,融汇行业内外精英的观察和理解,得到了全国从中央到地方各级政府公务员、企事业单位负责人、精英从业者的高度关注与大力支持,亦架设起沟通各方的畅通渠道,是中共中央宣传部、国家发展和改革委员会、文化和旅游部 、国家广播电视总局、国家电影局、国家新闻出版署、国家文物局、国家体育总局等有关部门,各地市政府,以及全国各文化、旅游、体育企业的重要助手。欢迎订阅关注!

交流/咨询/合作请加主编微信号:7759813
点击下方【阅读原文】加入「三川汇文化产业」,这里,是你的舞台~

喜欢这篇吗?分享、点赞、在看,都安排上~
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存