其他
伦理困局?把雷军变成Vtuber的AI配音,让中美日声优都坐不住了……
作者 / 绯多木
编辑 / Pel
排版 / Enclave
“国际间围绕声音权的保护存在法律差异,各国内部针对AI声音都存在无法可依难以起诉、或有法可依但执行困难的情况。”
这轮劳资冲突的影响也开始逐渐显现——如在《原神》5.1版本的主线剧情中,部分角色的英语配音出现缺失。9月25日,工会进一步呼吁对《英雄联盟》罢工,因为负责提供配音服务的公司Formosa Interactive试图通过将工作转移到由非工会演员组成的空壳公司来规避罢工影响。
不仅是电子游戏,「AI配音」引发的争议已经蔓延至社会各行各业。
斯嘉丽透露,OpenAI曾多次请求她为其产品配音但均被拒绝。尽管OpenAI声称Sky的声音源自另一位配音演员,但最终还是选择下架了Sky。
AI配音简史:初音未来也干了?
初音未来的声音由日本声优藤田咲提供录制,用户可以通过购买声音库,输入旋律与歌词来编写歌曲。这一时期的语音合成尚处于较为机械的拼接式合成(concatenative synthesis),在语气、音调等细节方面需要使用参数手动进行“调教”。
2010年代,随着深度学习(Deep Learning)的发展,基于深度神经网络(DNN)的自然语言处理技术(NLP)取得显著成果。该技术合成的声音更自然流畅,还能与用户进行语音互动,如(早期的)苹果语音助手Siri、微软Azure 的TTS服务等。
2017年,相关研究人员通过DNN对音频数据进行建模,提出了一种更高效率的声音克隆方法。相较于传统的TTS,声音克隆只需收集少量声音样本,花费更少的定制时间,就能提取出特定个体的声纹特征,捕捉语气、音高、发音习惯等细微差别。
目前国内使用最多的云泽(即二创视频中常见的“五星上将麦克阿瑟”的声音)、云野、云希等配音大都来源于Azure的TTS服务,这些声音听起来较为标准化,不基于特定个体的声音进行训练,很少会“以假乱真”。
TTS是泛用性的转换,声音克隆则专注于个性化的复制,因此,Azure中在使用该项服务时也要求获得配音人员的明确书面许可。
在Vocaloid中,各类虚拟角色的声音库本身受到版权保护。用户在购买或使用声音库时,需要同意遵守相关的许可协议,才能获得授权进行创作。如果是商业化创作,则需要更多额外的授权。
一些滥用该技术的公司也会通过未经授权的方式使用知名人士的声音进行虚假宣传,或以较低成本替代真人配音演员的工作。
声音权的定义与识别:缺乏国际标准
放眼全球,声音权在法律上的解释与规范因地而异,对AI声音克隆的约束更是难成体系。
不过,美国的公开权是州级法,而非联邦法,各州对该权利的承认也有所不同、缺乏统一的保障。加利福尼亚州属于对声音权保护最为完善的州,其法规还涵盖保护去世的公众人物的声音。
2024年9月,加州州长进一步签署两项新法案要求“工作室在创建或使用演员或其已故演员遗产的数字复制品(包括声音和形象)和撰写人工智能使用合同之前,必须获得他们的同意,且谈判合同时必须有专业人士代表”。
处在罢工中的SAG-AFTRA对此表示赞赏,该工会同样主张公司不能使用宽泛的条款来主张对演员声音或形象的永久权利。
不过,美国其他大部分州仅对在世个人的声音和形象权提供保护,未明确涵盖AI生成的声音。在保护严格的州中,未经授权进行声音克隆是违法的;而在保护较为宽松的州中,此类使用则可能被允许。同时,公开权主要是面向公众人物而非普通个人。
如去年,模仿两名歌手Drake和Weekend而诞生的AI歌曲《Heart on My Sleeve》就在环球音乐的强烈抗议下,于TikTok、YouTube、Spotify等流媒体平台下架。
该案例的特殊之处在于,不同于AI孙燕姿那样直接翻唱的行为,《Heart on My Sleeve》结合两位歌手的声音与风格,像AI绘画般分析、模仿,让艺术家“重返巅峰期”,生成AI的“原创”歌曲。
其中,公开权旨在让公众人物能追诉未授权(姓名、肖像和声音等)的商业利用。但由于公开权在日本并没有成文的法律规定,其适用范围是否能涵盖AI克隆声音还尚未明晰。
今年4月,全国首例AI生成声音人格权侵权案宣判。原告配音演员曾为被告的北京某文化传媒公司录制作品,然而该企业后续却将其声音AI化并对外出售。最终法院判决未经许可使用原告声音进行AI化构成侵权,被告道歉并赔偿损失25万元。
本案的重要意义在于,法院在判决过程中认定,当AI生成的声音具有可识别性时,自然人的声音权利保护范围可以延伸至该生成声音,同时也明确了“对录音制品的授权并不意味着对声音AI化的授权”。
尽管法律提供了一定程度的保护,但AI配音大规模滥用现象仍然广泛存在,这与大量便捷的AI语音生成类软件脱不了干系。这让任何人都能在未获授权的情况下轻松生成与特定个体声音相似的音频内容。
如国庆期间广泛传播的“AI雷军”骂人视频,主要是由Reecho睿声提供声音克隆与合成服务,在其官网的“声音市场”中也可以看到有涉及动画、游戏、直播、体育等各个领域(包括已故)人物的AI配音。
用户只需上传几十秒的音频文件,便能训练出一个基础的AI模型;或是直接输入文字,选用其他用户上传的现成模型,也能快速生成特定人物的语音。
行业内部:走向共存之路?
人气声优梶裕贵(《进击的巨人》艾伦·耶格尔)也在今年5月、出道20周年之际,宣布推出自己授权的AI声音合成软件“CeVIO AI 梵そよぎ”,以此为中心开展多媒体企划。
用户在购买该软件后可免费创作内容用于非商业用途,部分商业用途则需要获得追加许可。这种官方层面主动授权和对内容用途进行规制的做法,与Vocaloid有异曲同工之妙,既能规范AI创作的内容与用途,也激发了二创社群的活力。
梶裕贵是少数积极表达对AI立场的日本一线声优。在去年接受NHK采访时他也谈到:
“自己并不是想与AI对抗。未来随着AI的不断进化,不只是声优行业,很多领域都会面临AI带来的现实挑战。到那个时候,我们需要找到一种‘共存’的方式,而非‘对立’。”
今年5月,国内也掀起了一场有关AI配音的争论。起因在于,知名配音演员赵乾景宣布把声音授权给TME出品的AI有声剧,将其训练出多音色的AI人声。
头部演员和事务所或许可以签订合同,确保在AI项目中能获得公平报酬并有效保障声音的使用权限,但对于没有话语权的行业新人来说,这或许会是一场灾难。不少新闻报道都有指出,AI配音正在逐步取代传统的人声配音,尤其是在有声读物和广告领域。
《卫报》报道:其中提到配音演员在一个项目完成后发现公司在未经同意的情况下克隆并使用了他的声音
结语
不仅限于声音,五官、表情、嘴型、肢体动作等信息如今都能通过深度伪造(Deepfakes)合成,AI驱动的各类技术同时在数量和质量上深化了拟像的制造能力。
— 点击图片阅读更多精彩内容 —