人工智能带给音乐行业的，是创造力还是口水歌？从AI孙燕姿谈起

Original 界面文化组界面文化 2023-08-15

撰文｜尹清露

编辑｜黄月

继生成式人工智能攻入绘画领域并引发争议后，5月，引起轩然大波的AI孙燕姿及其它人工智能翻唱事件让音乐行业成为了下一个备受关注的焦点。在B站视频中，孙燕姿唱起了周杰伦的《发如雪》，王心凌匪夷所思地唱起《套马杆》，有些视频播放量已达百万，弹幕评论上千条。

孙燕姿本人事后在社交媒体上发文回应，认为人类无法超越AI已指日可待，对于未来，则是“凡事皆有可能，凡事皆无所谓”，充满了无所挂碍又无可奈何的意味。面对迅猛发展的AI技术，一切仍模糊而未知，但孙燕姿的回应为我们打开了一个更大的思考缺口：在音乐行业，人工智能可能导向怎样的未来？会解放艺术家的创造力吗，还是炮制出更多千篇一律的口水歌曲？

孙燕姿在演唱会上。图片来源：视觉中国

界面文化（ID：booksandfun）综合既有分析，并采访了两名资深音乐行业从业者，以期探索一点初步的答案。

在AI学会创作之前，

算法已经破坏了音乐行业

实际上，音乐在探索新技术方面一直处于领先地位。早在近四十年前，法国学者雅克·阿达利（Jacques Attali）就在著作《噪音：音乐的政治经济学》里提出，音乐就其本质而言与金融或者数学类似，它们都是纯粹的心智活动（speculation of mind），比起绘画这类借助物理形态的艺术创作，音乐往往能更快地应用最新科技来扩展创造力的边界。

现场调音师邓成龙在接受界面文化的采访时表示，听众之所以会对AI孙燕姿感到惊讶，很大程度上是出于心理上的恐怖谷效应，从原理来看，用技术模拟人声与用电脑采集钢琴音色相类似，这中间只存在技术层面的进步。

曾为多名歌手制作专辑，同时也是独立音乐人与声音空间设计师的李星宇在采访中提到，AI在音乐行业的应用早已非常广泛，许多网红歌曲就是用较为基础的大数据进行分析，再结合人力制作而成的。根据李星宇的推测，由于技术迭代的速度飞快，今年将会出现一批“相当像样”的AI创作者。1月份，谷歌就发布了有“音乐版ChatGPT”之称的MusicLM，它可以自由混搭不同类型的风格和乐器，通过输入“晚宴上的爵士乐”这类指定地点和时间的文字，就能让机器创作出符合当下情绪的乐曲。

图片来源：视觉中国

只不过，仅靠AI的算力，至今还未出现真正的爆款歌曲，这也是李星宇眼中的关键节点：“如果AI能做出爆款，以制作网红歌曲为生的公司和最主流的音乐人肯定会受到重创，音乐行业将会面临重组。”相比之下，小众独立音乐人受到的冲击较小。这不禁引人遐思——如果功能性的样板音乐和口水歌可以交给AI，人类能否解放生产力，创造出更多有水准的原创歌曲？

设想很美好，现实能否如愿却难以判定。毕竟在生成式AI学会创作之前，算法AI就已经极大地破坏了音乐行业。Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back（《阻塞点资本主义》）一书提出，在数字技术和互联网民主化初期，权力曾经罕见地从唱片公司流向艺术家，但好景不长，如今流媒体平台取代唱片公司，攫取了音乐的大部分价值。

按照书中的观点，流媒体带来的一个显著的现象是“播放列表文化”，听众变成需要呵护的孩子，更喜欢被动收听算法推荐的音乐而非自主探索。聆听的场景也在不断细分，甚至出现了“骑车专用嘻哈曲”“赖在床上吃早餐”这样精准定位的列表。由于播放列表变得如此重要，被排除在外的艺术家很可能会面临歌曲发行的失败，所以他们必须不断创作出悦耳且具备走红潜质的曲目，而这往往会产生更多平庸、千篇一律作品。另一方面，为了让听众尽可能多地收听音乐，从而增加平台收入，名为“Chill Vibes”、“Peaceful Piano”的氛围音乐播放列表大量涌现，它们没有审美上的挑战性，听一整天也不会疲劳，而这正是人工智能擅长创作的那种音乐。

截图自Apple Music app

雪上加霜的是，由于流媒体平台会从有限的现金池中分配版税费，一首歌被播放得越多，创作者的收入就越多，某些创作者求助于作弊手段，也就是委托第三方让机器人bot收听歌曲，没有作弊的艺术家的生存空间进一步被挤压。法国国家音乐中心的一项研究发现，2021年法国各种平台上的音乐中，有1%-3%是由机器人收听的，换算成数字是总计10亿-30亿次。

李星宇谈到，与海外相比，国内的情况更加糟糕。近年来国内音乐生态本来就不好，流媒体平台把大部分资源推给流量艺人，剩下的资源靠独立音乐人厮杀拼抢，这导致行业内只有头部和底部，不再存在中间层。再加上疫情期间音乐综艺爆火，独立音乐人需要通过《乐队的夏天》等节目试图跻身头部行列，所以现在演出市场也不健康，观众要么涌向五月天这样的大型演唱会，要么去看音乐综艺捧红的乐队——新裤子或五条人乐队就是最好的例子，他们虽然也很优秀，但无一例外具有强烈的娱乐属性。

《乐队的夏天》第二季海报

在此背景下，即使AI作曲的技术提升，对市场来说也不一定是好消息。首先，对于听歌品味已经被算法形塑的听众来说，是否还需要超出认知的音乐？另一方面，资源的分配也是问题，李星宇在采访中悲观地指出：“最有可能出现的情况是，平台将资源分给自家的AI，同时头部艺人仍然会索要自己那一份，最后就不剩什么给其他创作者了。”

艺术家能夺回AI吗？

版权与声音的身份问题

李星宇的担忧或许是正确的。大型唱片公司当然不会错过这个新兴市场，环球音乐集团于2019年签约了一名形象为黑人的虚拟说唱歌手FN meka，除了声音来自人类，歌曲旋律、节奏和歌词都由AI生成，在鼎盛时期，FN meka每个月可以获得超50万名Spotify订阅者和超10亿的TikTok浏览量。

虚拟说唱歌手FN meka

而颇为讽刺的是，由于手握鲍勃·迪伦等巨星的歌曲版权，环球音乐集团同时也对人工智能的入侵感到焦虑，其执行副总裁迈克尔·纳什就曾表示，“AI生成的音乐正在稀释市场，侵犯了艺术家从作品中获得报酬的合法权利。”

真正伤害艺术家权利的到底是谁？界面文化此前的一篇艺术家专访指出，版权日益成为保护既得利益者、而非小众创作者的体制。文章《创作零工，普遍贫穷：从“B站停更潮”谈起》也谈到，科技产业的逻辑不再是投资艺术家，而是通过提供内容来吸引用户，用定价极低的流媒体播放费压榨创作者；技术门槛的降低并没有带来“人人都是艺术家”的美好未来，而是将创意工作者置于竞争更加激烈且毫无保障的境地。

正是在此刻，技术的双面性突显了出来。出于对大平台垄断的不满，已经有些艺术家开始主动使用AI来探索新的经济模式。电子音乐艺术家Holly Herndon就是其中一位，她认为，现在有许多关于技术的反乌托邦叙述，但如果艺术家能拥有训练数据主动权，技术也可以成为一个机会。Holly的做法是深度伪造自己的声音，用它来演唱不同语言的歌曲，并将其授权给一个封闭的合作者网络，从而换取后续作品的收入分成。她的观点很明确：是艺术家——而不是公司——应该决定AI在音乐中的使用。

有趣的是，与其说是“使用”AI作为工具，艺术家自主克隆声音的想法更接近于一个围绕身份展开的游戏。邓成龙在采访中提到，在思考声音的归属与版权问题时，我们也可以换个角度，AI孙燕姿模拟出的并不是孙燕姿真正的声音，而是一个完全二次元的存在，“只不过它也有它自己的真实”。这带来的错乱和疑惑便是，如果模拟的声音不属于艺术家本人，那它属于谁？以及，声音在多大程度上属于个体？

如果模拟的声音不属于艺术家本人，那它属于谁？以及，声音在多大程度上属于个体？

这种错乱和困惑的感觉，正是Holly进行深度伪造的目的之一。她援引音乐学家Nina Sun Eidsheim的观点指出，声音在本质上是公共的。比如人的声音并不是一个独特的实体，而是连续的物质领域的一部分；歌手的嗓音是由一系列身体器官、感受声音的声学条件，以及歌手平时在训练时涉及的风格和技巧组成的，简而言之，这与他人他物紧紧相连。Holly认为，这一点对重新思考版权问题来说十分重要，正如她在某次采访中所说：

我们居住在一个惩罚性的知识产权环境中，这并不适合音乐领域的发展。因为实力较弱的人会不断被抄袭，本可以为行业做出贡献的人却无法谋生，最有说服力的新想法往往被缘化。

另一名采取相似策略的流行音乐人是Grimes。今年4月，她宣布将允许人们使用她声音的AI版本制作音乐并做商用，并与对方均分50%的母带录音版税。事实上，Grimes经常在作品中反思人机关系，也曾想象过AI有朝一日统治世界后的可怕末日，歌曲《We Appreciate Power》就设想了一个致力于服务AI独裁者的女子团体，她们载歌载舞地献上谄媚和好意，歌词也写着“向世界上最强大的计算机宣誓效忠，模拟技术便是未来”；某张混音专辑的反抗意味更为直接，标题简单粗暴：This story is dedicated to all those cyberpunks who fight against injustice and corruption every day of their lives!（《这个故事献给那些每天都与不公正和腐败作斗争的赛博朋克们》）。

Grimes在Met Gala。图片来源：musictech.com

Grimes的想象并不荒谬。正如前文所述，技术经常会归顺于大企业的盈利目标，这让技术本身看起来十分“邪恶”。但是邪恶的并不是技术本身，邓成龙在采访最后说到，自己还是希望保持乐观，因为根据过往经验，音乐行业的每次技术进步都是好事。他认为音乐中的AI是中性的，它可以让审美直接转化为生产力，也可以成为抄袭和偷懒的工具，具体会怎样发展，还需要继续观望。

参考资料：

《噪音 : 音乐的政治经济学》 [法]贾克·阿达利著宋素凤 / 翁桂堂译河南大学出版社 2017-9

Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back. Rebecca Giblin, Cory Doctorow, Beacon Press, 2022-9

创作零工，普遍贫穷：从“B站停更潮”谈起

https://www.jiemian.com/article/9224254.html

中国美院教师抄袭事件，暴露的是国内艺术体制的问题 | 专访

https://www.jiemian.com/article/9333500.html

This Singer Deepfaked Her Own Voice—and Thinks You Should Too | WIRED

https://www.wired.com/story/holly-herndon-ai-deepfakes-music/

本文为独家原创内容，撰文：尹清露，编辑：黄月，未经界面文化（ID：booksandfun）授权不得转载。

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

人工智能带给音乐行业的，是创造力还是口水歌？从AI孙燕姿谈起

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

生成图片，分享到微信朋友圈

人工智能带给音乐行业的，是创造力还是口水歌？从AI孙燕姿谈起

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时