查看原文
其他

“小白”一脚踹进“音乐圈”?年轻人靠Suno“搞钱”还差几步

狮刀 腾讯科技 2024-04-11

《新鲜计划》栏目由腾讯科技推出,挖掘最新鲜的产品,探索年轻一代的最 in 的生活方式,体验智慧浪潮中的 Aha 时刻。


文 / 腾讯科技特约作者 狮刀


编辑 / 腾讯科技 周小燕



开始之前,我们先做套听力题。请听题!选择这三首乐曲中:

Q1:你认为最可能由AI创作的

Q2:你认为最可能由“碳基生物”创作的

1、Surprise me.mp3


2、拿破仑翻阿尔卑斯山_01.mp3


3、Suno.ai - We Go!.mp3


现在,让我们揭晓正确答案!


以上三首的作者全都是AI。


第一首的作者是Stable Audio(Stability AI),歌曲是在Stable Audio平台用“惊喜模式”随机生成的,不过听着好像没有那么惊喜,算是中规中矩。


第二首的作者是MusicLM(Google),歌曲是官方示例,用来描述一副世界名画《拿破仑翻越阿尔卑斯山》。不知道你有没有听出“史诗感”,我觉得更像是无声电影时代的BGM,下一秒会跳出卖花女。


第三首的作者是“当红炸子鸡”Suno AI V3(Suno AI),歌曲来源于社区的top榜单。


如果说前两首还停留在短视频BGM阶段,这首WE GO几乎可以用来发专辑了,无论是人声、混音的完成度都几乎达到了“以假乱真”的程度。


有点怀疑?来听首Suno创作的国风Suno.ai - 如梦令.mp3



不够好玩?再来首歌剧版Suno.ai - 剁椒鱼头.mp3



有没有亿点点惊喜?正是因为Suno AI V3优秀的创作能力, “Suno将替代80%音乐行业从业者”、音乐小白“用Suno搞钱”的声音此起彼伏...... 终于轮到AI生成音乐玩家体验一把ChatGPT和Sora的待遇了。


今天这篇文章带你实测:一个五音不全+五线谱不识的real“小白”能否用Suno做出“搞钱”音乐?以及,比Midjourney还多1人的Suno 12人团队“钱景”如何?




实测AI版“KFC之歌”

VS人类版“麦当劳之歌”



为了惠及更多想“搞钱”的“小白”,这份保姆级教程分为“理论讲解+实战演练”。


理论环节——耗时20秒


Suno的界面设计相当“傻瓜”,仅有“探索”“创作”“图书馆”三个大板块。



“探索”板块相当于音乐社区,有实时更新的TOP榜单,你可以收听别人创作的歌曲。


“图书馆”板块像是“探索”2.0版,你可以收听别人实时发布的歌曲,只是没经过榜单筛选,质量参差不齐。



“创作”板块是重头戏,看我如何用2步做出一首歌。



S1——输入歌词。我直接选择了生成“随机歌词”。


S2——输入音乐风格。我直接点击了“随机样式”。


现在,我们得到了同步生成的两首《咖啡成瘾》。


请欣赏《咖啡成瘾》Coffee Addiction.mp3



随机生成的居然有点好听,如果认真搞不就直接起飞了!emmm但事实好像并不简单。


实战环节——如何做出KFC之歌


每周都有一个“疯狂星期四”,作为“K门信徒”,我有一个梦想——做出一首能对打“麦当劳无限好”的洗脑神曲,传遍短视频平台。现在,终于有了实战的机会。


场景一:简单模式Claude3+Suno


既然是“小白”教程,我们就要全程用AIGC。


歌词生成:我选择了“顶配”大模型:Claude-3-Opus,并得到了一首结构完整的歌词,包含“Verse主歌、Chorus副歌、Bridge间奏、尾奏Outro”。


Verse 1:


肯德基的门 总是为你敞开


美味的诱惑 让你根本挡不住


鸡翅鸡腿堡 蛋挞和炸鸡架


品尝一次就 再也忘不掉


Chorus:


疯狂星期四 肯德基等着你


麦辣鸡翅 吮指原味鸡


葡式蛋挞 甜蜜入心扉


炸鸡架 越吃越HIGH


麦辣鸡腿堡 大口咬下去


满足感 立刻爆棚


肯德基 疯狂星期四


让快乐 加倍助兴


Verse 2:


相约好朋友 肯德基不见不散


欢声笑语中 分享美味瞬间


点一桶炸鸡 再来杯可乐


惬意地享受 这美好时光


(Repeat Chorus)


Bridge:


疯狂星期四 你不要错过


超值优惠 样样都够酷


速速点餐 美味送到家


开心HIGH翻天 吃个够本


Outro:


肯德基 疯狂星期四


让生活 乐趣无穷


肯德基 疯狂星期四


让我们 一起嗨翻天


音乐风格:毕竟是“小白”,孤陋寡闻的在下将决定权交给Suno,它随机选择dark uk garage(英伦车库),虽然我们从名字看就已经不太妙了。


第一首:KFC之歌.mp3



听到如此深情的女声用“碧梨风”唱着“麦辣鸡腿堡 大口咬下去”,我有点凌乱。


第二首:KFC之歌 (2).mp3



而同步生成的另一首,则让我想到了我的前爱豆,同样是那么地用力过猛(bushi)。


仅从我的直观感受讲,能忍着听完以上两首歌的各位都是“壮士”,娱乐性达不到,“洗脑”功能更是完全谈不上。


场景二:精进模式——Claude3+Sonoteller+Suno


问题最可能出在“音乐风格”上。


于是,我借助“在线AI音乐分析工具Sonoteller”,分析对家“麦当劳无限好”,得到如下信息。


根据上述信息,我们总结出这些关键词:Electronic& Pop(乐派1),Ambient&Dance(乐派2),Chill &Sensua&lRelaxing(风格) ,Drums&Guitar(乐器),Low/Mid pitch(人声),Mandarin(语言),Advertising Music(广告歌曲)。


最后,我将这些关键词作为提示语输入Suno。


请欣赏:


第一首:精进版KFC之歌 (1).mp3



虽然和“麦当劳无限好”没有半毛钱关系,也不够洗脑,但作为初级的广告歌曲,好像又有那么点意思,而且比起“简单版本”,变得正常了很多。


第二首:精进版KFC之歌 (3).mp3


这首“洗脑”功能提高了,就是不知道吃了多少个“凤凰传奇”和“爱情买卖”。


综上,以上就是本“小白”费了九牛二虎之力生成的AI歌曲——KFC之歌。


至此,我们猜测:TOP榜单上排名高的《WE GO》,《如梦令》等歌曲大概率是出自专业人士之手。他们懂乐理知识,也知道如何“微调”才能减少幻觉,从而提高测试效率。


那么,Suno到底是为C端“小白”服务,还是为B端“专业人士”服务?这个问题的答案几乎决定了平台自身的“钱景”。




下一个Midjourney?

Suno的“钱景”如何



根据著名风投机构a16z的观点:在AI音乐领域,为C端消费者打造的产品与B端具有商业用例的专业用户/创作者产品,差别很大。


目前来看,Suno打的是C端牌,他们将核心用户群直接定位到了音乐“小白”。Suno联合创始人Mikey Shulman梦想着全球有十亿人愿意每月花10美元使用Suno创作歌曲。他表示:大多数人不会演奏乐器,也搞不懂复杂的音乐软件。目前音乐听众的数量远远超过音乐创作者,这是“如此失衡”。Suno将成为解决这种“感知失衡”的工具。


但是,有没有一种可能,人类其实不需要那么多“不过如此”的音乐?


换个说法,如果我们“抠掉”《WE GO》、《如梦令》的“AI生成”字样,你还愿意循环播放吗?或者由衷地将“好歌”分享给小伙伴,表现自己的音乐品味,而不是出于“猎奇”。


如果不能,为什么要“折磨”自己的耳朵,不去听一首真正的“周杰伦”?毕竟你有15张专辑,337首歌可以选择。


Suno走C端路线可行吗?所谓的“感知失衡”会不会倒转过来,变成作者比听众多?


接下来,我们对照文生图赛道“扛把子”、婉拒无数VC的“拽哥”Midjourney进一步探讨。


先来说二者的相似之处。


首先,Midjourney和Suno都是凭借自身技术杀出重围的初创公司,非“套壳”大模型,无巨头“绑架”。


Midjourney靠着“数据飞轮”,一次次将水准提升到业内最佳;Suno则每隔3个月进行一次版本升级。


例如,我们输入同样一段歌词,去年9月的Suno V1还识别不出“古风”“流行”;去年11月的Suno V2就可以加入古筝弹奏;今年3月的Suno V3已经能生成《相思红豆-HIFI古风萨顶顶》这样的古风作品。而现在,Suno团队正在马不停蹄地赶向V4版本。



其次,Midjourney和Suno的盈利基本靠用户订阅。


Midjourney用户没有免费额度,其价格分为四档:10-30-60-120美元/每月。价格越高,功能越多,主打“一分钱一分货”。


Suno用户每天可以免费生成5次,共10首歌曲;每月支付8美元可生成500首歌曲,支付24美元可生成2000首歌曲,年卡包打折。不过,至于后续Suno会否调整用户策略,去掉免费额度,还不得而知。


此外,Midjourney和Suno的增长也靠“网络效应”。


Midjourney巧妙地通过Discord社区搭建产品,成为了一个非常有趣的艺术社交空间,超1400万的用户自愿做“编外员工”。


Suno则无论是神似Tiktok的界面,还是实时更新的Top榜单,均体现了其重社交、重传播的属性。


重点是二者的不同之处。


首先是定位不同。如果AIGC产品专注于C端,那么B端可能难以满足;但如果专注于B端,或许C端的需求转个弯就能包含进去。


Discord 有一条用户评价:Midjourney之所以能超过竞争对手,是因为它生成的图片都是可商业化的。


从诞生起,Midjourney就瞄准了商业化应用。在“小B 端”,Midjourney可服务产品设计师(玩具、墙纸等);图片设计师(网站、广告、PPT、Logo、插图等);游戏设计师(游戏场景、角色、道具等)以及自媒体创作者等。在企业端,Midjourney可服务广告商、影视公司、广告创意部门等对艺术效果图有大量需求的客户。


除了牢牢抓住付费意愿强烈的B端用户之外,Midjourney也大大降低了C端个人爱好者成为设计师的门槛,让他们获得了“搞钱”机会。


相较而言,Suno对B端的态度则非常“暧昧”。


来讲个鬼故事。在Suno V3之前,如果你要用AI做一首成熟歌曲,需要辗转于不同的制作堆栈——生成采样、旋律、人声,然后将它们一个个拼起来。


现在有了Suno V3,你可能还得继续这么做。


Suno V3确实可以自己写段solo,但它只能“一锅出”,不支持调整分轨。因此,对于专业的音乐创作者,它确实有亿点点“不中用”。


虽然Midjourney生成图片也没有分层,但设计师还能抠图,甚至用手机也能搞定。


而当我们面对一首完整的歌曲,到底要怎么“抠”才能抠不出杂音?


再加上时间纬度,很可能出现“前10秒如闻仙乐耳暂明,后20秒呕哑嘲哳难为听”。遇到这种复杂情况,又该怎么“抠”?


更何况目前Suno生成歌曲的时长、清晰度,都有一定瑕疵,比如器乐忽大忽小,人均口齿不清。


其次是“烧钱问题”,Midjourney从创立之初就能实现盈利。创始人“骚操作”囤够了GPU,完全不需要投资人掺和。但对Suno而言,无论是“每日免费额度”,3个月一次的升级速度,还是“不好赚钱”的C端,都要大量烧钱。


如果短时间验证不了商业模式,技术跑不赢其他玩家,Suno可能很快也会面临半道崩殂,或是被巨头收购的局面。毕竟,连开发出Pi的Inflection都被微软“生吞”了。


再次,图片和音乐是完全不同的媒介。图片具备可视化功能,刚性需求更为广泛;音乐倾向于情感表达,需求其实更为小众。


举个不太恰当的例子,你需要做PPT,这时Midjourney可以帮忙。但你不需要在讲PPT前给自己加一段“出场音乐”,自然也用不上Suno。


总而言之,本来可以走C端的Midjourney走上了更为“险峻”的B端路线,成就了一年狂赚2亿美元的“造富神话”。而本应倾向B端的Suno,怀揣着让“小白”成为“音乐家”的梦想,选择拥抱大众。目前“吸金”能力尚且未知。不过,我们可以蹲蹲Suno V4,看看会出现哪些面向B端的新功能。




小白用Suno“搞钱”的步骤



对于想“搞钱”的real“小白”,大概可分成这几种情况:


第一,靠Suno抢专业音乐人饭碗,基本是“痴人说梦”。


第二,试试“以量取胜”策略。例如,批量生成BGM。说不定只要数量多,总有一条能“制霸”短视频平台。


第三,理论上Suno可以降低影视、游戏、广告等领域的音频制作成本,尤其是为需要大量BGM的公司省一笔钱。但问题在于,Suno生成的歌曲是不支持修改的“工业品”。一旦甲方爸爸换需求,“小白”只能咬牙表示:我再给您做一首歌吧,不加钱。


照这样下去,估计不出几天,某宝上就会出现大量“可商用免版权BGM”——9.9元100首歌。其实这也不失为一种“小白”搞钱思路。


另外,作为用户可以不担心侵权,但作为平台却绕不过版权大坑。


此前有传闻:Google因为怕被告Copy,不敢公开MusicLM。


相较而言,Suno的表现可谓“鸡贼”——只顾着公布产品,不公开训练数据源。


一方面,Suno拼命沟通厂牌,安抚艺术家,表达自己的尊重之情——不允许用户在提示语中指定任何特定艺术家的风格,也不允许使用真实艺术家的声音。


另一方面,Suno却在“借花献佛”——平台规定:如果你是免费用户,你创作的歌曲归属于Suno,需要标注来源且不能商用;但如果你是付费用户,就能直接拿走歌曲,可以在任何情况下商用。


根据美国版权局在2023年3月发布的美国法规第202部分,AI自动生成的作品不受版权法保护。延伸到音乐领域,AI创作的歌曲也不受到美国法律保护。


因此,Suno不清不白,其“所有权”规定也就建立在“空中楼阁”之上。


相应地,国内的AIGC侵权问题同样是核心争议。


虽然平台可以在作品生成阶段,绕开诸如“奥特曼”“迪士尼”的关键词,避免侵权。但从模型训练阶段来看,还是免不了数据集侵权风险——正如Suno和Google所担心的事情,以及OpenAI和微软被《纽约时报》起诉事件。


话说回来,国内AI音乐公司可能轮不上操心,毕竟手握版权和手握训练资源的很可能是同一批人。


从版权所有、音乐生成、社区传播,到生成一篇小作文,这闭环算是玩明白了。


虽然相较Suno,目前X studio充其量算是个“AI声替”,但只要国内巨头永远冲在第一线,后方玩家仅剩“喝汤”。至于没有技术傍身的普通人,还是那句残酷且现实的话“你永远赚不到超出自己认知范围的钱。”


(如需交流欢迎加作者微信:aiyukuailetongzai ,烦请备注公司+职务







推荐阅读




继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存