华为发布全球首个为唐诗编曲的AI,一键唱响1300年前大唐盛世
AI下一个能与人类“一比高下”的领域在哪里?
作者 | 奇点
编辑 | WW
公众号 | AI星球
当AlphaGo2016年击败了韩国围棋九段的李世石,新一代“AlphaGo Zero”又在年初《星际争霸2》比赛中以5:2优秀战绩战胜了职业电竞选手,AI在围棋、电竞界可谓“所向披靡”。
试问:AI下一个能与人类“一比高下”的领域在哪里?没错,是音乐。
诗歌文化博大精深,常以文字为载体,为后人传颂千年。但很少有人知道,古代的诗词是唱出来的。近日,华为就在其官方公众号上发布了用AI识别古乐谱为唐诗编曲的最新进展。
三分多钟的短视频里详细的介绍了华为手机Mate 20 Pro在内置麒麟980芯片双核NPU的支撑下,AI是如何重构唐诗曲调的。
视频中,研究人员对着华为Mate 20 Pro朗读《春江花月夜》全诗,AI则借助着手机内置的语音智能识别,便可以判断诗词的语境和情绪。
再加以华为Mate 20 Pro手机内置麒麟980芯片强大的AI算力,从而完成深度神经网络推理算法,使得AI可以把诗歌中每个字句的意境和数据库中的古乐音符进行匹配,最终重构一首唐诗曲调。
1300年前的乐曲,就借由AI算法被重现了。那么,AI是如何实现重构唐曲的。
一开始,研究人员尝试利用AI从当下留存不多的唐诗减字谱中,找回古乐编曲的规律。这上面记载着古琴的指法、弦序和音位。
然后,将古谱的规律编写成程序,用华为Mate 20 Pro手机拍下馆藏的古谱,将其内容翻译成现代简谱、收录到数据库中,在此同时他们会开启云计算,让数据同步到云上(即服务器)。
接下来,研究人员会在服务器上训练神经网络模型,让AI进行古谱的深度学习,使得AI具备能力去识别出古乐谱的音高规律。
这样,AI就掌握了古乐编曲的能力。之后,再将训练后的AI模型迁移至华为Mate 20 Pro上。
之后,就该华为手机中内置的麒麟980芯片“大显身手”了——麒麟980芯片能够让手机有足够的算力支撑其在端侧运算,从而将一键生成古曲。
于是,1300多年前的唐诗乐曲就能瞬间回荡在我们耳边。
揭谜麒麟980芯片的AI心脏——NPU
这款AI芯片麒麟980之所以具备如此高的算力,是因为在它的左心房上“跳动”着一颗AI心脏——内置双核NPU。
2017年10月,华为正式发布了麒麟970——全球首款内置NPU的人工智能处理器。此后,“NPU”这个词便以“高大上”的形象深入人心。但NPU主要起到什么作用?它到底厉害在哪里呢?
NPU(神经网络处理器,Neural-network Processing Unit)是AI芯片中内置的一颗神经网络单元,它的运算结构模仿了人类生物神经细胞的运作模式,而且,相较于传统的CPU和GPU,能够更迅速的对外界信号做出反应。
根据测试发现,基于NPU对图像识别处理、自然语言理解处理速度比CPU快了25倍,能耗则可以降低50倍,它的AI计算能力超强,具体可以达到1.92万亿次/OPS(operations per second/每秒操作数)。
而在华为去年发布的麒麟980中,其内置的双核NPU则更强悍。在麒麟970的算力之上又进行了升级,AI的算力达到了上一代的2倍(约3.84万亿次 /OPS)。
借由AI的算法和强悍的算力,华为Mata 20 Pro实现了AI重构唐曲,也是情理之中。
其实,早在华为为我们重构唐曲前,AI就已经近进军音乐界多年。
AI作曲:巨头公司“各显神通”
OpenAI的MuseNet
2015年埃隆·马斯克创立OpenAI,希望OpenAI能在推动人工智能上发挥积极作用。
2018年,OpenAI组建的电竞战队OpenAI Five在《Dota 2》比赛中全胜归来之后。
今年4月,OpenAI发布了深度神经网络—MuseNet,它可以使用 10 种不同乐器、以及风格如乡村乐、莫扎特、披头士乐队等,制作出长达4分钟的音乐作品。
OpenAI在博客中表示,MuseNet 并不是像人类一样通过对音乐的理解来进行编程,而是学习预测 token 来学习和声、节奏、风格的模式。
它会从许多来源收集 MuseNet 的训练数据,像是 BitMidi 网站上的文件、MAESTRO 的数据集等。当MuseNet 吸收了比如流行、爵士等多种音乐风格后,就能混合生成新的音乐。
MuseNet看似完美,但实际也有不小的缺陷,OpenAI 研究人员 Christine Payne 表示,MuseNet目前仍有局限性,因为它是通过计算所有可能的音符和乐器的概率来产生每个音符,所以偶尔也会有不和谐的选择,会出现奇怪的配对。
但无论如何,OpenAI的音乐探索之路还在继续着。
谷歌的Magenta和Song Maker
Magenta 是谷歌大脑的一个致力于用机器学习创造引人入胜的音乐和艺术的项目,其目标是利用机器学习开发人类表达的新途径。
2017年,该项目的研究小组推出了一个名为 NSynth Super(Neural Synthesizer)的神经网络合成器,使用深度神经网络在单个样本的水平上合成声音。
有趣的是,谷歌将这个声音合成器做成了一个浏览器可玩的神经网络音频合成器。
在主界面上,我们就可以对其进行直接操作,点击红蓝按钮来选择你中意的音色,加以滚动条进行你个人专属音色的设计,然后在通过一个虚拟的键盘上,我们就可以即兴创作了。
谷歌团队也表示说:“Magenta的目标不仅仅是开发新生成算法,而是关闭人类创作中‘创意循环’,我们不是用AI代替人类的创造力,而是努力让工具更深入地理解音乐,让它们更直观、更有启发性。”
很快,第二年就推出了新的产品——Song Maker。
2018年3月初,谷歌开源音乐教育平台Chrome Music Lab上线了一款全新的免费音乐创作工具Song Maker。
这款产品正如它的名字——音乐创作人,最大的特点就是它可以基于用户的选择对音符范围进行限制,即使是没有音乐基础的人也可以创作出动听的音乐。
这个音乐创作工具是基于谷歌浏览器,而且它的操作也很简单,上手非常容易,谷歌想要通过可视化的方法,真正的帮助人类理解音乐。
Song Maker音乐创作工具整体上来讲,是由两部分的音序器构成,大的用来控制旋律,最下面的小格子则用来控制节奏。使用者可通过配合鼠标、键盘来操作,点击方格来进行属于你的个人创作。
当然它还有个神秘的功能,使用者还可以进行简单的后期制作,将你的作品保存下来传送给他人一起分享。
巨头们在音乐界掀起的这场AI“跨界试验”,随着AI越来越聪明,在音乐创作上也会越走越远。
机器可以代替音乐作家做一些基础性的工作,耗时短、速度快,同时也在一定程度上增加了音乐创作者的创造力,并且为更多没有接受正规音乐教育,但同时热爱音乐的人敞开了大门。
-END-