查看原文
其他

CCTV-1《机智过人》小驰一展歌喉,这是你不知道的歌声合成!

AISpeech 思必驰 2022-12-07

由中央电视台和中科院共同主办,聚焦智能科技的人工智能挑战类节目《机智过人》目前正在CCTV-1综合频道热播,著名主持人撒贝宁、青年演员江一燕,以及徐颖、张建伟等多位科学家们组成了“机智见证团”,与全国观众一起见证了最顶尖的人工智能科技成果。


这期CCTV-1《机智过人》

来自思必驰的“小驰”一展歌喉

真假“周星驰”傻傻分不清

有没有被惊艳到?


(视频长约45分钟,请在wifi环境下观看,土豪随意)

https://v.qq.com/txp/iframe/player.html?vid=i0024elf7su&width=500&height=375&auto=0


歌声合成

I Want You

拯救五音不全的你!


人机大战这个话题并不新鲜,围棋场的胜败已成过往,但以AlphaGo为典型代表的人工智能却被人们津津乐道,机器是否终将战胜人类、取代人类?答案不得而知,但CCTV-1《机智过人》却率先带领大家共同领略人工智能的最新风暴!


百变“小驰”的魔力

9月22日晚,思必驰联合创始人/首席科学家俞凯携“小驰”歌声合成项目,亮相CCTV-1《机智过人》。俞凯教授介绍到,“小驰”是个能说话会唱歌的机器人,可以模仿任何你想要的人的声音,为你说话、唱歌。通俗来说,不是截了录音,而是用了一个模型,像一个函数一样,它可以生成,你想要什么样的音调,就生成什么样的音调。



“我将要听一首我自己演唱的,我从没唱过的歌?”


没错!拥有百变声音的“小驰”,采集了撒贝宁在《今日说法》中的说话声,通过算法合成,用撒贝宁的声音生成了一曲他从未唱过的歌曲《好久不见》。撒贝宁现场表示,该歌声的“声音的相似度基本在90%以上”。在第一轮的检验环节中,小驰又凭借一曲“周星驰”的《红烧鸡翅膀》顺利通过检验。



小驰强大的“歌声合成”技能是在俞凯教授的带领下,由思必驰研发团队携手上海交大思必驰人机交互实验室打造。


小科普:

歌声合成是语音合成领域的一个分支,是给定文字和乐谱,生成唱歌语音的过程。主体方法是在文字到语音合成的基础上,通过乐谱给定每个“汉字”的音调和“汉字”的发音长短,汉字以不同的音调合成出来就变成了歌唱。


唱歌模型是在朗读模型的基础上,通过改变声调实现文字与旋律的配合,并进一步利用深度学习去学习同一说话人演唱歌曲和朗读歌词之间频谱特征的差异。朗读模型是基于深度学习的统计语音合成系统。将数字音频通过信号处理的方式转换成频谱特征,通过深度学习去学习文本和频谱特征的关联。


语料数据采集困难重重

真人语料对合成特定说话人声音至关重要。俞凯教授表示,在节目筹备初期,除了解要合成名人歌声外,思必驰团队对录制细节一无所知。无法收集“周星驰(石班瑜)”“撒贝宁”等真人高质量音频,而大部分影视作品里的声音音质无法用于模型训练。



整个项目的难点就是想尽各种办法找来或者模拟各种高质量的数据,例如,采集配音演员声音、大规模训练各种参数的模型、采用音频转换生成各种相似数据等等。采用较多的数据训练平均模型,再采用自适应的方法在特定说话人的小数据上合成。”俞凯教授如是说。


此外,节目现场存在种种不确定因素,如录制环境、音频设备、侧重点、歌曲和说话合成要求的不断变化等,这都为“小驰”带来了极大的挑战。思必驰团队只能利用已有资源做最充分的准备。


语音合成与交互体验


在最后一轮检测环节中,一曲《青春修炼手册》律动感十足,“小驰”被现场大众评审团辨识了出来。跌宕起伏,如释重负,这确实是一个非常艰难的挑战,甚至是一个几乎不可能完成的任务,如果要和非专业歌手对比还好,但“小驰”面对的是长期模仿明星的专业歌手。人耳对音频的敏感度远远大于视觉,机器合成的音频不可能没有瑕疵,而任何一点瑕疵都会让听众发现问题。


确实,合成音的质量将直接影响用户的整体交互体验,它是人机交互过程中至关重要的一环,好的合成音,自然而亲切,交互更加人性化。“小驰”不仅会唱歌,也可用数十种不同的高质量合成音与你对话,如周星驰、林志玲、葛优、童声、标准男生、标准女声等等。这一技术来自思必驰,这个专注人性化交互的语音平台公司。


思必驰高质量合成音:


思必驰的语音合成技术极具情感,那么,正如撒贝宁所言“怎么把歌唱当中,歌者的情感给输入进去?”俞凯教授的回答是“目前所有的人工智能在现在大部分都是数据驱动的,所以它是去学,只要你教它情感,它就学会情感。”逐渐地,无论是歌声合成,还是语音合成,思必驰将不断通过算法优化,推动机器学习的进步,让机器更像人,让声音更自然。


未来人机交互将走向融合



在节目的最后,机智团嘉宾表示“现在很多年轻人在外打拼,没有办法陪伴父母、子女,语音合成这项技术刚刚好,可以合成父母的声音给孩子讲故事,合成子女的声音给父母读报纸。”这是人工智能带来的美好,实然,对于人类而言,人工智能并没有成败而言,它兴起于人类,它注定会带来科技的变革。


俞凯教授表示,未来人与机器将走向融合。人工智能的本质是更好的服务人类,成为人类的助手,人类的朋友。此前,机器可以在具备规律性的智能任务上比人取得更高的精度,这已被多次验证,未来机器是否能表达以假乱真的“人性化”情感还是未知,但是目前人工智能正朝着更人性化的方向。


《机智过人》栏目考验和验证了当前最热门的人工智能技术,但同时,节目更大的意义在于带来科普性的内容,让大家了解到AI在社会生活中的实际应用,吸引更多的年轻人来做科学研究。这积极响应了国家目前大力推进和普及人工智能的政策,这也让人工智能以更有趣跟亲切的方式走进大众的生活。




读阅多更


思必驰DUI正式发布,赋能智能终端开启对话时代

AI不平凡的你,思必驰2018校招全线启动!

再度上榜!思必驰被高盛AI报告列为行业核心玩家首位

原阿里iDST语音团队负责人初敏加入思必驰,任北京研发院院长




  ◆  END ◆   


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存