查看原文
其他

让科学触达观众,AI模拟人声讲述《创新中国》

2018-02-09 王晓杨 综艺

不明觉厉!《创新中国》不仅展现了中国最新科技成就和创新精神,还开世界先河利用人工智能模拟人声完成配音。


近日,由中央电视台和深圳市委宣传部联合出品,CCTV-9纪录频道和深圳广播电影电视集团联合摄制的6集纪录片《创新中国》首播收官。CSM媒介研究全国网数据显示,该片播出期间,CCTV-9纪录频道收视率比去年同时段提高了17﹪,收视份额提高了10%。


《创新中国》共6集,内容包括《信息》《能源》《制造》《生命》《空海》和《潮起》,展现了中国最新科技成就和创新精神,此外,该片也是世界首部利用人工智能模拟人声完成配音的纪录片,节目解说部分全程运用人工智能配音。


让科学触达观众

《创新中国》总导演史岩表示,“《创新中国》的策划、产生是当下中国社会发展的时代需求,是央视作为国家主流媒体自发自觉的社会责任担当。创新的范畴很大,包括制度创新、理论创新、文化创新等方面,但科学和技术的进步是创新的核心力量所在,所以我们选择科技创新成果作为主要切口,来呈现今天中国的创新故事。”《创新中国》不仅讲述了科技知识本身,更重要的是讲述了默默耕耘的科学家和创新者们在创新过程中发生的故事和展现的精神。在面临新一轮产业革命和技术革命的时代背景下,该片呼吁全社会聚焦推动中国科技发展的脊梁人物。


《创新中国》制片人刘颖表示,《创新中国》不仅要深入浅出地讲解科学知识,更重要的是将对科学的尊敬、对科学精神的尊敬和对创新者的尊敬触达观众。



科技题材纪录片拍摄难度大,对导演要求比较高,因此,国内此类题材的纪录片也比较少。“比如,如何在有限的时间里,将量子、中微子等‘不明觉厉’的科学名词直观地呈现给观众?”史岩认为这是《创新中国》的制作难点,也是看点。在主题选取上,6集内容涵盖了目前世界范围内普遍关注的科技前沿技术领域。节目中展现了我国自主研发的大飞机C919、第三代核电华龙一号、搜索宇宙信息的天眼等“大国重器”;还展示了无人机快递、解决交通拥堵的城市大脑智慧管理系统、无人驾驶等与百姓生活密切相关的高科技;以及“给蚊子绝育”“返老还童”等黑科技。史岩介绍,《创新中国》拍摄了近80组人物故事,但考虑到篇幅和内容结构编排,最终只呈现了47个。


此外,片中运用了大量的动画演示,并运用微观摄影等拍摄手法将复杂玄妙的科学世界可视化,让观众更容易理解。“我们确立了希望抵达观众的目标。但是这个过程中,没有人知道捷径。做《创新中国》就像科学家做科研工作一样,我们做了无数次的‘实验’。遇到难以呈现的科学现象,就转换思路,尝试多种表达方法。片子出来后大家一起提意见,反复打磨,用心制作每一个故事,令其既要符合科学知识,表达创新精神,也要生动感人。”刘颖说。



史岩表示,节目组非常关注观众反馈,网络平台上的弹幕是最直接的反馈,“我们在B站看到很多网友的弹幕留言,大家对于这部片子的喜爱,对于先进科技的好奇心让我们深感欣慰。”

人工智能配音

史岩介绍,《创新中国》采用人工智能模拟人声完成配音,是偶然也是必然。节目组找配音员试配过,但是始终无法达到心目中大片的质感。史岩想起了已逝的知名播音员、配音演员李易,2011年CCTV-9纪录频道成立时,李易曾为第一部纪录片《美丽中国》配音,他的声音音质纯粹,语感稳定,是央视纪录频道的标志性声音。史岩突然想到,如果可以用人工智能将李易的声音复制出来,不仅能为这部作品找到理想配音,同时也践行了节目组科技创新的核心制作理念。


随后,史岩联系了一直为CCTV-9纪录频道做音频工作的李易的徒弟王同,王同听后非常兴奋。在得到李易家属的支持后,史岩团队立即飞赴安徽合肥,开始与科大讯飞接触。


首次见面,科大讯飞AI研究院研发主管江源告诉史岩团队,运用他们拥有的顶级人工智能语音合成技术,用标准的普通话合成出一段新闻稿,已经不存在技术问题。但是,情感是一种不容易量化和学习的复杂参数。运用人工智能技术为纪录片配音,这对他们来说也是一次优化算法、提升人工智能水准的机会。于是,双方顺利达成合作意向。


回到北京,王同团队根据史岩对《创新中国》“平缓叙事”的声音要求,从李易为纪录频道录制的大量声音中精心选出17个小时的素材交给科大讯飞AI研发团队(以下简称AI研发团队)。AI研发团队从音色、韵律、内容三个方面进行量化分析。


AI研发团队是人工智能语音分析研究和计算机程序的专家团队;王同团队则更了解纪录片解说词的具体要求和纪录片整体制作流程。两个团队发挥各自优势,紧密配合,建立了一套顺畅高效的合作流程。



首先,由导演组向AI研发团队提供解说词,AI研发团队进行人工整理分析,标注好需要计算机特别注意的点,合成音频文件。第二步,AI研发团队对音频文件进行初步判断筛选,将优化后的版本交给王同团队。同时,还提供一个带编号的解说词文本,每一句话一个编号。前两个流程,AI研发团队一般需要5天左右的时间。第三步,王同团队将合成音频文件摆放在片中的对应位置,进行第二轮筛选。找到不符合要求的音频,就在带编号的解说词文本上做好标注,尽快反馈给AI研发团队进行处理。音频不满足要求的原因包括连贯性不好、重音位置不对和断句位置不对等。这个步骤,王同团队需要3天左右的时间。第四步,AI研发团队进一步做音频的焦点处理,同时,王同团队开始对声音进行精剪。这个工作需要3天左右的时间。第五步,将AI研发团队调整后的音频替换进片子里,王同团队继续做剪辑。最终,执行总导演查看配音是否还存在硬伤,并由执行总导演当场改词,以尝试其他可能的组合方式。



史岩回忆称,第一次听到AI研发团队做的人工智能合成音频,导演组还是很惊喜的,音频相似度达到60%以上。《创新中国》每集的音频大概要进行三个来回的反复修正,经过不断优化,达到最终呈现效果。


刘颖表示,“人工智能语音合成技术这个创新的想法,点燃了我们整个团队的创作欲望。同时,这项技术的运用也引发了业界内外关于人工智能、语音合成方面的思考。《创新中国》采用人工智能语音配音的意义就在于我们走出了这一步,推动了艺术与技术的结合。”

推荐阅读


家国情怀 创新互动 星光璀璨 看2018湖南卫视春节联欢晚会如何“欢呼中国年”


印度电影缘何走热内地影市?《神秘巨星》解开谜底


造密室、还原峡谷,“实景”综艺玩法考究


如需转载请在文章开头注明来源,并附上原文链接。更多资讯请登录手机版“综艺+”m.zongyijia.net

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存