其他

以后你听到的声音可能都是机器发出来的

2018-01-02 能量君 科技富能量

之前,富老板有测评过一款科大讯飞的产品——译呗翻译宝,富友们还记得吗?


>>点击查看译呗翻译宝视频测评


视频中的富老板使用的译呗翻译宝是科大讯飞出品的一款随身翻译宝。要知道,科大讯飞是目前最大的智能语音公司,讯飞输入法就是出自科大讯飞,讯飞的语音输入用过的都说好,而且华为、锤子等用的都是科大讯飞的语音系统。所以说这款翻译宝的语音识别和即时翻译功能都是杠杠的。



是不是觉得翻译宝中的美女声音还是挺动听挺自然的?都说听声辩人,但是科技发展的今天,可能以后光听声音是辨别不出是语音合成还是真人的声音了。


这不,谷歌的一项最新黑科技曝光(最近谷歌新闻很多呀,是要搞事情呀),其最新版人工智能语音合成系统Tacotron 2几乎与真人声音无法区分,来,放给富友们听听:


https://v.qq.com/txp/iframe/player.html?vid=q052667s76b&width=500&height=375&auto=0


除了语速快点,没有像人说话时的抑扬顿挫,“她”说话的声音已经算比较自然了。


语音合成技术简单的来说就是自动让文字转变为语音,说语音合成富友们可能觉得有所陌生,但是在实际生活中我们都有用到,比如电子阅读、车载语音导航、银行医院排号系统、交通播报等等,这些应用场景都离不开语音合成。



从合成的发展历史来看,表现力、音质、复杂度和自然度一直是合成技术所追求的四点。但是目前水平下的合成语音很难体现出情感特征,例如在韵律表现上不够灵活,声调变化上相对死板。


让机器拥有自然、有情感、高表现力的声音,依旧是语音合成技术的一大难点。所以谁可以解决这方面的技术难题,无疑又会分得市场的一大块蛋糕。


富友们最期待这项技术的成熟应用到什么场景上?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存