查看原文
其他

各具特色的语音导航,你会pick 谁? | 青晚报

中大青年 2022-06-11



“OMG!前方为事故多发地段,MM们一定要谨慎驾驶哦!”
“你看前方这个服务区也太好了吧,MM们,停它,停它,停它!”


今年双十二,“魔鬼导航员”李佳琦语音导航正式在高德地图上线,一秒醒脑,魔性的导航语音包引起大家热烈讨论。高德地图官方微博的评论下,甚而有网友高呼:“现在就去买车!”


导航功能实用便利,随着人们出行时对地图导航需求的增加,语音导航发展迅速。此前,多个明星语音导航包上线各大导航平台,例如在高德地图上,已有林志玲、倪妮、岳云鹏等明星的语音。


除了明星语音包外,还有哪些类型的特色语音导航呢?语音导航的背后,又藏着什么秘密呢?今天,就来和小青一起看看吧。


语音导航都有哪些?


小青盘点了高德地图、百度地图、腾讯地图三款热门导航软件,其中可供选择的特色语音包主要有以下三类:


1

方言类


在语言系统里,各地方言便是不同地域的精粹。不同的方言能勾起身处异乡的游子深沉的思念,也能为下班途中疲乏的身体注入欢愉的血液。


在高德地图和腾讯地图两个平台上,湖南话、四川话、河南话、台湾话、东北话、广东话等纷纷上榜。


图源 | 高德地图、腾讯地图


听着这些亲切的乡音,我们的行车旅程或许能增添不少乐趣呢!当然如果你想学习掌握一门方言,经常使用方言语音包,以达到“耳濡”的效果,不失为一种有效快捷的选择


2

游戏类


近些年,电子竞技如日中天,由此引发了游戏语音包的热潮。游戏语音导航包重现游戏中人物的经典语句、游戏专用语等,让用户身临其境,能够体验现实生活中的虚拟世界。



图源 | 高德地图、百度地图


听着这些熟悉的语句,是否让你心潮澎湃,从而褪去长途驾驶的疲惫,精力充沛、活力满满地继续前进了呢!


3

明星类


除了以上两种形式外,导航平台通常还会邀请明星们加盟。这些明星或许有强大的粉丝后援团,有较大的明星影响力;或许有独特的嗓音,激情、甜美、知性、搞笑……各种类型,任君挑选。明星类语音包占据着语音包商城的绝大部分版面,是很多人的不二之选。


图源 | 高德地图、百度地图


有没有眼花缭乱呢?明星语音包带给我们最直观的体验就是互动感,仿佛大荧幕上的人物在与自己对话呢!行车途中,便不会感到寂寞啦。


4

私人定制类


在百度地图和高德地图上,用户甚至可以私人定制声音,录入自己的声音作为导航,同时发布在平台,也能让更多人听见你的声音哦。


图源 | 百度地图


导航语音从何而来?


语音导航在增添出行趣味性方面各显神通,但是,这些语音导航真的来自明星本人吗?


科大讯飞的董事长刘庆峰在2018世界机器人大会上表示,高德地图导航上面的林志玲、郭德纲的声音其实都不是本人原音,而是由他们的机器合成的


这,不就是我们小时候梦寐以求的柯南的领带变声器吗?


图源 | 澎湃新闻


那么,神奇的变声合成技术在现实生活中又是如何实现的呢


能够实现声音合成的网站为Modulate.ai,只要在网站提供的接口处录下声音,选择你想要的“性别”或者“名人”,网站会很快生成你想要的声音。据网站介绍,合成的声音是采用神经网络训练生成的,具有低延迟性以及实时性


百度在18年的3月份曾经宣布,百度开发的新 AI 算法Deep Voice可以通过3.7秒钟的录音样本数据就能完美地克隆出一个人的声音。Deep Voice是百度AI研究院一个由深度神经网络构建的高质量语音转(TTS )系统。除了利用少量样本克隆声音外,系统还能将女性声音转变成男性,英式声音变成美式。


Deep Voice推理线路 

图源:https://arxiv.org/pdf/1702.07825.pdf


科大讯飞的变声技术更是令人惊艳,该系统在voice conversion Challenge 2018国际音色转换大赛中获得全部指标第一名,也是音色和相似度上唯一一家超过4.0MOS分的系统(MOS值是通信术语,值常以衡量通信系统语音质量的重要指标),另外,还拿了12个语音领域权威比赛的世界冠军,在国际最权威的语音识别、合成和自然语言理解比赛中继续保持了全球领先技术优势。


声音的直接转换是比较复杂的,因为一个人的“声音”不仅是由声带定义,声带只是声音的频率,具体来说,还取决于口音和说话风格。另外,音高会受胸腔的物理特性等的影响。


开始合成语音时,所要建立的系统是:把一个人说话的声音的频率分布换成另一个声音的频率分布,同时保持声音其余属性不变


因此,需要将系统分为两个部分:语音识别和语音转换。两者最主要的区别是——语音和文本的双向转换。在这个过程中,技术难点就在于如何通过文本表示输入的语音,以及如何将文本输出成有特定属性的语音。


图源 | 得意音通技术


目前的思路是通过机器学习来完成这一过程。机器学习,特别是深度学习,当被训练来完成一项特定的任务时,一直表现得非常好。但是一般的自动编码器没有接受过语音转换的训练,因此,为了实现这一过程,该系统必须进行语音转换方面的机器学习,才能根据文本生成可靠的语音。


你觉得最有特色的语音导航是哪一个呢?快来留言和大家分享吧!


在近期举办的“百强校媒投票活动”中,小青想让大家为中大青年投上宝贵的一票!希望同学们能积极参与!

识别二维码,后台回复“446589”

参与“百强校媒投票活动”


推荐阅读
(点击图片即可阅读)

昨晚榕园广场上,尖叫与流星一起划破夜空 | 中青快讯


山河已无恙,吾辈当自强 | 青晚报



今日小编:李舒敏、朱茜
图片来源:高德地图、腾讯地图、百度地图、
澎湃新闻、得意音通技术
初审:郑梦婕、万永昊
审核:刘洁予
审核发布:马明辉


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存