角色扮演声音不够用?亚马逊为 Alexa 开发者工具新增八种声音
技能开发正在变得越来越有趣。
- shenzhenware -
当地时间 5 月 16 日,亚马逊发布新的开发者预览版,为 Alexa 语音技能开发者提供了八种不同的 Alexa 声音版本。该服务由 Amazon Polly 提供,包含美式、英式两种英语发音以及男、女声版本。
Amazon Polly 是亚马逊于 2016 年 AWS 大会发布的人工智能技术服务,利用机器学习技术,能够快速实现从文本到语音的转换,开发人员可创建出各种不同的人声效果。如今,Polly 的发音与人声已经非常接近,共拥有 47 种男性或女性的发音,支持 24 种语言。
新增的八种 Alexa 声音对语音技能开发者无疑是一个利好。尤其一些故事技能开发,不同的角色需要不同的声音来演绎。而此前,为了做到这一点,开发者还需要进行录音、将录音文件上传到工具等繁琐的操作。如今,开发者只需在 Amazon Polly 使用语音合成标记语言(SSML),将语音名称标记成他们想要的声音。
类似的,亚马逊在 3 月份也已经为 Alexa Skills Kit 推出一套音频工具包。该音频工具包相当于一个音频剪辑存储库,包含动物、战斗、交通、科幻、掌声等 14 种类型的声音。开发者可以利用这些声音给他们开发的 Alexa 技能添加各种音效,以便为游戏、有声读物等内容营造气氛。
在上周的 Google I/O 2018 大会上,Google 就宣布将为 Google Assistant 新增 6 种不同声音的消息,其运用的是基于 WaveNet 的神经网络技术,也类似 Amazon Polly。不过与亚马逊不同的是,该服务面向用户端,届时,也将有可能加入到 Google Assistant 技能开发工具当中。■
编辑:莱恩/ 深圳湾
< 亚马逊是如何带起语音热? >
// 年度盘点 //
// Echo 大家族 //
Echo Spot | Echo Show | Echo Look
// Alexa //
未来规划:占领了语音智能半壁江山后,下一步怎么做
开发者扶持:推出技能内购买模式,帮助开发者能赚钱
跨平台合作:与微软联姻,提供跨设备、跨平台的服务
打造语音 App Store:技能付费政策,开发者获七成收入
海外拓展:印度、日本、澳大利亚、新西兰
(更多内容,可移步深圳湾官网查看)
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。