AI for Good 人工智能 成就美好 | AI无界 因你声动
丹棱君有话说:AI技术对社会和产业发展影响日益深远,触发了人们对技术落地的诸多思考与探索。技术创新如何能产生社会影响力,如何促进公益的可持续发展?
在“AI无界 因你声动”活动中,微软及各界志愿者将首批AI有声内容捐赠给北京市红丹丹视障文化服务中心(红丹丹),应用基于微软Azure认知服务的Speech Studio有声内容创作平台,让艺人周迅、红丹丹视障播音员董丽娜授权的定制声音,及多个微软智能语音合成平台声音为文字赋予了情感和生动的表现力。
见证AI有声内容的捐赠后,来自公益界、出版业、娱乐业的专家在“AI+公益”圆桌讨论中分享了洞察与展望,他们是——鹿音苑联合创始人曾宇、北京市红丹丹视障文化服务中心执行主任曾鑫、中信出版集团社会责任部主任孔彦、微软大中华区公益事务总监王岭、微软云计算与人工智能事业部语音组首席产品经理廖勤樱、微软云计算与人工智能事业部首席产品项目管理叶海顺。掌声有请~
下文为速记整理,内容有所精简↓↓↓
叶海顺:请大家分享一下,参与公益项目的契机是什么,感受如何?
曾宇:在跟周迅合作过程中,我们一直有制作有声内容的想法,但缺乏好的落地机会。了解到微软 AI 语音合成技术后,我十分惊讶于它和真人语音的相似程度。视障人士听书的速度是正常速度的几倍,需要很大的内容量。其实很多演员都非常热衷公益,但是很难有充足的时间参与录制,但这项技术可以解决这个问题。
曾鑫:红丹丹与微软的合作可以追溯至2006年,我们一直在探索技术改变视障人士生活的方式。2014年,我们合作在微软云上搭建了云端心目图书馆,刚开始是志愿者来录制有声内容,他们白天需要上班,只能晚上抽出时间录音,最快3个月才能完成一本书。市面上的一些读屏软件和语音库,声音相对比较机械。视障人士需要通过听来认知这个世界,对声音效果有追求。去年,我们接触到微软 AI 语音合成技术,听到周迅老师的语音合成声音后,感到惊讶不已,听起来逼真且自然,完全听不出是机器合成的声音。
叶海顺:微软智能语音技术有许多不同的应用场景,对各位嘉宾所处领域有什么借鉴之处?哪些应用场景可以扩展给残障人士?
曾鑫:视障朋友当然是希望 AI 语音技术更自然、更真实。对于有语言障碍的朋友,他们也可以利用 AI 语音技术通过随身携带的设备,随时随地把他们想表达的转化为人工合成的声音,例如在主持人跟观众对话的情景。他们也许天生无法发声,但可以通过科技拥有自己的声音,自定义设置温柔或者铿锵有力的风格等等。
孔彦:其实不仅是视障朋友,普通读者也有听书获取知识的需求,出版社请真人去读,可能读几十个小时,读错了还要再剪辑重读,但是通过 AI 语音合成技术可以非常快生成有声读物。同时,出版社很懂书,我们能够帮助不同的群体提供在不同人生阶段所需要的内容,挖掘每个人的潜力,包括视障朋友。
叶海顺:AI技术的发展为各行各业都带来了巨大的可能性,大家如何看待“科技无障碍”协助公益可持续发展?
曾鑫:从公益可持续发展的角度来看,技术是非常好的工具。尤其是语音合成技术门槛降低之后,更多志愿者能够参与到公益活动中。之前会有志愿者害怕自己声音不好听,不能参与有声书的录制。但我们现在就可以告诉志愿者,不用自己录制,就可以生成高质量、悦耳的有声图书。
廖勤樱:从技术的角度,首先科技公司要持续降低技术门槛,让更多没有技术背景的人能为我们的技术平台和工具受益。第二,我们要持续拓宽技术的边界。语言是人类沟通的方式,人与人沟通的障碍不只有肢体上的障碍,也同样有语言上的障碍,比如说我听不懂某种语言就不能与之交流沟通,但目前的技术创新已经可以支持我们跨语言沟通,我们的技术应用将越来越持续而广泛。
体验有声内容创作工具平台:
https://speech.microsoft.com/audiocontentcreation
了解更多:
微软深度神经网络语音,定制个性化的自然人声 微软智能语音新增 5 个角色 “飙演技” 对话智能有声内容创作志愿者 | AI无界 因你声动 技术分享 | 从微软智能语音合成到智能有声内容创作 AI无界,因你声动:微软携手公益和行业伙伴,以科技助力爱心绽放 微软上线语音评测功能:赋能口语学习的教与学 让电脑说人话 | 数字化转型 ING 全新内容时代,知识生产如何拥抱人工智能? 如何让 AI 语音合成听上去更有“人情味”? 打破定制化语音技术落地怪圈?从讲一口标准英音的语音助手说起 微软智能语音多情感技术升级,晓晓中文语音突破14种风格