查看原文
其他

AI for Good 人工智能 成就美好 | AI无界 因你声动


丹棱君有话说:AI技术对社会和产业发展影响日益深远,触发了人们对技术落地的诸多思考与探索。技术创新如何能产生社会影响力,如何促进公益的可持续发展?


在“AI无界 因你声动”活动中,微软及各界志愿者将首批AI有声内容捐赠给北京市红丹丹视障文化服务中心(红丹丹),应用基于微软Azure认知服务的Speech Studio有声内容创作平台,让艺人周迅、红丹丹视障播音员董丽娜授权的定制声音,及多个微软智能语音合成平台声音为文字赋予了情感和生动的表现力。


见证AI有声内容的捐赠后,来自公益界、出版业、娱乐业的专家在“AI+公益”圆桌讨论中分享了洞察与展望,他们是——鹿音苑联合创始人曾宇、北京市红丹丹视障文化服务中心执行主任曾鑫、中信出版集团社会责任部主任孔彦、微软大中华区公益事务总监王岭、微软云计算与人工智能事业部语音组首席产品经理廖勤樱、微软云计算与人工智能事业部首席产品项目管理叶海顺。掌声有请~



下文为速记整理,内容有所精简↓↓↓


叶海顺请大家分享一下,参与公益项目的契机是什么,感受如何?


曾宇:在跟周迅合作过程中,我们一直有制作有声内容的想法,但缺乏好的落地机会。了解到微软 AI 语音合成技术后,我十分惊讶于它和真人语音的相似程度。视障人士听书的速度是正常速度的几倍,需要很大的内容量。其实很多演员都非常热衷公益,但是很难有充足的时间参与录制,但这项技术可以解决这个问题。


曾鑫:红丹丹与微软的合作可以追溯至2006年,我们一直在探索技术改变视障人士生活的方式。2014年,我们合作在微软云上搭建了云端心目图书馆,刚开始是志愿者来录制有声内容,他们白天需要上班,只能晚上抽出时间录音,最快3个月才能完成一本书。市面上的一些读屏软件和语音库,声音相对比较机械。视障人士需要通过听来认知这个世界,对声音效果有追求。去年,我们接触到微软 AI 语音合成技术,听到周迅老师的语音合成声音后,感到惊讶不已,听起来逼真且自然,完全听不出是机器合成的声音。


孔彦:今年夏天,中信出版社和微软志愿者一起,助力红丹丹策划组织了盲生线上阅读夏令营,带着400多全国的盲生云逛中信自然书店,带领他们领略阅读之美。未来我们希望与各方合作,通过技术把更多更好的有版权的内容持续呈现给视障人士,给他们打开一扇全新的阅读之门。


廖勤樱:AI语音技术与无障碍服务中间的联系是非常密切的,语音技术可以帮助机器与人更好地进行交互,也可以让人与人之间的沟通更加高效和顺畅。我们在进行 AI 技术创新的过程中必须考虑到包容性,比如视障人士等不同群体的需求,让技术能够广泛适用、造福所有人。


叶海顺微软智能语音技术有许多不同的应用场景,对各位嘉宾所处领域有什么借鉴之处?哪些应用场景可以扩展给残障人士?

曾鑫:视障朋友当然是希望 AI 语音技术更自然、更真实。对于有语言障碍的朋友,他们也可以利用 AI 语音技术通过随身携带的设备,随时随地把他们想表达的转化为人工合成的声音,例如在主持人跟观众对话的情景。他们也许天生无法发声,但可以通过科技拥有自己的声音,自定义设置温柔或者铿锵有力的风格等等。


孔彦:其实不仅是视障朋友,普通读者也有听书获取知识的需求,出版社请真人去读,可能读几十个小时,读错了还要再剪辑重读,但是通过 AI 语音合成技术可以非常快生成有声读物。同时,出版社很懂书,我们能够帮助不同的群体提供在不同人生阶段所需要的内容,挖掘每个人的潜力,包括视障朋友。


王岭:我认为科技公司把公益和技术相结合的时候,一定要克制“炫技”的冲动,应当站在公益组织的角度去思考应用场景。很多公益组织没有专业的IT人员,科技公司应该用最有效的方式帮助技术落地和普及。例如,这次微软将有声内容创作智能化、工具化,使用者即使没有技术背景也可轻松驾驭。


廖勤樱:我觉得公益不是一次性的努力,微软智能语音团队跟红丹丹或者其他公益组织的合作需要基于可持续的发展。除了呼吁更多的人来参与志愿行动,也需要用简单的技术赋能更多的人。微软智能语音技术可以培训更多的志愿者,让他们可以非常快捷的生成更多有声书,并且我们要与各方共同努力,让技术予力公益形成良性循环的系统。


叶海顺:AI技术的发展为各行各业都带来了巨大的可能性,大家如何看待“科技无障碍”协助公益可持续发展?


曾鑫:从公益可持续发展的角度来看,技术是非常好的工具。尤其是语音合成技术门槛降低之后,更多志愿者能够参与到公益活动中。之前会有志愿者害怕自己声音不好听,不能参与有声书的录制。但我们现在就可以告诉志愿者,不用自己录制,就可以生成高质量、悦耳的有声图书。


廖勤樱:从技术的角度,首先科技公司要持续降低技术门槛,让更多没有技术背景的人能为我们的技术平台和工具受益。第二,我们要持续拓宽技术的边界。语言是人类沟通的方式,人与人沟通的障碍不只有肢体上的障碍,也同样有语言上的障碍,比如说我听不懂某种语言就不能与之交流沟通,但目前的技术创新已经可以支持我们跨语言沟通,我们的技术应用将越来越持续而广泛。


王岭:微软希望在使用人工智能普惠大众的同时,负责任地使用人工智能。例如,微软做的每一个合成声音都会标注来源,提示用户这是人工合成的声音。创造适用于所有人的可信赖的人工智能,微软明确了六个道德基本准则:公平、包容、透明、负责、可靠与安全、隐私与保护。



体验有声内容创作工具平台:

https://speech.microsoft.com/audiocontentcreation


了解更多:




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存