其他
逃离无声的世界,跟AI一起听叶落的声音
新智元报道
新智元报道
编辑:梦佳、白峰
【新智元导读】9月27日,是第63个国际聋人日。在国际聋人日结束两天后,YouTube却取消了可以帮助听障人士的字幕选项,让人唏嘘。数字时代如同一个未曾停歇的洪流。而在这洪流之中,听障人士因为被按下了「静音键」而被数字世界渐渐遗忘和抛弃。毕业于哈工大的张建宗找到了帮助听障人士触碰数字世界的途径。
逃离一个无声世界,听障人士如何踏上「数字班车」?
你的世界声色犬马,五彩斑斓,然而有没有想过,在我国有2780万听障人士,还生活在一个寂静无声的世界中。
移动互联网、人工智能、云服务等信息技术快速发展的今天,数字时代如同一个未曾停歇的洪流,滚滚向前。而在这洪流之中,这些听障人士因为被按下了「静音键」而被数字世界渐渐遗忘和抛弃。
作为一名技术人,哈尔滨亿时代数码科技开发有限公司的技术负责人张建宗很早地注意到了这当中的隐忧。 他毕业于哈尔滨工业大学,计算机科学与技术专业。名校加身,前途一片光明,本来有大把的机会可以进大型企业工作,但在这些机会中,他并没有找到自己想要找寻的「意义」。 此后多年,他全身心地投入到了信息无障碍领域的产品开发工作中,矢志不渝。 加入亿时代对于张建宗来说是一件有价值的事,有情怀的人做起事情来总是很有动力。2008年北京奥运会和残奥会期间,亿时代给予全程网站无障碍技术支持。
于是,在张建宗的脑海里,一款具备语音文字互转、实时视频语音字幕转写、在线远程视频手语翻译功能的应用构想应运而生。紧接着就是9个月的努力开发和迭代优化,终于「畅听无碍」APP正式上线,开始免费向听障用户提供服务。
畅听无碍,接过了数字世界的传声筒,刷剧学习无障碍
孔庆贤是畅听无碍APP第一位手语志愿者,她已经从事帮助听障人士的工作有12年之久。据她描述,自己做这件事的初衷是因为目睹了一次在教堂举行的聋哑人婚礼,他们用嘶哑的声音喊出了「我愿意」。 正是出于这份感动,她辞掉了本职工作,义无反顾地致力于用手语翻译帮助听障人士。 但毕竟仅仅通过单一的人力来帮助听障人士,力量还是太稀微了,弥合数字鸿沟,需要技术的大力加持和资源的汇集。 在畅听无碍APP上,听障人士可以通过远程视频方式与专业的手语翻译进行沟通,再由手语翻译和医生、政府、警察、律师、窗口办事人员、 亲友等进行沟通。达到辅助听障人士沟通的目的。
此外,在多人会议交流等场景,「畅听无碍」可以提供全程录音功能和文档保存功能,并一键分享到微信、微博、QQ等进行二次采集编写,对于听障朋友而言,他们不必再被不明来龙去脉的会议结论而困扰。声音,如此得以被「看见」。
而这些看的见的声音,来自华为云。
现在语音转写技术,大都使用了很深的神经网络,在实验环境的准确率和转写速度相差不多,但是实际使用中却参差不齐,而使用畅听无碍的用户所处环境复杂多样,对语音识别和转写的稳定性要求更高。 华为云的语音转写技术,将词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升了编解码速度和转写准确率,一句话,一段话,多人群聊等场景都能很好地适应。 语音转写可以帮助听障人士「听」到别人说的话,而要想更好地沟通,声音无疑是最好的方式,畅听无碍不仅可以把语音实时转写成文字,也能将文字合成为接近真人的发音,让听者感受不到差异,输出的语音音色和语速都是可调的,听起来更加自然,也让冰冷的技术更加人性化了。
基于AI技术的「畅听无碍」APP,不仅仅是解决了听障人士简单的交流问题,更重要的是对于他们生活质量的提升,让他们感受到了世界的善意与美好。 而这正是AI本该有的样子,技术本该有的温度。
「数字包容」惠及全球5亿人,这才是AI正确的打开方式
从基础的社交、办公到生活娱乐,AI技术助力「畅听无碍」惠及了听障人士生活的方方面面。从此,一个原本无声的世界,因为有AI的加持,而变得绘声绘色。有这样的初衷,技术也不再是冰冷的代码和算法,而是一个个鲜活的个体更丰富的生活。 2019年,华为曾发出「TECH4ALL数字包容」倡议,希望通过技术、应用和技能,赋能每个人、每个家庭、每个组织,实现数字包容愿景,共同构建万物互联的智能世界。
「畅听无碍」为面向残障人士志愿服务的免费软件。
当前虽然「畅听无碍」APP通过人工智能技术可实现语音文字互转,在一定程度上辅助了听障人士的沟通与生活,但在一些场景下,仍需要手语志愿者通过「畅听无碍」APP中在线视频通话的功能,为听障人士提供实时手语翻译。
当前我国手语方言超过百种,手语专业志愿者非常稀缺,希望大家可以将信息转发,让更多具有良好手语基础的志愿者可以看到,加入到「畅听无碍」的志愿者阵营中,更好的为听障人士提供一份帮助。
加入方式:下载「畅听无碍」APP-->「我的」-->「角色切换」-->选择「手语翻译」。