查看原文
其他

Google 说:我们已表现得更具人文关怀

锌刻度zn 锌刻度 2019-07-03

Google I / O大会CEO Sundar Pichai


 文|锌刻度 罗永豪


语音界面在智能手机流行的当下比以往任何时候都更常见,但或许很多人在享受语音界面带来便利的同时,并没有想到,在同一片苍穹下,语音界面并无法得到平等的访问。也就说很多人是没有机会或资格享受语音界面带来的方便的例如,如果您因渐冻症(ALS)或多发性硬化症等神经系统损害导致言语障碍,那么Google智能助理或亚马逊的Alexa将禁止您使用。在今天的科技环境中,这将意味着错过了很多。

 

对大多数亿计的语言障碍的人来说,人工智能驱动的语音识别技术根本不适用于他们。在今年的Google I / O上,Google推出了Project Euphonia,探讨人工智能如何更好地帮助那些有语言障碍以及发出不同类型语音的人。

1/Project Euphonia:使语言障碍者轻松运用语音

 

语言障碍者尝试Google AI

 

“我们也希望帮助那些患有言语障碍或言语受中风或肌萎缩侧索硬化影响的人。” 谷歌CEO Sundar Pichai 在I / O大会上宣称,“Euphonia项目团队利用AI技术提高电脑理解言语障碍患者话语的能力并且Google AR的研究人员正在探索个性化通信模式的概念,这种模式可以更好地理解不同类型的语音,以及AI如何帮助那些语言障碍的人。”

 

Euphonia最大的焦点将是从言语障碍者那里收集更多的语音数据。这旨在解决在有限的训练数据产生AI识别偏差的问题。因为像Google智能助理这样的语音软件是为响应大多数声音而构建的,所以它并不适用于语言障碍者。目前,谷歌正在与ALS治疗发展研究所和ALS Residence Initiative等非营利组织合作,录制患有神经退行性疾病ALS人的声音。

 

未来这些语音识别模型都将在Google智能助理得到提供,为语言障碍者提供解决方案”Pichai介绍。

 

此外,为了提高语音识别能力,Google还正在训练个性化AI智能算法来检测声音和手势,然后执行向Google Home生成语音指令或发送文本信息等。这项研究对严重残疾和语言障碍者人可能也有帮助。

2/Live Relay :让手机代表使用者倾听和说话

在实际的生活场景应用中,目前的AI技术仍无法满足所有人的需求,在听力障碍者面前,AI的便利性并没有得到更好的体现。世界卫生组织统计4.66亿人,患有残疾性听力损失(4.32亿成人和3400万儿童),超过人类总人口的5%。据估计,到2050年将有9亿多人(或者说十分之一的人)出现残疾性听力损失。

 

我们都知道失聪或有听力障碍的人经常通过手语或手写进行交流。但如果和他交流的对象不在他的对面,比如当他们需要与谈话的人发短信或通讯工具通话就需要另一个人的辅助才能完成。这样的便利性与独立性都无法得到满足。

 

在本次I / O大会上,Google推出了一款名为Live Relay的原型应用程序,该应用程序使用设备上的语音识别和文本到语音转换来帮助任何听不见或说话的人进行电话交谈。

 

Google CEO Sundar Pichai在舞台上表示,“为身体不便人士提供新产品的基础人工智能研究是推动我们推进使命的重要途径。”

 

Live Relay使用设备上的语音识别和文本到语音转换,让手机代表使用者倾听和说话。该研究项目能完成任何人地可以打电话给聋哑人或有听力障碍的人。该工具能实时将语音转换为文本,并将语音信息作为语音发回,如此一来,说话的人可以简单地通过电话交谈,聋哑人和听力障碍者可以通过电话发短信。

 

“Live Relay利用了Google的智能撰写和智能回复功能,预测性写作建议和即时响应有助于打字的人跟上语音通话的速度。”谷歌工程师Lorenzo Caggioni解释,重要的是,Live Relay完全在用户的设备上运行,这意味着用户的私人通话不会发送给Google,该工具不需要数据连接,只依赖于音频,Live Relay可以与来自任何手机的任何来电语音通话一起使用。

 

“在帮助听力障碍者领域,苹果有iPhone助听器和声音处理器,专门为iPhone和iPad设计助听器和声音处理器。”相关人士称,谷歌在这方面的研究更加有成果。

 

实际上在今年2月份,谷歌就推出 Android手机的两项新功能:Live Transcribe和Sound Amplifier,它们设计目标都是帮助或听力障碍的人。

 

在Live Transcribe更早之前,Google (ASR)自动语音识别技术 为 Youtube 的自动字幕生成、幻灯片演示以及电话通话提供了支持。尽管ASR在过去几年中进行了多项改进,耳聋和听障人士仍主要依赖于人工转录服务,比如美国的CART,英国的Palantypist或其他国家的STTR,最重要的一点是这些服务的费用十分昂贵。

 

而Live Transcribe是一款可以近乎实时地自动转录语音的应用程序,允许用户在他们可能无法说话的情况下进行通信,这对有听力障碍的人有帮助。例如,如果在公共场所,只需在手机里输入内容,书写的内容就会变成另一端的语音。更重要的是,这是一项免费的Android服务,由Google云提供技术支持,支持超过70种语言,能覆盖全球80%以上的人口。

 

“这些项目最终将产生更好地为我们所有人服务的产品。通过为每个人构建更有用的Google。”Google CEO Sundar Pichai表示,虽然Live Relay仍处于研究阶段,但我们期待有一天它能够为我们的用户提供更多和更好的沟通方式,特别是对于那些现有选项没有很好地服务到的人群。


期内容回顾

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存