外刊 | 语音技术,能代替文字书写吗?
点击社会科学报关注我们
过去5到10年,语音技术不断发展应用,已经越来越成熟。如今,可以通过语音命令对智能手机或家用设备进行控制,或对一些手机上的应用程序发布命令。同时,语音技术也能够解放双手,改善了残障人士的生活。此外,语音技术能否全面代替书写?这种应用会带来哪些问题?2020年9月3日,《经济学家》刊发文章,探讨了该问题。
原文 :《经济学家》:语音技术能代替文字书写吗?
编译 | 毛心怡
图片 | 网络
如果能用语音代替书写,生活会发生怎样的变化?对因为某些原因缺乏行动能力的人而言,语音输入将是一个巨大的福音。同时,语音技术也能帮助解决因为忙碌而无法打字的问题。但是,想要用语音技术全面代替书写也会引发一系有趣的问题——人类语言,特别是口语中所包含的错误、混乱、语病可能多到超乎想象。如果将一次采访或演讲逐字逐句抄写下来就会发现,即使是事先准备过、逻辑清晰的人也无法在口语表达中完全无误。因此,即便语音技术能将人类输出的语言准确地记录下来,产生的文字也会显得异常混乱。
为了将口语转换为连贯的文字,我们需要进行大量的事先计划,例如写一份提纲。这就要求通过某种类似于笔记或者整理器的工具来实现。然而,这就使使用者陷入了循环,即使用者需要先写一个结构,然后通过语音输入为这个结构添加内容。换言之,如果无法将提纲事先书写下来,用语音代替书写就不可能完全实现。同时,将语音转化为书写也面临着一个文字表达的问题。如果越来越多的人通过“语言”而非“文字”来写作,写作本身会发生怎样的改变?也许人们会越来越多地使用短语和短句以方便语音系统识别,也许人们会倾向于使用语音系统内置的预组装的短语或模板——这与写作本身的精神相违背。高质量的写作需要的是时间和思考,但当我们用惯常的速度讲话时,思考的时间就无法得到保证。
此外,如果需要用语音输入完全代替写作,人们还必须以语音的方式添加标点符号和段落分隔符。语言系统的不同所带来的写作习惯的不同——例如空格的大小、首字是否需要大写等——都会增加语音识别系统输出的难度。当然,目前的语音识别系统已经试图通过一系列办法解决这些问题,比如录入一些预先编写的文章,让使用者朗读段落以习得用户的语言习惯等。
不久以前,人们还对语音代替书写这一功能持怀疑态度——许多科学家在研究初期就放弃了。但随着计算机技术的发展,现如今,语音技术对生活的改善已经不再受到质疑。可以确信的是,语音技术对语言输入的识别度将不断提升,因此听写软件的字面精度日后会非常高。
然而,听写软件的精准度并不等同于可读性,且可读性的问题并不能通过提升语音识别的技术得到改善。用语音输入来完成写作任务需要的是更强的人类大脑——即能够在短时间内完成结构规划、逻辑思考,并同时保证其语言输出的精准度。通过语音输入来辅助日常的交流或许是可行的,但人类的大脑尚无法以语音速度实时完成写作任务。
文章为社会科学报“思想工坊”融媒体原创出品,原载于社会科学报第1725期第7版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。
拓展阅读