音频节目·社科一分钟 | 语音技术，能代替文字书写吗？

Original 毛心怡社会科学报社 2021-11-04

点击社会科学报关注我们

目前，社会科学报音频节目已登录喜马拉雅FM、今日头条、阿基米德FM平台，将为大家奉献更丰富的人文社科音频读物，在以上平台搜索“社会科学报”就能找到。让我们在声音的世界里相见！

原文 | 《经济学家》：语音技术能代替文字书写吗？

编译 | 毛心怡

图片 | 网络

过去5到10年，语音技术不断发展应用，已经越来越成熟。如今，可以通过语音命令对智能手机或家用设备进行控制。同时，语音技术也能够解放双手，改善了残障人士的生活。语音技术能否全面代替书写？这种应用会带来哪些问题？

想要用语音技术全面代替书写也会引发一系有趣的问题——人类语言，特别是口语中所包含的错误、混乱、语病可能多到超乎想象。如果将一次采访或演讲逐字逐句抄写下来就会发现，即使是事先准备过、逻辑清晰的人也无法在口语表达中完全无误。因此，即便语音技术能将人类输出的语言准确地记录下来，产生的文字也会显得异常混乱。

为了将口语转换为连贯的文字，我们需要进行大量的事先计划。这就要求通过某种类似于笔记或者整理器的工具来实现。然而，这就使使用者陷入了循环，即使用者需要先写一个结构，然后通过语音输入为这个结构添加内容。换言之，如果无法将提纲事先书写下来，用语音代替书写就不可能完全实现。同时，将语音转化为书写也面临着一个文字表达的问题。如果越来越多的人通过“语言”而非“文字”来写作，写作本身会发生怎样的改变？

但随着计算机技术的发展，现如今，语音技术对生活的改善已经不再受到质疑。可以确信的是，语音技术对语言输入的识别度将不断提升，因此听写软件的字面精度日后会非常高。

然而，听写软件的精准度并不等同于可读性，且可读性的问题并不能通过提升语音识别的技术得到改善。用语音输入来完成写作任务需要的是更强的人类大脑——即能够在短时间内完成结构规划、逻辑思考，并同时保证其语言输出的精准度。通过语音输入来辅助日常的交流或许是可行的，但人类的大脑尚无法以语音速度实时完成写作任务。

文章原载于社会科学报第1725期第7版，音频为社会科学报“思想工坊”融媒体出品，未经允许禁止转载，文中内容仅代表作者观点，不代表本报立场。

拓展阅读

社科报音频节目·周读 | 谁的凯旋？

音频节目·社科一分钟 | 办公室的辉煌时代一去不复返了吗？

音频节目·社科一分钟 | 探秘中国哲学的身份疑案

社科报音频节目·周读 | 何处找寻曾经的乡土格局?

音频节目·社科一分钟 | 痴呆症正成为困扰全球的新问题

社科报音频节目·周读 | 在多瑙河源头上的思考

音频节目·社科一分钟 | 人口老龄化，将如何影响中国的未来？

社科报音频节目·周读 | 蓝天是他的归宿和梦想：纪念圣埃克苏佩里

音频节目·社科一分钟 | 未来城市，什么资产最重要？

社科报音频节目·周读 | 王晓华：酒的诗学