音频节目·社科一分钟 | 语音技术,能代替文字书写吗?
点击社会科学报关注我们
目前,社会科学报音频节目已登录喜马拉雅FM、今日头条、阿基米德FM平台,将为大家奉献更丰富的人文社科音频读物,在以上平台搜索“社会科学报”就能找到。让我们在声音的世界里相见!
原文 | 《经济学家》:语音技术能代替文字书写吗?
编译 | 毛心怡
图片 | 网络
过去5到10年,语音技术不断发展应用,已经越来越成熟。如今,可以通过语音命令对智能手机或家用设备进行控制。同时,语音技术也能够解放双手,改善了残障人士的生活。语音技术能否全面代替书写?这种应用会带来哪些问题?
想要用语音技术全面代替书写也会引发一系有趣的问题——人类语言,特别是口语中所包含的错误、混乱、语病可能多到超乎想象。如果将一次采访或演讲逐字逐句抄写下来就会发现,即使是事先准备过、逻辑清晰的人也无法在口语表达中完全无误。因此,即便语音技术能将人类输出的语言准确地记录下来,产生的文字也会显得异常混乱。
为了将口语转换为连贯的文字,我们需要进行大量的事先计划。这就要求通过某种类似于笔记或者整理器的工具来实现。然而,这就使使用者陷入了循环,即使用者需要先写一个结构,然后通过语音输入为这个结构添加内容。换言之,如果无法将提纲事先书写下来,用语音代替书写就不可能完全实现。同时,将语音转化为书写也面临着一个文字表达的问题。如果越来越多的人通过“语言”而非“文字”来写作,写作本身会发生怎样的改变?
但随着计算机技术的发展,现如今,语音技术对生活的改善已经不再受到质疑。可以确信的是,语音技术对语言输入的识别度将不断提升,因此听写软件的字面精度日后会非常高。
然而,听写软件的精准度并不等同于可读性,且可读性的问题并不能通过提升语音识别的技术得到改善。用语音输入来完成写作任务需要的是更强的人类大脑——即能够在短时间内完成结构规划、逻辑思考,并同时保证其语言输出的精准度。通过语音输入来辅助日常的交流或许是可行的,但人类的大脑尚无法以语音速度实时完成写作任务。
文章原载于社会科学报第1725期第7版,音频为社会科学报“思想工坊”融媒体出品,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。
拓展阅读
音频节目·社科一分钟 | 人口老龄化,将如何影响中国的未来?
社科报音频节目·周读 | 蓝天是他的归宿和梦想:纪念圣埃克苏佩里
音频节目·社科一分钟 | 2020世界人工智能大会,大咖们都说了啥?
社科报音频节目·周读 | 这位18岁的姑娘,开创了科幻小说的时代