查看原文
其他

26个字母vs几万个汉字,中国人的打字机曾造得多艰难?

语标 2023-07-17

本文转自公众号:汉语堂、语用学种草、差评 。文章有改动。


小编按:这篇文章漏掉了一个重要的史实,即全国首台中文语词处理机(“拼音电脑”),是语言学家周有光和计算机专家林才松在上世纪八十年代初合作发明的。这是汉语拼音输入的滥觞(不过当然日本又当了一次我们的老师)。详见:周有光和林才松

这是一块键盘。


在现在这个时代,电脑用实体键盘,手机和平板用触摸键盘。

 

在脑机接口成熟之前,键盘是依旧是我们和各种电子设备最主要的沟通方式。


可是,你有没有思考过这样的问题?


现在所有的中文输入法,都依赖于预测推荐。那么在电子计算机出现之前,在打字机时代,中国人要怎么打出汉字呢?


大家好,我是差评君,今天我想跟你讲讲,汉字打字机的故事。

 

这段故事中,有着大量中国学者和工程师的努力,各种各样奇怪的发明和改良,甚至几度想要放弃传承几千年的汉字,全面拉丁化。


(为什么汉字这么难和键盘兼容,甚至在美国社会一直到现在都有很多嘲讽性的漫画。在电子时代,即使我们没有拼音,也完全可以用各种代码来完成,可是机械时代呢?)


对于拉丁语系的人民来说,键盘的设计是非常直观的,第一台打字机长这样。


虽然机械结构和成熟时期的有很大差别,但是在最基本的原理上是差不多的。


特别是键盘部分,只要把需要的 26 个字母, 10 个数字以及标点符号放在键盘上就好,剩下的只要不断优化布局。


很快,他们搞定了英文世界,以雷明顿和安德伍德为代表的公司更是克服了一个又一个技术难题,将便利、快捷的打字机送到了世界各地。


他们通过增减按键数量、重新设计键盘,将意大利语、俄语、法语、印地语等文字,纳入了现代打字机的世界版图;通过调整列印杆的方向,实现了“从右往左”打字,研发出希伯来语打字机。


安德伍德甚至通过把韩文切割成几个部分的方式,搞定了韩文键盘,这里可能很多同学不知道,韩语谚文虽然长得很像象形文字,但是实际上是个表音文字,所以键盘只需要把二十四个字母,辅以切换键,选择要敲入的地方,就可以流畅输入了。


但是当他们进入中国的时候,他们搞不定了。 


理由很简单,因为汉字实在是太多了,且完全没办法和字母兼容。


QWERTY 排列的打字机之所以影响深远,一个重要的原因,就是它几乎完美地代替了英文手写。


首先,它能像手写一样所见即所得,按下的是什么,打出来的就是什么。


其次,组成所有英文单词的二十六个字母,都能放在触手可及的桌面上。

 

而这看似废话的两点,无论要实现哪个,对机械时代的中文打字机来说,都是个巨大的挑战。

 

汉字数量的庞杂,意味着将成千上万个,与汉字对应按键平铺得放在一起,是完全不现实的。所以要做到输入的完整性,就需要在发明( 打字机 )机械机构的同时,发明一种文字检索方法。但涉及到了文字检索,就必然会和第一点冲突。

 

所见即所得与完整性不可兼得。这个矛盾即便是信息时代的我们,也没能完全做到。


所以对那时的国人来说,这种语言差异带来的困难,使得发明中文打字机这件事,几乎成了不可能完成的任务。


汉字和键盘打字机的“ 不兼容 ”,仿佛寓示着传统中国与技术语言现代性的不匹配。


因为这个,西方人没少创作讽刺漫画。


别说老外了,在当年那个年代,就连不少的中国人也都曾觉得汉字是个 “ 累赘 ”,希望将汉字废除,彻底转向拉丁字母 


好在虽然打遍全球几个打字机公司,还是有不少国人在坚持。不少执着的国人靠着自己对汉字的理解,找到了应对汉字数量的解决方法,做出了真正意义上的中文打字机。



  最初的汉字打印机   

 

第一批设计者延续了英文打字机的思路,将重点放在了最符合人类直觉的——所见即所得上。

 

汉字虽然有上万个,但常用字也就几千个而已,我们退而求其次,单个字块做的小一些,打字机器做的大一些,还是能将常用字逐个排列出来的,生僻字块在需要使用的时候再加进去,不就可以了么。


顺着这个思路,1919 年商务印书馆的工程师舒震东在前同事的基础上,成功制造出了中国第一台有实用价值的中文打字机——舒式打字机。


它与传统打字机没有一丝相像。键盘变成了拾字板,十指打字变成了双手找字,几千个常用字块加上额外的生僻字块,使用频率高的汉字优先中间排列,再附上这样一张字表,就是这台打字机的完全体。这样一台更像是检字机的中文打字机,在 1926 年的美国费城世博会上正式向全世界亮相,成功打破了国外讽刺漫画里中文打字机的丑陋形象。


( 叹气 ),虽然能用,虽然它的确做到了打字的功能,这种看着问题就很多的打字机,的确存在不少问题。

 

其中最致命的一点,就是打字速度慢,很慢。这甚至可以让这类中文打字机的存在,都成为一个问题。打字机的出现本就是代替书写,如果还没有个人书写的速度快,那中文打字机存在的意义何在呢?

 

  明快打印机   


所以这时候,有一位你我都认识的人物出现了。


他就是林语堂。

 


喜欢捣鼓东西的他,在 1916 年就开始筹划发明一个体积小、效率高,并且学习门槛又低的中文打字机。

 

据说每天早上,林先生便会在书房里抽着烟斗,翻阅着《 机械手册 》,修改着自己的设计草图。


外出开会时,也常常去拜访一些工程师,打听些关于打字机的知识,并且买了一堆的打字机回家,把它们拆开后进行研究。


在 1931 年,林语堂先生就完成了打字机的设计图,但是因为自己口袋里票子不够,并没有把这玩意儿做出来。


但是林语堂会写书啊,所以为了完成他的打字机梦想,就开始疯狂写书赚钱。


在 1947 年,林语堂的中文打字机终于横空出世,它被命名为 “ 明快中文打字机 ”。


而此时距离他构思这台机子开始,已经过去了 30 多年。 


但这台机子可就牛X了,它的大小和英文打字机相当。


而且还结合了 “ 常用字理论 ” 和 “ 组合理论 ”,学习门槛极低,据说普通人花个几天时间,就能达到每分钟四五十字的打字速度,就算不是识字,也能达到每分钟二十个的速度。


其中不得不说的,就是林语堂自创的 “ 上下形检字法 ”,你只要知道一个汉字的左上和右下部分,就能完成输入。


第一次看到的时候很迷茫,在没有计算机技术的帮助下,怎么可能能完成这样几乎可以称之为输入法的操作呢?


好在林语堂当年在 1952 美国为这台机器申请了专利,这些专利文件很好地保存到了现在,帮助我理解了明快打字机的运作原理。


明快打字机的关键在于这个看起来就异常精致的三级滚筒


这个大滚轮下,有六个中滚筒,而在每个中滚筒中,又有 6 个小滚筒,每个小滚筒有 8 个面,每个面有 28 个字模。


总共有 8064 个字符,可以完成常用中文、英文、数字甚至标点符号的输入。


打个比方,我们要输入一个“ 信 ”字,


首先找到键盘上的“ 亻 ”,按下,背后的一级转轮就会开始转动,带动二级滚轮,定位到所有“ 亻 ”存在的最后一级滚轮上。


再按下“ 口 ”键,整个转轮会继续移动,移动到含有这两个部首的 8 个候选字上。


在这台打印机的顶部有一个小窗,这是一个放大镜,会聚焦到这 8 个候选字。


最后敲下数字,选择你想要的候选字。

 

这简直和现代电子计算机最初的输入法逻辑如出一辙,如果你用过智能 ABC 之类没有什么词库的输入法,和这个明快打印机的体验应该是差不多的。

 

1959 年世界上第一台汉字电子计算机 Sinotype ,也是用类似于这样的部首检索输入,但显然发明这台计算机的考德威尔和远东语文学系杨联陞对于汉字的理解和林语堂之间差了至少几十个胡适吧。


因为这台电脑只能打出 2000 余个汉字。

 

最重要的是,他们没有发现汉字笔画输入的冗余性,所以必须要输入每个笔画,才能完成输入。 

 

所以明快打字机,绝对是领先年代的产物。

 

连林语堂自己也高兴地说到:这是我送给中国人的礼物。 


只不过。。。


最后明快打字机还是没能真正地投入量产,因为当时中国时值内战,由于担心市场不稳定,并没有国外厂商愿意花大价钱生产这个东西。

 

但此时的林语堂,已经在打字机上投入了快 12 万美元,他不仅花光了自己的稿费,还四处举债,欠下了不少的钱。


所以明快打字机只有当初唯一的一台原型机。


可以说相当可惜了,我非常希望见到有大佬能够复现这台极其精妙的机器。



  双鸽打字机为代表的活字印刷式打字机   

 

尽管很多文章都把明快打字机的流产归结为政治动荡,但以我的推测,以当时的技术水平,这个玩意儿应该是做不到量产的。因为建国后生产的打字机依旧是以“ 舒式打字机 ”为基础改良来的,舒式打字机虽然看起来很笨,但起码造价便宜、可靠能用。


天津红星工厂成功生产的“ 文化牌 ”打字机、上海打字机厂推出的万能牌打字机、飞鸽牌打字机、双鸽牌打字机等,都是这个时期中文打字机的代表品牌。


中文打字机的基本形态虽然确定,尽管在机械结构上相较于二三十年前,有着很多改进空间,但在这种固定的形态下,打字速度依旧快不起来,熟练打字工的打字速度甚至没办法突破每分钟五十字。

 

这真的是中文打字机的极限了吗?

 

1952 年洛阳的一位打字员张继英,站在使用者的角度给出了一份天才的答案,重构了打字机字盘的排列方式。


我在这里暂停一下,如果是你,远比那时候见多识广的你来给这个 70*35 的字盘想一种排列方式,加快拣字速度,你会怎么做。


前面说到,传统打字机的字盘里,将两千多常用字以使用频率进行排布。但看似合理的排布其实是有悖中文的特征的。中文词语中大部分是双音节词,也就是说通常多个字之间是有联系的。如果我经常打三连、三连,那我为什么不把“ 三 ”字与“连”字放在一起呢?让我们再进一步,“ 三连 ”同样经常和“ 一键 ”一起使用,“一”又与“定”字使用。。。

 

各位明白其中的奥妙了么?没错,张继英发明的这种排布,就是现在几乎所有输入法都会带的一个功能——预测输入。

 

张继英十八盘拣字法的发明,在中文打字机发明的几十年的时间里,以非技术的方式,让整体生产效率提高了 40 %以上。将中文打字机的打字速度提高到了每分钟 100 字上下。

 

但这也是中文打字机最后的高光时刻,底子上的设计问题,使得这些改进根本就是杯水车薪。


100 字每分钟的打字速度,也始终比不上英文打字机的效率。


重新排布的字盘是很好,但这并不解决词语使用习惯的变迁,花大力气调好的字盘一定需要及时更新排布,而这又是牵一发而动全身的改变。

 

除此之外,这样的给予调整字盘提高打字效率的方式,完全不具备通用性。银行打字员使用时一定会涉及到银行工作的数字等字块放在顺手的区域;警局文员可能更倾向于将描述地名、行为的字块放在一起。


这样的情况,直到 80 年代后也没有得到解决。但幸运的是,我们撑到了数字时代的到来。


  计算机时代输入方式     


打字机时代里,汉语遇到的这些问题,其实是世界范围内,所有表意文字的共同挑战。虽然表意文字在文化传播、信息量等方面有着得天独厚的优势,但在人类社会进入信息时代之前,在表达效率上,始终跟不上以拉丁字母为代表的表音文字。中文打字机一言难尽的打字速度就是一个典型的体现。


而英语、法语、西班牙语等基于拉丁字母体系的语言却都能几乎完美适用 QWERTY 键盘,这套键盘布局也得以应用至今。所以当计算机时代到来之后,西方世界发明的这个布局,就自然的被带到了计算机输入上来。

 

而脱离了物理限制的计算机代码,使得打字机时代里“机械设计”的问题迎刃而解,唯一需要的就是一套将键盘按键与汉字连接起来的规则,一套科学、简单的规则。

 

在 1980 年我国颁布汉字编码国家标准之后,中文输入法开始了群雄逐鹿的时代。

 

在当年,如果你想输入一个文字,你能用到的输入法种类可能超乎你的想象。

 

比如你要输入充电的“ 电 ”字,如果你是赛博玩家,可以不要任何输入法直接输入汉字在计算机里的区位码“ 2171 ”。

 

如果你是硬核玩家,可以选择走拆字的形码流,例如:五笔输入法、仓颉输入法、郑码输入法等等,这些输入法的特点是打字效率高、但有一定的上手门槛,多需要像五笔一样背会与键盘对应关系的“字根”表。

 

但如果你只是休闲玩家,拼音输入法是最合适的选择,虽然打字速度不及一众形码,但随着输入法的版本更新,能做到友好的对内交流也不成问题。

 

当然结合两者优点的音形结合码也曾出现在现代计算机当中,曾经用来下载搜狗输入法的智能 ABC 输入法、二笔输入法等,就是以拼音加上汉字笔画或者偏旁为编码方式。

 

汉字输入虽然比机械时代要好解决一些,但是关于汉字在计算机里的编码、输入问题以及打印输出依旧非常麻烦,在这个过程中,又出现了很多汉字拉丁化的声音。各位如果有兴趣,可以再单独开一期聊聊汉字在计算机时代的故事。



  输入法的意义以及抛弃汉字会有什么严重后果     


我们现在主流使用的五笔和拼音,在输入效率上并不会比拉丁语系慢,可以说凝结了无数前人智慧的结晶,但更宝贵的是,他们守住了底线,把汉字留了下来。


这非常难得,因为汉字,已经是现在唯一被广泛使用的表意文字了,两河流域的楔形文字和古埃及圣书字已经消失,韩文已经完全表音化,日文也是表意的汉字和表音的假名混用。越南曾经出现喃字,可是在19世纪也被完全拉丁化。


表意文字当然有自己的缺点,和打字机和电子计算机的不兼容就是典型缺点,但是就像美国“ 汉学之父 ”卫三畏在《中国总论》说的,一旦废止汉字,中国将不复存在。

 

好像欧洲采用的拉丁语系,因为各地方言的读音不同,慢慢文字的拼法也就不同了,拼法的不同又进一步加强了语言的分裂,所以欧洲从语言学的角度来说,就很难成为一个统一的国家。


但汉字,尽管一直在演化,但它的字形不会因为各地的读音不同而发生改变,最终守住了中华文明的一致性


撰文:蛋蛋&CC   视频制作:申超 & 张咏 & 天宇 

美编:焕妍( 视频 ) & 萱萱( 推文 )

 

参考资料:

Tom Mullaney: The Chinese Typewriter: A History

A Chinese Typewriter in Silicon Valley

Chinese Typewriters ( 中文打字机 )

Thomas S. Mullaney, Stanford University

中文打字机,“ 革新中传统 ”- MOCA

谚文、废除汉字论、Korean language and computers、越南语、喃字、语素文字、杨联陞——wiki

Typewriter Invented by Kong Byung-woo —— Korean national cultural heritage administration

The Uncanny Keyboard - Thomas Mullaney

SPRING POWERED TYPE BAR ACTUATING MECHANISM FOR TYPEWRITERS  - LIN YUTANG

拼音输入软件对汉字书写的影响分析- 陈东

打字、身体与性别:从“ 打字女孩 ”到“ 技术直男 ”—— 燕京书评

为造出好用的中文打字机,林语堂把自己搞破产了。——差评



声明:除声明原创、授权转载作品外,其他图文、声像作品均采自图书或自网络,版权归原作者或原创平台。如有侵权问题,请联系后台,定当妥善处理。作品观点仅为作者观点,不代表本号立场。欢迎转载本平台文章,转载时请注明出处。




语言分析技术在社会计算中的应用



让汉字进入电脑有多难?只有这群中国人成功了



在否定自我中前行——陆俭明、马真夫妇小记


本期责编:鱼

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存