史海钩沉
史海钩沉:被遗忘的中文键盘
在QWERTY键盘普及前,中文输入系统曾经历过许多奇思妙想的设计。
汉字信息处理技术研究室研究了“大键盘”中文文本输入方法,即将2,000个或更多常用汉字分配到桌面大小的大界面。
在如今,我们用QWERTY键盘输入汉字,通过输入法软件将按键转化为汉字。但在过去,这并不是唯一的方式。Thomas S. Mullaney的新书《中文计算机:信息时代的全球史》(由MIT出版社出版),揭示了20世纪中文输入的被遗忘历史。本文改编自该书的一部分,详细介绍了1960年代和1970年代的各种中文输入系统,这些系统完全抛弃了QWERTY键盘。
“这将毁了中国。”一位年轻的台湾军校学员心想。著名历史学家Arnold J. Toynbee在华盛顿与李大学发表演讲,题为“从历史的角度看变化中的世界”。Toynbee探讨了人类文明的起源、成长、衰亡和瓦解,并将中国作为焦点。
Toynbee认为,中国之所以能够延续数千年,是因为汉字这一表意文字起到了统一作用,避免了分裂。然而,当时北京政府正在推广基于拉丁字母的拼音系统,这让Toynbee担心中国的文化连续性会受到威胁。
这位听众是叶昌辉,当时是一名在弗吉尼亚军事学院(VMI)学习电气工程的学生。那晚与Toynbee的交流改变了他的人生轨迹,也改变了中文计算的历史。14年后,叶昌辉创立了历史上首家成功的中文IT公司——意象图(Ideographix)。
在1960年代末和1970年代初,中文计算经历了多次重大变革。挑战中文计算的不再是小规模实验室和个人发明家,而是遍布亚洲、美国和欧洲的工程师、语言学家和企业家,包括叶昌辉所居住的硅谷。
IPX键盘有160个主要按键,每个按键有15个字符。使用15个键的外围键盘来选择每个键上的字符。单独的“shift”键用于更改160个键的所有字符分配。
中文计算机的设计也发生了巨大变化。当时涌现的竞争设计都没有采用QWERTY键盘。其中最成功和著名的系统之一——由叶昌辉设计的IPX——使用了一个有120级“切换”的界面,在一个比QWERTY键盘稍大的空间内容纳了近2万个汉字和其他符号。还有一些系统的键盘有256到2000个键,甚至有些干脆不用键盘,而是使用触笔和触敏平板,或是绕着旋转圆柱排列汉字。
IPX:叶昌辉的120维超维度中文键盘
叶昌辉1960年从VMI毕业,获得电气工程学士学位;1963年在康奈尔大学获得核工程硕士学位;1965年获得电气工程博士学位。随后,他加入IBM,负责计算模拟项目。然而,Toynbee的演讲一直在他心中挥之不去。他在业余时间研究汉字的电子处理,坚信汉字能进入计算时代,这将保护汉字不被拼音化。最终,他辞去了IBM的高薪工作,致力于通过计算机保存汉字。
IPX键盘的单个键包含15个字符。此键包含字符zhong(中“中央”),这是拼写“中国”所必需的。
叶昌辉从最复杂的汉字开始研究,特别是“鹰”这个字,它需要24笔才能写成。他通过分析,确定一个由24个纵向点和20个横向点组成的位图可以表示这个字,占用60字节内存。1968年,他为他的项目“铁鹰”申请了专利。台湾军方对此项目表现出浓厚兴趣。四年后,叶昌辉在加州桑尼维尔成立了意象图公司。
意象图的旗舰产品是IPX,这是一种中文排版和传输系统,包含多个子系统。其中,键盘子系统是其精华所在,使操作员可以输入理论上最多19200个汉字,而其尺寸仅为59厘米宽、37厘米深、11厘米高。为了实现这一壮举,叶昌辉及其团队将键盘视为一台独立的微处理器控制的“智能终端”,而非传统的QWERTY设备。
在IPX键盘上打字的过程包括使用一本用来按下160个键中的一个的字符集,选择15个数字中的一个来选择键中的一个字符,并使用单独的“shift”键来指示何时翻页。
IPX键盘有160个键,排列成16x10的网格。每个键上有15个汉字,形成一个3x5的小阵列。这样,160个键每个键15个汉字,总共可以输入2400个汉字。汉字并没有印在键上,而是印在一个螺旋装订的小册子里。操作员将小册子平放在IPX界面上,通过按压小册子来选择对应的键。
要输入第2401至19200个汉字,操作员只需翻动小册子到所需汉字所在的页面。每册小册子最多包含八页,每页有2400个汉字,总共接近20000个符号。
最初的七年里,IPX只限于台湾军方使用。随着时间的推移,这种限制逐渐放松,叶昌辉开始在私营和公共部门寻找客户。IPX的首批非军方客户包括台湾电信管理局和台北市国家税务局。对于前者,IPX帮助处理和传输了数百万份电话账单;对于后者,它以前所未有的速度和规模生成了税务申报文件。然而,IPX并不是唯一的选择。
香港中文大学的罗教授发明了一种他称之为“罗键盘”的键盘,共有256个键。
中国大陆的“中型”键盘
到1970年代中期,中国在大型主机计算领域比外界想象的要先进得多。1972年7月,就在美国总统理查德·尼克松著名访华几个月后,一支由著名美国计算机科学家组成的考察团访问了中国。他们探访了当时中国的主要计算机科学中心,并了解到中美隔绝多年期间,中国同行所取得的进展,令他们大为惊讶。
但有一个关键领域是考察团未能亲眼目睹的,那就是汉字的计算处理。直到1974年10月,中国大陆的工程师才开始认真研究这个问题。随后在1975年,北京大学新成立的中文信息处理技术研究室着手创建“中文信息处理和输入系统”和“汉字键盘”。
这个团队评估了十多个中文键盘设计方案。设计大致分为三类:一种是大键盘,每个常用汉字各有一个键;一种是小键盘,如QWERTY键盘;还有一种是中型键盘,试图在两者之间找到平衡点。
北大的中型键盘设计包括汉字和字符组件的组合,如图所示。
团队对QWERTY小键盘提出了两大批评。首先,按键太少,导致许多汉字的输入序列相同。其次,QWERTY键盘未能充分利用按键的潜力。通常,每个按键只分配两个符号,其中一个需要按住Shift键才能访问。更好的方法是“一键多用”,即每个按键分配更多的符号,以最大限度利用界面空间。
团队还研究了大键盘的方案,这种键盘将2000多个常用汉字分配到桌面大小的界面上。全国各地的多个团队都在研究不同版本的大键盘。然而,北京团队认为大键盘过于庞大和不便。他们的目标是最大限度利用每个按键,同时保持按键数量最少。
这些历史上的尝试展示了中文输入技术的多样化和创新性,也反映了不同文化背景下对技术发展的独特需求。虽然如今QWERTY键盘结合输入法成为主流,但回顾这些被遗忘的历史,我们能更好地理解中文计算技术的发展历程和背后的智慧。
多年来,北京的一个团队最终确定了一款拥有256个按键的键盘,其中29个按键用于各种功能,如回车和空格,剩下的227个用于输入文字。每次按键产生一个8位代码,存储在打孔纸带上(因此选择了256个按键)。这些8位代码会被转换成14位的内部代码,供计算机用来检索所需字符。
在每个按键分配多个字符的设计上,这款键盘与Ideographix公司的IPX机器颇为相似。但有所不同的是,团队不仅将完整的汉字分配到每个按键,还分配了一些汉字部件。具体来说,每个按键最多可以分配四个符号,分为三类:
* 完整的汉字(每键不超过两个)
* 部分汉字部件(每键不超过三个)
* 用于切换到其他语言的大写符号(每键一个)
总的来说,这款键盘包含423个完整的汉字和264个汉字部件。在安排这264个汉字部件时,团队想出了一个优雅而巧妙的方法来帮助操作员记住各个部件的位置:他们把键盘当作一个汉字来看待。团队将每个部件放在键盘上对应于它们通常出现在汉字中的区域。
最终设计的北京大学键盘能够输入总共7282个汉字,团队估计这可以涵盖日常生活中遇到的90%以上的汉字。在这个字符集中,423个最常见的汉字可以通过一次按键输入;2930个汉字可以通过两次按键输入;另外3106个汉字可以通过三次按键输入。剩下的823个汉字需要四到五次按键输入。
北京大学的键盘只是那个时代众多中型设计之一。IBM也为中文和日文设计了一款256键的键盘。这款键盘类似于IPX系统,包含一个12位数字键盘,操作员可以通过这12个数字键“切换”每个按键上的12个完整汉字(总共3072个字符)。1980年,香港中文大学的罗秀昌教授开发了一种称为“罗氏键盘”的256键键盘。
但也许那个时代最奇特的中文键盘是由英国设计的。
圆柱形中文键盘
1976年冬天,英国剑桥,一个小男孩在寻找他心爱的Meccano玩具。这种英国玩具是美国Erector套件的前身,深受年轻工程师的喜爱。Andrew最近还在玩这些齿轮、轴和金属板,但今天却怎么也找不到。
走进厨房,他发现了小偷:他的父亲,剑桥大学的研究员Robert Sloss。连续三天三夜,Sloss霸占了儿子的玩具,沉迷于制造一种奇特的旋转圆柱形装置。这个装置吸引了小男孩的注意,随后也吸引了《电讯报》的记者,最终还引起了英国电信巨头Cable & Wireless的关注和资金支持。
Robert Sloss出生于1927年的苏格兰。他加入了英国海军,通过一系列智力测验显示出对外语的天赋。1946年和1947年,他在香港服役。后来,Sloss加入了公务员队伍,成为一名教师,随后在英国空军担任非委任军官。由于他的教学经验、语言能力和亚洲背景,他被邀请到剑桥大学教中文,并于1972年担任讲师。
在剑桥,Sloss遇到了Peter Nancarrow。比Sloss小12岁的Nancarrow受训为物理学家,但后来成为了一名专利代理人。这位留着胡须的38岁男子自学了挪威语和俄语作为“爱好”,然后与Sloss联手,致力于构建一台自动中英翻译机。
1976年,Robert Sloss和Peter Nancarrow设计了Ideo-Matic编码器,这是一种中文输入键盘,有4,356个键围绕着一个圆柱体。
他们很快发现,翻译机设计中的瓶颈在于字符输入——即如何将手写的中文字符、定义和句法数据输入计算机。
接下来的两年里,Sloss和Nancarrow致力于设计一个中文计算机接口。这项努力促使Sloss偷走并改装了儿子的Meccano玩具。Sloss的 tinkering 很快结出硕果:一个工作原型,他们称之为“二进制信号生成器,用于将汉字编码为机器兼容形式”,也被称为 Ideo-Matic Encoder 和 Ideo-Matic 66(以机器的66x66字符网格命名)。
机器网格中的每个单元格都分配了一个对应于X列和Y行值的二进制代码。在总空间方面,每个单元格为7毫米见方,4356个单元格中有3500个专用于汉字,其余的分配给日语音节或留空。
Sloss和Nancarrow界面的独特之处不在于这个网格,而在于他们将这4356个单元格安排在一个旋转的圆柱形结构上。打字员用一只手旋转圆柱形网格,用另一只手左右移动光标以指示4356个单元格中的一个。按下一个按钮会产生一个对应于所选汉字或其他符号的二进制信号。
在1970年代末,Ideo-Matic Encoder 完成并交付给 Cable & Wireless。重达7公斤,宽68厘米,深57厘米,高23厘米的机器引起了业界和媒体的关注。Cable & Wireless购买了该机器的权利,希望能为东亚市场大规模生产。
QWERTY的回归
IPX、Ideo-Matic 66、北京大学的中型键盘,乃至所有这里讨论的定制设备很快都遭遇了同样的命运——被遗忘。变革已经开始。定制中文文本处理系统的时代即将结束。一个新的时代正在形成,一个主要由大型公司、企业家和发明家所未能充分准备的时代。这个新时代被称为软件革命、个人计算革命,或者更不乐观地称为硬件的死亡。
从1970年代末开始,定制的中文接口逐渐从市场和实验室中消失,被一波又一波冲击中国海岸的西方制造的个人电脑取代。随之而来的是 QWERTY 键盘在中文输入中的复兴,与今天中文计算机用户使用的系统类似——由一个软件层将拉丁字母转换为汉字。这种通过输入法编辑器(IME)进行的输入方式并没有导致像历史学家 Arnold Toynbee 所预测的那样导致中华文明的衰落。然而,它确实从根本上改变了中文使用者与数字世界及其自身语言的互动方式。
本文译自 IEEE Spectrum,由 BALI 编辑发布。