标签谢选骏全集

2021年12月5日星期日

谢选骏:我的第二本非正式出版物



《26个字母vs几万个汉字,中国人的打字机造得多艰难?》(差评2021-12-05)报道:


大家好,我是差评君,今天的稿件,出自我写稿时的一次奇思。


当我在飞速打字时,突然意识到,现在打字虽然是通过拼音,但总还是基于输入法的啊!


但在那个还没有输入法和电脑的时期,有没有出现过一台汉字打字机?


如果出现过,那发明这台打印机的人有着怎样的巧思?如果真的要把几万个表意文字塞进小小的键盘,又经历了怎样的艰辛呢?


以下是文字稿▼这是一块键盘。


在现在这个时代,电脑用实体键盘,手机和平板用触摸键盘。


在脑机接口成熟之前,键盘是依旧是我们和各种电子设备最主要的沟通方式。


可是,你有没有思考过这样的问题?


现在所有的中文输入法,都依赖于预测推荐。那么在电子计算机出现之前,在打字机时代,中国人要怎么打出汉字呢?


大家好,我是差评君,今天我想跟你讲讲,汉字打字机的故事。


这段故事中,有着大量中国学者和工程师的努力,各种各样奇怪的发明和改良,甚至几度想要放弃传承几千年的汉字,全面拉丁化。


(为什么汉字这么难和键盘兼容,甚至在美国社会一直到现在都有很多嘲讽性的漫画。在电子时代,即使我们没有拼音,也完全可以用各种代码来完成,可是机械时代呢?)


对于拉丁语系的人民来说,键盘的设计是非常直观的,第一台打字机长这样。


虽然机械结构和成熟时期的有很大差别,但是在最基本的原理上是差不多的。


特别是键盘部分,只要把需要的26个字母,10个数字以及标点符号放在键盘上就好,剩下的只要不断优化布局。


很快,他们搞定了英文世界,以雷明顿和安德伍德为代表的公司更是克服了一个又一个技术难题,将便利、快捷的打字机送到了世界各地。


他们通过增减按键数量、重新设计键盘,将意大利语、俄语、法语、印地语等文字,纳入了现代打字机的世界版图;通过调整列印杆的方向,实现了“从右往左”打字,研发出希伯来语打字机。


安德伍德甚至通过把韩文切割成几个部分的方式,搞定了韩文键盘,这里可能很多同学不知道,韩语谚文虽然长得很像象形文字,但是实际上是个表音文字,所以键盘只需要把二十四个字母,辅以切换键,选择要敲入的地方,就可以流畅输入了。


但是当他们进入中国的时候,他们搞不定了。


理由很简单,因为汉字实在是太多了,且完全没办法和字母兼容。


QWERTY排列的打字机之所以影响深远,一个重要的原因,就是它几乎完美的代替了英文手写。


首先,它能像手写一样所见即所得,按下的是什么,打出来的就是什么。


其次,组成所有英文单词的二十六个字母,都能放在触手可及的桌面上。


而这看似废话的两点,无论要实现哪个,对机械时代的中文打字机来说,都是个巨大的挑战。


汉字数量的庞杂,意味着将成千上万个,与汉字对应按键平铺的放在一起,是完全不现实的。所以要做到输入的完整性,就需要在发明(打字机)机械机构的同时,发明一种文字检索方法。但涉及到了文字检索,就必然会和第一点冲突。


所见即所得与完整性不可兼得。这个矛盾即便是信息时代的我们,也没能完全做到。


所以对那时的国人来说,这种语言差异带来的困难,使得发明中文打字机这件事,几乎成了不可能完成的任务。


汉字和键盘打字机的“不兼容”,仿佛寓示着传统中国与技术语言现代性的不匹配。


因为这个,西方人没少创作讽刺漫画。


别说老外了,在当年那个年代,就连不少的中国人也都曾觉得汉字是个“累赘”,希望将汉字废除,彻底转向拉丁字母


好在虽然打遍全球几个打字机公司,还是有不少国人在坚持。不少执着的国人靠着自己对汉字的理解,找到了应对汉字数量的解决方法,做出了真正意义上的中文打字机。


最初的汉字打印机


第一批设计者延续了英文打字机的思路,将重点放在了最符合人类直觉的——所见即所得上。


汉字虽然有上万个,但常用字也就几千个而已,我们退而求其次,单个字块做的小一些,打字机器做的大一些,还是能将常用字逐个排列出来的,生僻字块在需要使用的时候再加进去,不就可以了么。


顺着这个思路,1919年商务印书馆的工程师舒震东在前同事的基础上,成功制造出了中国第一台有实用价值的中文打字机——舒式打字机。


它与传统打字机没有一丝相像。键盘变成了拾字板,十指打字变成了双手找字,几千个常用字块加上额外的生僻字块,使用频率高的汉字优先中间排列,再附上这样一张字表,就是这台打字机的完全体。这样一台更像是检字机的中文打字机,在1926年的美国费城世博会上正式向全世界亮相,成功打破了国外讽刺漫画里中文打字机的丑陋形象。


但(叹气),虽然能用,虽然它的确做到了打字的功能,但这种看着问题就很多的打字机,的确存在不少问题。


其中最致命的一点,就是打字速度慢、很慢。这个问题甚至可以让这类中文打字机的存在,都成为一个问题。打字机的出现本就是代替书写,如果还没有个人书写的速度快,那中文打字机存在的意义何在呢?


明快打印机


所以这时候,有一位你我都认识的人物出现了。


他就是林语堂。


喜欢捣鼓东西的他,在1916年就开始筹划发明一个体积小、效率高,并且学习门槛又低的中文打字机。


据说每天早上,林先生便会在书房里抽着烟斗,翻阅着《机械手册》,修改着自己的设计草图。


外出开会时,也常常去拜访一些工程师,打听些关于打字机的知识,并且买了一堆的打字机回家,把它们拆开后进行研究。


在1931年,林语堂先生就完成了打字机的设计图,但是因为自己口袋里票子不够,并没有把这玩意儿做出来。


但是林语堂会写书啊,所以为了完成他的打字机梦想,就开始疯狂写书赚钱。


在1947年,林语堂的中文打字机终于横空出世,它被命名为“明快中文打字机”。


而此时距离他构思这台机子开始,已经过去了30多年。


但这台机子可就牛X了,它的大小和英文打字机相当。


而且还结合了“常用字理论”和“组合理论”,学习门槛极低,据说普通人花个几天时间,就能达到每分钟四五十字的打字速度,就算不是识字,也能达到每分钟二十个的速度。


其中不得不说的,就是林语堂自创的“上下形检字法”,你只要知道一个汉字的左上和右下部分,就能完成输入。


第一次看到的时候很迷茫,在没有计算机技术的帮助下,怎么可能能完成这样几乎可以称之为输入法的操作呢?


好在林语堂当年在1952美国为这台机器申请了专利,这些专利文件很好地保存到了现在,帮助我理解了明快打字机的运作原理。


明快打字机的关键在于这个看起来就异常精致的三级滚滚筒


这个大滚轮下,有六个中滚筒,而在每个中滚筒中,又有6个小滚筒,每个小滚筒有8个面,每个面有28个字模。


总共有8064个字符,可以完成常用中文、英文、数字甚至标点符号的输入。


打个比方,我们要输入一个“信”字,首先找到键盘上的“亻”,按下,背后的一级转轮就会开始转动,带动二级滚轮,定位到所有“亻”存在的最后一级滚轮上。


再按下“口”键,整个转轮会继续移动,移动到含有这两个部首的8个候选字上。


在这台打印机的顶部有一个小窗,这是一个放大镜,会聚焦到这8个候选字。


最后敲下数字,选择你想要的候选字。


这简直和现代电子计算机最初的输入法逻辑如出一辙,如果你用过智能ABC之类没有什么词库的输入法,和这个明快打印机的体验应该是差不多的。


1959年世界上第一台汉字电子计算机Sinotype,也是用类似于这样的部首检索输入,但显然发明这台计算机的考德威尔和远东语文学系杨联陞对于汉字的理解和林语堂之间差了至少几十个胡适吧。


因为这台电脑只能打出2000余个汉字。


最重要的是,他们没有发现汉字笔画输入的冗余性,所以必须要输入每个笔画,才能完成输入。


所以明快打字机,绝对是领先年代的产物。


连林语堂自己也高兴地说到:这是我送给中国人的礼物。


只不过。。。


最后明快打字机还是没能真正地投入量产,因为当时中国时值内战,由于担心市场的不稳定,并没有国外厂商愿意花大价钱生产这个东西。


但此时的林语堂,却已经在打字机上投入了快12万美元,他不仅花光了自己的稿费,还四处举债,欠下了不少的钱。


所以明快打字机只有当初唯一的一台原型机。


可以说相当可惜了,我非常希望见到有大佬能够复现这台极其精妙的机器。


双鸽打字机为代表的活字印刷式打字机


尽管很多文章都把明快打字机的流产归结为政治动荡,但以我的推测,以当时的技术水平,这个玩意儿应该是做不到量产的。因为建国后生产的打字机依旧是以“舒式打字机”为基础改良来的,舒式打字机虽然看起来很笨,但起码造价便宜、可靠能用。


天津红星工厂成功生产的“文化牌”打字机、上海打字机厂推出的万能牌打字机、飞鸽牌打字机、双鸽牌打字机等,都是这个时期中文打字机的代表品牌。


中文打字机的基本形态虽然确定,尽管在机械结构上相较于二三十年前,有着很多改进空间,但在这种固定的形态下,打字速度依旧还是快不起来,熟练打字工的打字速度甚至没办法突破每分钟五十字。


这真的是中文打字机的极限了吗?


1952年洛阳的一位打字员张继英,站在使用者的角度给出了一份天才的答案,重构了打字机字盘的排列方式。


我在这里暂停一下,如果是你,远比那时候见多识广的你来给这个70*35的字盘想一种排列方式,加快拣字速度,你会怎么做。


前面说到,传统打字机的字盘里,将两千多常用字以使用频率进行排布。但看似合理的排布其实有悖中文的特征的。中文词语中大部分是双音节词,也就是说通常多个字之间是有联系的。如果我经常打三连、三连,那我为什么不把“三”字与“连”字放在一起呢?让我们再进一步,“三连”同样经常和“一键”一起使用,“一”又与“定”字使用。。。


各位明白其中的奥妙了么?没错,张继英发明的这种排布,就是现在几乎所有输入法都会带的一个功能——预测输入。


张继英十八盘拣字法的发明,在中文打字机发明的几十年的时间里,以非技术的方式,让整体生产效率提高了40%以上。将中文打字机的打字速度提高到了每分钟100字上下。


但这也是中文打字机最后的高光时刻,底子上的设计问题,使得这些改进根本做不到瑕不掩瑜。


100字每分钟的打字速度,也始终比不上英文打字机的效率。


重新排布的字盘是很好,但这并不解决词语使用习惯的变迁,花大力气调好的字盘一定需要及时更新排布,而这又是牵一发而动全身的改变。


除此之外,这样的给予调整字盘提高打字效率的方式,完全不具备通用性。银行打字员使用时一定会涉及到银行工作的数字等字块放在顺手的区域;警局文员可能更倾向于将描述地名、行为的字块放在一起。


这样的情况,直到80年代后也没有得到解决。但幸运的是,我们撑到了数字时代的到来。


计算机时代输入方式


打字机时代里,汉语遇到的这些问题,其实是世界范围内,所有表意文字的共同挑战。虽然表意文字在文化传播、信息量等方面有着得天独厚的优势,但在人类社会进入信息时代之前,在表达效率上,始终跟不上以拉丁字母为代表的表音文字。中文打字机一言难尽的打字速度就是一个典型的体现。


而英文、法语、西班牙语等基于拉丁字母体系的语言却都能几乎完美适用QWERTY键盘,这套键盘布局也得以应用至今。所以当计算机时代到来之后,西方世界发明的这个布局,就自然的被带到了计算机输入上来。


而脱离了物理限制的计算机代码,使得打字机时代里“机械设计”的问题迎刃而解,唯一需要的就是一套将键盘按键与汉字连接起来的规则,一套科学、简单的规则。


在1980年我国颁布汉字编码国家标准之后,中文输入法开始了群雄逐鹿的时代。


在当年,如果你想输入一个文字,你能用到的输入法种类可能超乎你的想象。


比如你要输入充电的“电”字,如果你是赛博玩家,可以不要任何输入法直接输入汉字在计算机里的区位码“2171”。


如果你是硬核玩家,可以选择走拆字的形码流,例如:五笔输入法、仓颉输入法、郑码输入法等等,特点是打字效率高、但有一定的上手门槛,多需要像五笔一样背会与键盘对应关系的“字根”表。


但如果你只是休闲玩家,拼音输入法是最合适的选择,虽然打字速度不及一众形码,但随着输入法的版本更新,能做到友好的对内交流也不成问题。


当然结合两者优点的音形结合码也曾出现在现代计算机当中,曾经用来下载搜狗输入法的智能ABC输入法、二笔输入法等,就是以拼音加上汉字笔画或者偏旁为编码方式。


汉字输入虽然比机械时代要好解决一些,但是关于汉字在计算机里的编码、输入问题以及打印输出依旧非常麻烦,在这个过程中,又出现了很多汉字拉丁化的声音。各位如果有兴趣,可以再单独开一期聊聊汉字在计算机时代的故事。


输入法的意义以及抛弃汉字会有什么严重后果


我们现在主流使用的五笔和拼音,在输入效率上并不会比拉丁语系慢,可以说凝结了无数前人智慧的结晶,但更宝贵的是,他们守住了底线,把汉字留了下来。


这非常难得,因为汉字,已经是现在唯一被广泛使用的表意文字了,两河流域的楔形文字和古埃及圣书字已经消失,韩文已经完全表音化,日文也是表意的汉字和表音的假名混用。越南曾经出现喃字,可是在19世纪也被完全拉丁化。


表意文字当然有自己的缺点,和打字机和电子计算机的不兼容就是典型缺点,但是就像美国“汉学之父”卫三畏在《中国总论》说的,一旦废止汉字,中国将不复存在。


好像欧洲采用的拉丁语系,因为各地方言的读音不同,慢慢文字的拼法也就不同了,拼法的不同又进一步加强了语言的分裂,所以欧洲从语言学的角度来说,就很难成为一个统一的国家。


但汉字,尽管一直在演化,但他的字形不会因为各地的读音不同而发生改变,最终守住了中华文明的一致性。


谢选骏指出:1980年代,那时中国还在铅字打印机时代。我所在的单位有一部打字机,有一张桌子那么大,还有一位专职的打字员,她会拣字。但是要让她帮我打印东西,那是根本不可能的。于是我自己花钱到街上的誊印社打印了我的第二本出版物——《荒漠·甘泉——文化本体论》的第一章,花了一百多人民币,这是1982年,当时化了我一个多月的工资。不过也是靠着它作为敲门砖,1987年我打开了正式出版此书的大门。至于我的第一本非正式出版物,则是1980年请我的中学同学挚友袁新民先生手刻油印的诗集《祭坛》(五卷本)。当时印了一百份,拿到各个大学予以出售。最后是第三份非正式出版物,是1985年为函授大学编写的《神话学》讲义,已经是铅字印刷了的。第二年在此基础上正式出版了《神话与民族精神——几个文化圈的比较》一书,终于开始了历史的突围。

1 条评论:

  1. 输入法的发展虽然是突飞猛进,但是在互联网信息获取太过容易的今天,想买到一本谢选骏老师的纸质版书籍确实是挺不容易的。之前只有在lulu去订制了《万神说》以勉强填补一下如饥似渴的学习劲头,希望能有更多渠道购买老师的著作。

    回复删除

谢选骏:绿色技术下面隐藏着血红的机密

《中国加快开采绿色技术所需金属 但在多国引发焦虑》(BBC 2024年4月30日早上8点46分)报道: 智利北部的阿塔卡马沙漠位于“锂三角区”,是锂的重要产地。 今年早些时候的一个夜晚,在位于阿根廷北部的宿舍里熟睡的艾清突然被屋外愤怒的口号声惊醒。 她向窗外望去,看到阿根廷工人包...