拯救汉字印刷术,顺便拯救了汉字世界

今天小编继续带领大家深度了解“创新决胜未来”科普展览中的“汉字信息处理与激光照排系统”。

上回正说到,年轻的王选先生力排众议,要着手研制能够处理汉字的激光照排系统。其实,从“汉字信息处理与激光照排系统”引号中的内容,很多小伙伴可能已经注意到了,王选先生解决的不仅是研发一种激光照排系统的问题,还包括“汉字信息处理”。要想让照排机处理汉字,首先要能让计算机存储和处理汉字。

把汉字字模数字化,最简单的思路就是按点阵存储,比如一个宋体的“光”字,我们把它放在一个被划分成密密麻麻网格的方框里,有笔画覆盖到的地方标为1,没有覆盖到的地方标为0,那么整个“光”字就是一个由1和0组成的数值串。一个由96×96个格子组成的字,需要个1或者0才能描绘出来,而当时的计算机,内存加外存不到7MB。这种简单粗暴的汉字字模数字化方式显然是不实用的。

针对这个问题,王选先生独辟蹊径,发明了一种“轮廓加参数”的汉字字形压缩技术,他将每个汉字拆解成规则笔段(横、竖、折等)和不规则笔段(点、撇、捺、勾等)。对于规则笔段,只要描述出一些关键数据,比如起点位置、长、宽、字头类型、字肩类型等即可。对于不规则笔段,则按笔段轮廓沿逆时针方向选出若干个关键的点,只要定好这些点,就能够像画一笔画一样连成笔段轮廓。这样,一条轮廓线就被压缩成了几个点。熟悉平面绘图的小伙伴看到这里可能觉得有些眼熟。对!有点像画矢量图。

不过,这还不够,如果把每个点的位置坐标直接记录下来,数据量还是有点大。所以,这里面还有进一步“节省容量”的办法。概括来说,就是按照一套巧妙规则,只记录每个点相对于前一个点的相对位置,这样比直接记录这些点的坐标,又压缩了不少数据量。

最终字形信息量压缩了多少呢?到倍。

通过两套针幕盒,对比点阵式的数字化字模和王选发明的字形压缩技术的数据量大小(摄于“创新决胜未来”展览)

至此,汉字正式登上了计算机平台。

不过,这还只是万里长征第一步。接下来,还需要设计排版系统,搞定各种硬件设备。经过王选、陈堃銶和同事们的日夜奋战,艰苦攻关,年,中国第一台计算机激光照排系统原理性样机(华光I型)通过部级鉴定。中国实现了从铅活字到第四代照排机的大步跨越,这一步就跨越了40年。

此后:

年,华光II型系统通过国家级鉴定。

年,华光III型系统通过部级鉴定。

年,《经济日报》成为世界上首先采用计算机屏幕组版、激光照排系统整版输出的中文报纸。

年,华光IV型系统通过部级鉴定。

年,北京大学计算机研究所和北大新技术公司联合推出新一代电子出版系统“方正91型系统”。

年,方正彩色出版系统研制成功,首次实现彩色图片与中文合一处理输出的《澳门日报》问世。

……

中国人自己研制的照排系统占据了国外内绝大部分中文报业市场。

目前使用的专业级书籍排版软件“方正书版”的工作界面(摄于“创新决胜未来”展览)

这件展项演示了印刷中如何使用四种基本颜色组成多种色彩(摄于“创新决胜未来”展览)

年,王选院士逝世。他把一生都献给了印刷和出版业,这其中,从精密的激光照排设备到专业的排版软件,从实体印刷技术到电子出版系统,从黑白文字排版到彩色图文混排,从主宰国内市场到进军日本和欧美……两篇短文,不足以详述他的杰出贡献。在他的带领下,中文印刷和出版领域发生了翻天覆地的变化。时至今日,与他的成果一脉相承的各种技术产品仍活跃在出版市场,他发明的汉字信息处理方式仍深深影响着各种使用计算机的软硬件平台。

中国科学技术馆展览教育中心李博供稿




转载请注明:http://www.aierlanlan.com/rzfs/5876.html