DoNews.com
《规范化使自然码更加自然》周志农
木鱼精灵 | 自然码 | 出处:转载| 2011年03月06日 18:40 | 阅读
        

一、规范化给自然码带来的变化

“自然码汉字输入系统”(简称自然码)是一种以音为主、以形为辅、音形结合、智能化处理的汉字输入软件。在编码方式上采用与通常的简拼很相似的双拼,简单易学、通用性强。输入时以词组为主,通过智能化处理,使输入速度较快、动态重码率低、击键少。微软的Windows操作系统在双拼输入法上均采用与自然码双拼兼容的方案。

虽然自然码双拼已经广泛应用,并且适合词组输入,但是在实际工作当中,仅仅使用双拼作为编码仍有不足之处,特别是在输入单字时这种情况尤为突出。自然码在最初设计时为了解决这个问题,安排了两个形码作为双拼编码的可选辅助编码,利用偏旁部首的发音声母作为编码,较好地解决了拼音方式下单字重码的问题,单独键入形码解决了不认识字的快速查找问题。实践证明,自然码的这一特色编码方案深受广大自然码用户的喜爱。

但是,过去自然码的形码部分由于过多地考虑偏旁部首声母比较集中的问题,为减少重码,人为地改变了一些部首的编码,没有将所有部件完全安排在发音的声母上,还多使用了四个符号键位作为笔画和部分部首的编码,因而在易学性上造成了一定的问题。再者,旧的自然码方案在处理会意字和部首位置不明显的字时,未采用多重选择方式,给自然码带来取码混乱的结果,造成不少用户对自然码的形码不能完全掌握和正确使用。

《汉字部件规范》中明确了汉字拆分原则和基础部件,给汉字编码提供了依据。《汉字部件规范》中的汉字“笔画标准”可以减少过去对倒插笔的兼容编码,“拆分规则”和“基础部件”解决了不同习惯的用户对汉字拆分的多种理解问题。另外,《汉字部件规范》中纠正了过去由于对某些编码的片面宣传和推广而导致的错误概念和错误观念,为我国汉字和汉字编码的后续研究及发展奠定了基础。

自然码作为国家信息标准化委员会向全国推荐的标准输入方法,作为全国计算机等级考核、自学考试以及全国很多省市计算机考试的推荐方案,已经遵照《汉字部件规范》对原来的形码部分进行了改造,现已全部完成,正在进行完善和纠错工作。新方案力求简单易学,简繁通用和直观明了,相信推出后一定会受到广大用户的喜爱,让新老用户更加满意。

二、规范化后的自然码更加简单

自然码新版本中将全部采用遵照《汉字部件规范》重新完成的新的形码方案。新方案比旧方案更加简单,二义性也更少。新的形码方案中采用了最直观的切分方法(“切形”),按汉字“形声字”和“会意字”的组字原则,将汉字全部视为由两个汉字(部件)组成,然后分别用这两个汉字的双拼声母作为编码。新的笔画编码也不再像过去那样使用符号键位,而同样用发音的声母来表示,因而更加容易理解和使用。

新的自然码在正常输入时仍采用“声韵+形形”的方式,取码时遵照《新华字典》和各类辞典的习惯查字方法,按偏旁部首(义部)的顺序优先取码。因为汉字主要由形声字所组成,以偏旁部首作为区分同音字的方案恰恰与汉字的组字规律一致,比起完全从上到下、从左到右按书写顺序取码的方式,更符合思维,其重码率也并没有增加太多。

新的自然码在取码上遇到多重理解时,也可以多重选择。比如在对“思”、“载”、“观”、“靡”、“鸿”的取码上,就允许双重选取。经过改造后的新的自然码其单字重码率会比过去的方案高一些,但是对于普通用户的正常输入几乎没有影响。因为一般用户在输入单字时仅使用到第3键,即双拼加部首的声母键,这时的重码一般不到10个,很容易选择。新的编码在第二个形码的取码上也做了调整,全部采用整字读音,虽然单字的重码会增加,但是单字与词组同时出现的可能性也相应地减少了,使用时反而会感到总的动态重码率降低了。此外,在实际输入过程中,由于采用了输入3键单字优先、输入4键词组优先和智能相关处理等其它辅助功能,即使选择了GBK大字符集后,改变编码和扩充GBK汉字对实际输入也没有什么影响。

在查找不认识的字和疑难字时,以往的各种编码方案都不很理想。按笔画查找容易数错、重码很多、输入麻烦;按部件拆分也很困难,需将部件编码和特殊规则背下来,要花几个星期才能掌握。而用新的自然码“切形”方案处理起来就容易多了。只要将汉字分成左右或上下两个部分,分别输入这两个部分汉字的双拼或全拼编码就能方便地找到所需要的汉字,并且重码率也并不高。比如:“骈”字,只要将其分成:“马”和“并”,然后输入它的双拼“ma”和“by”,或它们的全拼“ma”和“bing”,就会在提示行上看到“骈”字以及后面的读音和声调。

三、规范化促使自然码软件走向新的层面

以往的中文系统和中文环境都是以GB2312为内码标准,仅提供6763个汉字,虽然各中文系统和中文环境均提供了造字程序,但是无法达到交流的目的,因此,多数情况下造字功能形同虚设。比如,你在自己的机器里造了一些汉字,然后将含有这些字的文稿盘带到不同的地方,或通过Email传送给其他人,但对方只能看到乱码或空字。如果将这样的文稿磁盘交给印刷厂,也同样无法直接输出和印刷。现在,由于Windows 98和Windows 2000/xp支持GBK大字符集,并内配了宋体和黑体两种GBK曲线字库,使得GBK大字符集汉字能真正应用起来。

在以往人们的观念中,以拼音为基础的方案无法处理20902个汉字的大字符集,用大字符集就要用形码方案来处理。其实这是一种误解。因为一般的汉字大家都认识,即使经常处理古文或文言文,其中不认识的字也不会太多。新的自然码提供的“GB/GBK自然”和“GB/GBK拼音”完全按照字频排列,同时提供词组功能,并且还有辅助的形码,因此,输入一个字非常简单。对于不认识的字,新的自然码还提供快速查字方法。测试证明,新的自然码方案在处理大字符集扩充汉字时,与处理6763个汉字几乎没有什么不同。在输入3键的情况下,大多数汉字的重码数都不超过10个,对于不认识的汉字仅仅需要输入两个双拼的编码,一共4键就可轻易找到,既方便又快捷。

新的自然码编码方案更有利于中、小学计算机教学,适合各行各业的实际应用,也更适合语言文字工作者和繁体应用较多的专业人员使用,同时也适合采用Big5内码的海外和外企单位人员使用。


发表评论| 收藏此页到365Key
相关讨论

    没有评论        

木鱼精灵介绍

木鱼精灵 用自然码的系统管理员。
木鱼精灵的栏目

木鱼精灵更新

本站更新

本站焦点

木鱼精灵归档

>>More
关于我们 [English] | 合作联系 | 版权信息 | 聚会相册 | 友情连接 | 使用指南
Copyright (C) 2000-2005 DoNews.COM ( IT社区&媒体平台 )
All Rights reserved.