本发明属中文信息处理技术领域的汉字输入电脑的方法,具体地讲是将汉字构件依其起笔笔形分成五类,每一类又以其笔画数多少为主,联想与特定为辅,合理地安排在通用标准键盘上,再依其书写笔顺取一、二、三、末四个构件编码输入电脑的方法。 为使古老的汉字适应现代化生活的需要,人们创造了“四百余种汉字编码方案”(引自一九八六年九月二十一日《人民日报》海外版),如拼音码、区位码、电报码、五笔字型、五十字元……等等。这众多的汉字编码方案虽然对汉语言文字的发展作出了可喜的贡献,但并没有使汉字输入电脑方案完善。以五笔字型为例,她虽然拥有许多的使用者,但其字根排列的规律性还不强,增加了记忆难度,末笔交叉识别虽然在分离同码字方面起了作用,但总的讲是得不偿失的设计,本法正是在研究了众多的汉字编码方案之后,特别是在研究了五笔字型汉字输入方案之后,而作的新设计,目的是为了使汉字构件的排列更方便于记忆,两手的分工更加明确。由于该法着重对五笔字型汉字输入方案的改进,因而也可称之为《新五笔字型汉字输入方案》。
本发明精选汉字主构件32个附构件108个(附构件数包括联想与特定),它们大部分是《辞海》中的部首,或某个部首的拆分。极个别是某个字的拆分如“具”字的上部“”和“其”所有这些汉字构件,按其起笔笔形分成五类,即横类、竖类、撇类、点/捺类及折类。每类又分别按其笔画数多少为主,联想与特定为辅分成四至六小类,即横分成六小类;竖、撇、点、分成五小类;折分成四小类。图一,是汉字构件分类及英文字母对应表,它是本法进行汉字编码的基础。
汉字的构件在通用标准键盘上,按对应字母方案,可以得出,图2、图3、图4、图5,四种键盘排列图。
以上排列考虑了人的手指在键盘上地分工摆放与操作方便,按照图2,图3的键盘排列形式,左手控制起笔为横、撇、折三大类构件,右手控制起笔为竖与点两大类构件及提示键,按照图4、图5的键盘排列形式,除横类键有一个在右手控区外,其余是左手控制起笔为横、竖、撇三大类构件,右手控制起笔为点,折两二大类构件与提示键。
前面确定了汉字构件与相对应的英文字母及键盘,下面就谈一下如何编码。
1、编码取一个字书写笔顺的前三个构件和最后一个构件,不足四个构件的按笔顺取其实际构件组码。
例辩=PGYG(立十讠十)
明=KE(日 月)
(示例采用图2键盘图上的标法,下同)
2、尽量取由两笔以上组成的构件,如该构件在构件分类表上没有标注,按单笔构件处理。
例 理=BFN(一土里)
硕=GJGK(口 贝)
3、键面字输入及提示键的运用
a.键面字即主构件字,如要输入主构件字,击一下该键和一下提示键。
例:十=GM 口=JM
b.如要输入的是附构件字击一下该键及两下提示键。
例:厂=GMM 士=FMM
c.单独击一下提示键输入“的”字,击二下输入“地”字,击三下输入“得”字。
d.击某一个字母键和三下M键,将展示该键面下所有汉字。
例:JMMM=口、叶、号、叮、卟……
e.击数字键和M,将展示笔画数为该数的所有汉字。
例:5M=凹、旧、归、帅、北……
4、联词输入
a.双字词输入
双字词取每个字的头两个构件编码。
投标=STAG(扌儿木一)
怒吼=CRJX(女又口子)
b.三字词输入
三字词取头一个字的开头两个构件,和后两个字的头一个构件。
例新时期:PAKD(立木日其)新产品:PAPJ(立木立口)
新技术:PASA(立木扌木)
C.四字词的输入取每个字的第一个构件,或开头一字的头二个构件,后三字的第一个构件。
例:得天独厚=RBRG=RKBRG
d.五字以上词输入
五字以上词取头一个字的前二码按“/”键,取后两个字的第一码。
例:中央书记处=JN/YR
中央委员会=JN/JT
中央办公厅=JN/TG
5、同码字词的处理
同码字词的处理按提示行所显示的该字前的序号处理,若需要处第一位的不用选择,需处第二位以后的按其前的序号。
6、高频字的输入。除键面字外,每个键还代表一个高频字,它们是:不要来而在,上中是同国,我和他年会,主产为过这,书能发民经。输入只要击一下该键和空格键就可以输入。
以上字在键盘上的排列按起笔为横的在横类,起笔为竖的在竖类,余下类推,由于横类有六小类,折类分四小类,所以有一个折类字在横类。
附:背景材料一份。