汉字笔序缩位编码及其键盘输入方法 本发明涉及一种汉字的编码及其键盘输入方法。
目前汉字的输入编码方法很多,其中有以汉字的笔画代号来编码的,这种汉字输入编码方法是将汉字的基本笔画分为横(一),竖(丨),撇(丿),捺(丶),折(乙),一般用数字1,2,3,4,5相应代表各笔画,按汉字的笔画书写顺序逐一输入汉字的各笔画代号。这种方法特别适用于以数字键为主的键盘的电子产品,如电话、计算器等。其缺点是码位太长,对于码位超过5位的字在操作中容易出错,而且其编码只使用五个数字键,未能充分发挥数字键盘的资源,使得其应用受到限制。而当前随着信息技术的发展和人民生活水平的提高,移动电话已日趋成为人们日常生活和工作中的必需品,移动电话的全汉字化已是大势所趋,所以,方便、快捷、适合在移动电话上作汉字输入的汉字编码方法将会有效地提高人们的工作效率和改善人民的生活质量。
本发明的目的就是为了克服目前的汉字笔画代号输入方法中码位太长,操作中途易出错的缺点,而发明的一种适合于移动电话等产品使用的方便、快捷、直观、易用并能充分发挥数字键盘地现有资源的汉字编码方法。
目前常用的汉字笔顺输入方法,是逐笔输入,每输入一码显示序号从0到9的拾个汉字,如果所需汉字已出现则用功能键“*”或“#”和该字的序号完成输入,如果未见所需汉字,则继续输入下一码,在输码过程中始终只使用1到5五个按键,而0,6,7,8,9这五个按键和数字不起作用。本发明的特点之一就是使这些未被使用的按键和数字也能发挥作用,而且这些数字在起作用时不用死记,但却起到可以缩短笔序码的作用。
实现本发明所述的汉字笔序缩位编码及其键盘输入方法的具体方案之一如下:
所述的汉字编码及其输入方法,包括将重码汉字从字库中检索到显示窗的汉字编码和公知的将同组重码汉字从显示窗中调入正文的方法,其特征在于:
A、汉字部首的笔画在书写汉字时全部连续在该汉字其它笔画书写之前书写的,则该部首为该汉字的前部首,该汉字称为以该部首为前部首的字;如汉字“树”中的“木”和“权”都有是“树”的前部首,“树”字是以“木”或“权”为前部首的汉字,对字库中包含的部首作字处理;
B、将汉字的基本笔画分为横(一),竖(丨),撇(丿),捺(丶),折(乙),分别定义在键盘数字键1,2,3,4,5上,并用该数字分别作为对应笔画的代号;
C、按笔画书写顺序将组成汉字的笔画定义为第一笔,第二笔,第a笔,第(a+1)笔,第(a+2)笔...第(a+b)笔,第(a+b+1)笔,第(a+b+2)笔;从第(a+1)笔到第(a+b)笔相连的若干(b)笔可以压缩为一逻辑笔画,压缩后位于该逻辑笔画之前的笔画序号不变,逻辑笔画的序号与被压缩的笔画中最小的笔画序号第(a+1)笔相同,位于逻辑笔画后边的笔画其序号向前相应移动(b-1)位,原第(a+b+1)笔的逻辑序号变为第(a+2)笔,原第(a+b+2)笔变为第(a+3)笔,逻辑笔画序号中的笔画压缩前后只改变笔画序号而不改变笔画本身;没有笔画被压缩的字其原笔画的序号即为其逻辑笔画序号;如汉字“树”字的第二笔到第四笔共三笔被压缩为一逻辑笔画“8”,则组成“树”字的逻辑笔画变为“一8乙丶一丨丶”,逻辑笔画“8”前的第一笔不变,逻辑笔画“8”变为第二笔,原第五,六,七,八,九笔的逻辑序号分别变为第三,四,五,六,七笔。经压缩后的“树”字如果其逻辑笔画从第三到第四笔再被压缩为“6”则经第二次压缩后“树”的逻辑笔画按序排列为“一8 6一丨丶”。没有笔画被压缩的字其原笔画的序号即为其逻辑笔画序号;
D、每屏显示重码字的最大数m不小于8;一般优先选择m=10,也可以选11、15、20;
E、汉字的第一位笔画代号即为该汉字编码的第一码位,称为该汉字的一级码;将全部汉字取一级码后,汉字将被分为以五种基本笔画为代号的五组一级码组,一级码组的代号与该码组内汉字的一级码一致;
F、汉字的第n(n=2,3,4,5,6)码位的取码方法为:将(n-1)级码相同的汉字组成对应该(n-1)级码的(n-1)级码组;当该(n-1)级码组内的字数小于或等于m时,该码组称为极码组,其汉字不用再取码,只需对极码组内的汉字用1,2,3,4,5...编上不同的显示号,该(n-1)级码即为该码组中各汉字的编码;当(n-1)级码组的字数多于m时,从该码组中选出m个汉字组成对应的(n-1)级小组,其中该码组中只有(n-1)个笔画的字为必选字,如果该码组中有以被压缩的字为前部首的汉字,则至少选择一个以该被压缩的字为前部首的字进入(n-1)级小组;用序号1,2,3,4,5...对(n-1)组小组中的汉字编上不同的序号,该序号为对应汉字的显示号,(n-1)级小组中汉字的(n-1)级码即为该汉字的编码;作为前部首被选入(n-1)级小组的字,从其第n逻辑笔画开始到最后一位逻辑笔画全被该部首的显示号压缩;该(n-1)级码组中除去(n-1)级小组的汉字后余下的字组成对应的(n-1)级大组;当(n-1)级大组中的字以(n-1)级小组中的某一字为前部首时,取该前部首的显示号为该字的第n位码位;(n-1)级大组的汉字在(n-1)级小组中没有作为其前部首的字时取其第n逻辑笔画的代号为其第n码位;汉字的(n-1)级码和其第n位码位顺序组成该字的n级码;所述的汉字第n码位是指第2、第3、第4、第5、第6...码位。
要输入某汉字时,先输入其编码,再键入“*”和该汉字的显示号,即完成该字的输入。当然也可以用“#”等其它符号代替“*”,而且对于输入极码组的汉字时,可以将“*”省略,其具体工作可由软件实现。
实现本发明所述的汉字笔序缩位编码及其键盘输入方法还可以有第二种方案,其与第一方案不同之处在于将第一方案的特征B和E改为如下:
B、将汉字的基本笔画分为横(一),竖(丨),撇(丿),捺(丶),折(乙),分别定义在键盘数字键1,2,3,4,5上,并用该数字分别作为对应笔画的代号;选择若干个汉字前部首分别定义在键位1、2、3、4、5以外的键位上,并用相应键位作为相应前部首的代号;
E、汉字的部首为B所选的前部首时,取该部首对应的代号为该字的编码的第一码位,余下的汉字取其第一位笔画代号为其编码的第一码位,第一码位是该汉字的一级码,将全部汉字取一级码后,汉字将被分为以五种基本笔画和B所选的前部首为代号的若干组一级码组。
第二种方案是将部分前部首首先定义在1、2、3、4、5以外的键位上,其码位长度将比第一种方案更简。如:可以选择部首“扌”、“艹”、“木”、“氵”、“口”分别定义在6,7,8,9,0五个数字键上,这时“树”字的第一位编码为“8”。
为了使汉字输入更加简洁,可规定上述两方案中显示号为1,2,3,4,5的字不作为任何字的前部首,具体可以将无可能作为任何字的前部首的字编排在序号为1,2,3,4,5的显示号中。当然,也可以规定只有在极码组中才允许显示号为1,2,3,4,5的字作为其它字的前部首,因为此时各笔画键已对极码组完成笔画编码的工作。