天然音码输入法 本发明涉及将汉字输入电子计算机的编码法,进一步是指以汉语拼音为基础按照一定规则转换而成的汉字输入缩码方法。
现有技术中,用于电子计算机处理中文信息的汉字编码方案已为数不少,其中以汉语拼音为基础的输入方案更易为熟知汉语拼音者所接受。但已有的所述编码方案存在记忆量大、使用不方便等缺陷,难以推广应用。
本发明的目的是,设计一种天然音码输入法,它以汉语拼音为基础而获得相应输入码,实现汉字输入电子计算机,具有易学易会,使用方便,输入速度快,重码率极低的特点。
本发明的技术方案是,所述天然音码输入法的编码由汉语拼音转换码加笔对码组成,用表达式可表示为:
汉字编码=汉语拼音转换码+笔对码式中,所述汉语拼音转换码包括:
(1)带调韵母的转换码:
a1-A 01-O e1-E
a2-B 02-P e2-F
a3-C 03-Q e3-G
a4-D 04-R e4-H
i1-I u1-U ü1-Z
i2-J u2-V ü2-Z
i3-K u3-W ü3-Z
i4-L u4-X ü4-Z
(2)无调韵母的转换码:
a-M O-N e-S
i-T u-Y ü-Z
(3)其它转换码:
zh-I ch-O sh-E
《》-V ng-M
(4)以上转换码式中,左侧为汉语拼音字母(其中(1)项中的1、2、3、4表示声调),右侧为键盘的健位代码,上述以外的汉语拼音字母的代码与对应相同的键位代码一致(如汉语拼音“b”在键盘上的键位代码为“B”);取码时,拼音转换码最多取前三位(即最多三码);
所述笔对码的组成是:
(1)以1、2、3、4、5分别表示汉字笔划的横、竖、撇、捺、折,每两笔划组成一个笔对。
(2)笔对码的转换码有:
11-G 12-F 13-D 14-S 15-A
21-H 22-J 23-K 24-L 25-N
31-T 32-R 33-E 34-W 35-Q
41-Y 42-U 43-I 44-O 45-P
51-B 52-V 53-C 54-X 55-Z上述各式左侧为笔对代号,右侧为相应的键位代码。它们在键盘上的分布是:
Q35 W34 E33 R32 T31 Y41 U42 I43 O44 P45
A15 S14 D13 F12 G11 H21 J22 K23 L24
Z55 X54 C53 V52 B51 N25
(3)笔对码只取汉字地第一、二笔,但当汉字是声形字时,笔对码不能从表声字根中取码而是从下一字根中取码。
以下对本发明的技术方案做出进一步说明。
汉语拼音的带调韵母有四声,例如a的四个声调的传统表示为a、a、a、a,本发明中相应为a1、a2、a3、a4,其它带调韵母亦作相应表示。本发明将汉字的汉语拼音的声调标在最后一个韵母上(写在其右侧),这样就有了无调韵母;例如汉字“表”的传统拼音是“biao”,本发明写为“biao3”,其中的“i、a”为无调韵母,该字的转换码为BTMQ。有些字的拼音无声母(如“安”的拼音为“an”),本发明对此要求先打一“空声母”码V(表示为“《》”符号),如AN2的转换码为VBN 。
本发明为了克服重码,设置了笔对码的取码让位原则,即当汉字是声形字时,笔对码不能从表声字根中取而要求从下一字根中取(请表声字根让位)。例如,若不使用所述“让位原则”,汉字“哥”与“歌”的编码会相同(出现重码);按照“让位原则”,因“歌”字左侧字根“哥”为表声字根,则笔对码取码要从“欠”字根中取,由此得到该字的编码为GEQ,不同于“哥”字的编码。本发明的笔对概念是研制者在其第94117717.3号专利申请中已经提出的,该专利申请公开说明书中对此亦做出了说明。
本发明还设计出相应的词组编码,包括:
两字词:分别取第一拼音码和笔对码;
三字词:取第一字的第一拼音码和笔对码,再加第二字及第三字的第一拼音码;
多字词:取第一、二、三和最后一字有第一拼音码。
由以上可知,本发明为一种天然音码输入法,可方便地实现汉字输入电子计算机。“天然”的意义在于只要掌握了汉语拼音就能自然掌握本发明之编码法而无须更多的记忆与训练。换言之,本发明以汉语拼音为基础,依所述规则取得转换码,具有易学易会、操作简便、输入速度快,重码率极低的特点。