声形四码汉字计算机输入方法 技术领域 汉字计算机键盘输入法输入技术.
背景技术 现在广泛使用的五笔字型(王码)计算机汉字输入法共有130个基本字根,10条以上的编码规则.字根的选取与汉字以形声字为主的特点无关,汉字的拆分与汉字书写的笔顺习惯不完全一致.因而难学难记难拆分,这影响了在一般用户中五笔字型(王码)的推广.为此,本人发明了形声四码汉字计算机输入方法(专利申请号:981107113·9,以下简称形声四码),并且已经获得专利授权。声形四码汉字计算机输入方法是形声四码的发展与优化.在汉字计算机输入方法中,为了减少字根(部件)的数量,简化编码规则,使汉字的拆分符合汉字书写的笔顺习惯并且容易拆分;同时从汉语词汇以声为主、以形辅之的特点出发,改变形声四码汉字计算机输入方法的以形为主,以声辅之的偏向,采取输入单个汉字以形为主,以声辅之,输入多字词以声为主,以形辅之的方法,平衡字词的声与形的关系;此外为了兼顾电话、手机等用数字键盘输入汉字信息的用户需要,使汉字计算机输入方法易于在一般用户中广泛推广,本人发明了声形四码汉字计算机输入方法(以下简称声形四码)。
发明的内容 发明内容分两部分叙述:A.与声形四码发明有关地现有技术基础知识;B.声形四码发明内容.
A.基础知识
1.笔画、笔形的分类及代号 笔画:构成楷书汉字的最小连笔单位(有时简称笔).笔画依据笔势和走向可以分为五类基本笔形,每类对应一个数字,这个数字叫此类笔形的代号.笔形的分类及代号见表: 代号 名称 笔画走向 说明 示例 1 横 由左至右 提笔皆属横 ″坟″字的第一、三、五笔 2 竖 由上至下 竖左钩属横 ″可″字的第二笔和最后一笔 3 撇 由右上至左下 ″学″字的第三笔,″杉″的后三笔 4 点 由左上至右下 捺属点 ″江″字的前两笔, ″术″字的后两笔. 5 折 带拐弯 除左竖钩外 带拐弯的笔画皆属折 ″驰″字的第一、二、四、六笔 ″号″字的第二、五笔
2.笔顺 一个汉字按正楷书写时,各笔画的先后顺序叫笔顺.关于笔顺有以下规则:
1)从上到下,从左到右;
2)先横后竖,先横后撇,先横后捺,先横后折;
3)从外到内,先里头后封口,先中间后两边;
4)与国家语委、新闻出版署联合主持制定的《现代汉语通用字笔顺规范》矛盾时,以此规范为准.
3.区位号、与英文字母的对应关系
计算机键盘的标准打字键区的英文字母键,按标准指法可以分为5个区,每区分为5个位.以一个英文字母键所在的区号做高位,位号做低位,可得一个两位数.这个两位数叫此英文字母的区位号,英文字母叫此区位号的代码.区位号与英文字母的对应关系如下表:
由于除N外的英文字母与区位号一一对应,因此下文叙述中,无特殊说明时,区位号与英文字母可以互换。
B.声形四码发明内容
1.基本部件:声形四码从常用数字偏旁部首中选出了34个(包括其变形)作为基本部件,并建立了基本部件与键盘英文字母键位的第一种映射关系如下:
W 钅(金),S 木,L 氵,I 火,A 土(士)
Q 鱼,U 忄,H 目,X 扌,V‘跑’的左偏旁
N 纟,E 月,O 虫,K 口,J 艹
C 女,G 王,D 石,Y 疒,T‘篮’的上部首
T 禾,B 日(曰),P 讠(言),M 田,I 米,A 车
E 舟,U 又,P 衤,M 贝,F 革,F 酉 N、R 人、八;
a.说明:钅、纟、讠、车对应的繁体字偏旁与简体字偏旁所在的键位相同;
b.仅作尾码用的基本部件:人(八)作尾部件时,如果被其它笔画隔开(如莱)或与其它笔画相交(如英)则代码为N,否则代码为R(如肉、洪)。
34个基本部件与键盘英文字母键位的第二种映射关系如下:
J--钅、金,M--木,S--氵,H--火,T--土、士;
Y--鱼,X--忄,M--目,S--扌,Z--‘跑’的左偏旁;
S--纟,Y--月,C--虫,K--口,C--艹;
N--女,W--王,S--石,B--疒,Z--‘篮’的上部首;
H--禾,R--日、曰,Y--讠、言,T--田,M--米;
C--车,Z--舟,Y--又,Y--衤,B--贝,G--革,U--酉,
R 人、八;
说明:钅、纟、讠、车对应的繁体字偏旁与简体字偏旁所在的键位相同;
以上所述基本部件与键盘键位的两种映射关系使用时可以任意选择其中一种。
2.一般部件:除基本部件外,按汉字笔顺书写的连续两笔构成一个一般部件。一般部件以先写的笔画的代号作区号,后写的笔画的代号作位号,该区位号及其对应的英文字母就是该一般部件的代码。
例如:‘住’的左偏旁为一般部件,代码为32(R);‘打’的右偏旁为一般部件,代码为12(F)。
3.声形四码的取码规则1:形声四码的前3码为形码。一个汉字按书写笔顺依次取第一部件、第二部件、最末部件,其代码分别作第一部件、第二部件、最末部件的代码。第一部件代码、第二部件代码、最末部件代码及其顺序构成形码。例如:
使用第一种映射关系时‘住’的第一部件代码、第二部件代码、最末部件代码分别为32(R)、41(Y)、15(A),形码为324115(RYA),简记作:住(RYA)。再如:濡(LSJ)、膏(YKE)。
使用第二种映射关系时‘住’的第一部件代码、第二部件代码、最末部件代码分别为32(R)、41(Y)、31(T),形码为324115(RYT),简记作:住(RYT)。再如:濡(SSJ)、膏(YKY)。
4.声形四码的取码规则2:笔画较少的汉字,形码取不足3个部件时,所缺笔画一律用撇(3)补齐。
使用第一种映射关系时例如:飞(534333)=(CIE) 汪(LGE)
扎(XCE) 对(UFI)
使用第二种映射关系时例如:飞(534333)=(CIE) 汪(SWE)
扎(SCE) 对(YFI)
5.声形四码的取码规则3:基本部件独立成字时,以其代码为第一部件代码,然后从第3笔开始取第二部件代码、最末部件代码。
使用第一种映射关系时例如:木(SWE) 鱼(QMD) 言(YGK)
贝(MWE) 又(UEE)
使用第二种映射关系时例如:木(MWE) 鱼(YTD) 言(YGK)
贝(BWE) 又(YEE)
6.基本部件独立原则:除作尾部件的人(八)外,基本部件不能与其他笔画相交,也不能被其他笔画分隔,否则按一般部件取码。
使用第一种映射关系时例如:吉(AKE) 教(FDW) 中(MFE)
国(MGY)
使用第二种映射关系时例如:吉(TKE) 教(FDW) 中(MFE)
国(MWY)
7.取大优先原则:既可取一般部件,又可取基本部件时,取基本部件;既可取大(笔画较多的)基本部件,又可取小基本部件时,取大基本部件。但一笔不能同时用在两个部件中。
使用第一种映射关系时例如:往(ELG) 蛀(OYA) 颁(WCM)
权(SUE) 杈(SXI) 譬(BRP)
使用第二种映射关系时例如:往(ELW) 蛀(CYT) 颁(RCB)
权(MYE) 杈(MXI) 譬(BRY)
8.声形四码的取码规则4:声形四码的第四码为声码,一个汉字的汉语拼音的第一个字母即为其声码。生僻字的声码可以用V代替。
使用第一种映射关系时例如:潘(LWMP) 是(BFRS) 我(THWW)
中(MFEZ) 跟(VBWG) 筑(TFXZ) 瘃(YDWZ) 瘃(YDWV)
使用第二种映射关系时例如:潘(SWTP) 是(RFRS) 我(THWW)
中(MFEZ) 跟(ZBWG) 筑(ZFXZ) 瘃(BDWZ) 瘃(BDWV)
9.使用第一种映射关系时人(八)作尾部件的例子:
钠(WMNN) 肉(MWRR) 粪(IJRF) 尜(KYNG) 茉(JGNM)
该(PYRG)
不按人(八)作尾部件取码的例子:
全(WGEQ) 家(OBWJ) 类(IDIL) 项(FGMX) 茶(JWSC)
10.汉语词汇的声形四码的取码规则
由两个或两个以上的汉字组成的词儿的声形四码其取码规则为
双字词:顺次取第一个字的声码、第二个字的声码,再取第一个字的第一部件代码和第二个字的第一部件代码;
三字词:顺次取第一个字的声码、第二个字的声码、第三个字的声码,再取第三个字的首码;
四字词或四字以上词:顺次取第一个字的声码、第二个字的声码、第三个字的声码,和最后一个字的声码。
使用第一种映射关系时例如:编码(BMND) 新中国(XZGM)
发明专利(FMZL) 潘乐宁(PLNO)
使用第二种映射关系时例如:编码(BMSS) 新中国(XZGM)
发明专利(FMZL) 潘乐宁(PLNO)
11.用声形四码计算机键盘汉字输入法利用数字键盘输入汉字时,从所述基本部件中选出20个和5种笔画与数字键建立如下映射关系:
1--横 2--竖 3--撇 4--点(捺) 5--折
6--金(钅) 7--木 8--水(氵) 9--火 0--土(士)
6--丝(纟) 7--月 8--虫 9--口 0--草(艹日(曰)十)
6--人(八) 7--心(忄) 8--言(讠) 9--手(扌) 0--病(疒)
6--女 7--王 8--石 9--鱼 0--′篮′的上部首。
汉语拼音使用的各个字母与数字键建立如下映射关系:
1--A 2--B 3--C 4--D 5--E 6--F 7--G 8--H 9--I 0--J
1--K 2--L 3--M 4--N 5--O 6--P 7--Q 8--R 9--S 0--T
5--U 6--V 7--W 8--X 9--Y 0--Z
用数字键输入汉字时,利用数字键键盘上的相应键位依次输入按书写笔顺构成该汉字的第一部件代码,第二部件代码,第三部件代码,最末部件代码和该汉字的汉语拼音首字母代码共五码;当构成汉字的笔画取不足4个部件时,所缺笔画一律用0补足前四码;
用数字键输入汉语词汇时也是五码,包括:
双字词:利用数字键盘上的相应键位顺次输入该词第一个汉字的汉语拼音首字母代码和第二个汉字的汉语拼音首字母代码,第一个汉字的第一部件代码、第二个汉字的第一部件代码和第二部件代码;
三字词:利用数字键盘上的相应键位顺次输入该词第一个汉字的汉语拼音首字母代码、第二个汉字的汉语拼音首字母代码和第三个汉字的汉语拼音首字母代码以及第二个汉字的第一部件代码和第三个汉字的第一部件代码;
四字词:利用数字键盘上的相应键位顺次输入该词第一个汉字的汉语拼音首字母代码、第二个汉字的汉语拼音首字母代码、第三个汉字的汉语拼音首字母代码和第四个汉字的汉语拼音首字母代码及其第一部件代码;
四字以上词:利用数字键盘上的相应键位顺次输入该词第一个汉字的汉语拼音首字母代码、第二个汉字的汉语拼音首字母代码,第三个汉字的汉语拼音首字母代码、第四个汉字的汉语拼音首字母代码和最后一个汉字的汉语拼音首字母代码。
用数字键输入汉字输入码举例如下:
是(01269) 我(31247) 中(25120) 跟(92147) 筑(01250)
瘃(01346) 钠(62544) 肉(25368) 粪(43066) 尜(23446)
茉(01143) 蚂(85513) 该(84167) 朝(00073) 情(71177)
编码(23685) 新中国(80722) 潘乐宁(62434)
发明专利(63023)中国人民银行(07838)新疆维吾尔自治区(80777)
12.使用声形四码汉字计算机输入方法输入汉字时,对6763个国标汉字按使用频率从高到低排序,第一代码相同的所有汉字中使用频率最高的一个为单码字;第一代码和第二代码都相同的所有汉字中除单码字外使用频率最高的一个为双码字;第一代码、第二代码和第三代码都相同的所有汉字中除单码字和双码字外使用频率最高的一个为简码字;第一代码、第二代码第三代码和第四代码都相同的所有汉字中除单码字、双码字和简码字外使用频率最高的一个为全码字。当键入第一代码时,单码字出现在提示行的第一位置,并伴有该单码字的读音提示,如果再击空格键,那么该单码字输入到指定输入位置,即单码字可以“第一代码+空格键”输入。类似地双码字和简码字可以分别用“第一代码+第二代码+空格键”和“第一代码+第二代码+第三代码+空格键”输入,并且都伴有该字的读音提示。输入全码字时,击完其声形四码后,可以击数字键4,也可以击下一个汉字或汉语词汇的第一代码,全码字都会输入到指定输入位置。当某个形码或声形四码中没有汉字却有汉语词汇时,此汉语词汇同样有类似于简码字或全码字的输入方式。
附图说明 无附图
具体实施方式 使用声形四码汉字计算机输入方法应用软件,利用计算机英文字母键盘或者电话、手机的数字键盘输入汉字和汉语词汇。