形音汉字输入系统 本发明涉及一种汉字输入系统,尤其涉及一种利用汉字的形和音进行输入的系统。
利用五笔字形码、形声快码、汉字表形码、全息码等的汉字输入系统都属于汉字笔画、部件编码的汉字输入技术,都属于“形码”类,有些还附加了一些声码的特征。但是,上述这些输入技术,在字根设置、字根定码、字根分类、字根排序、整字定码等各方面都存在有相当不足之处,主要是形象无理、不合,学习和记忆不便等。
计算机汉字输入是我国计算机应用的重要方面。为解决上述目的,本发明的目的在于提供一种便于学习、广泛应用的汉字输入系统。适用于各种文化程度的用户。
本发明主要是把汉字拆分成字根,利用字根与英文字母的相似性进行编码,并辅以汉字的发音,然后通过计算机标准英文键盘进行汉字输入。
根据上述原理,本发明的形音汉字输入系统包括标准英文键盘,把26个英文字母分别用作汉字第一字根码、第二字根码、第三字根码和末位字根码,所述汉字输入系统包括下列步骤:
a通过键入键盘上表示第一字根码的键,输入汉字的第一字根码;
b通过键入键盘上表示第二字根码的键,输入汉字的第二字根码;
c通过键入键盘上表示第三字根码的键,输入汉字的第三字根码;
d通过键入键盘上表示末位字根码的键,输入汉字的末位字根码;
其中不足四个码地汉字输入一个空格符作为结束码,其特征在于,所述英文字母键和字根对应关系如下:A:又叉攵夊女及 瓦B:日日甘目且耳C:饣巨臣 虫禺D:丶冫丷氵灬火E:彐山屮巾习 儿几尢冘F:扌丰中串申 肀聿車事 钅G:戈曳弋H:艹廿卅世册 ク夕勹刀乃 一二三I:讠礻衤亠六立主 丨忄 工王正五里J:丁于 豕犭豸 亅刂小 丿八彡川爫 丆厂广疒K:丬片爿L:匕七乜也屯电车M:木本未末禾耒束柬果N:冂门冖宀月丹冉 O:口凹凸P:卩阝尸尹Q:四皿田母毋口R:臾央大丈夫史吏夷S:5丂与马 井开弗西酉曲T:不干币甲U:心臼V:人入亻彳厶ㄍ巛W:幺纟ㄋ了弓X:力九 癶北兆非Y:上止土士由丫鱼Z:辶廴乙乛 子孑孓 走下面对本发明的上述构思进行详细地描述和解释。下面先对字根与编码的对应关系作一解释。编码A:1.三角两腿又叉攵夂女及变杈放务处复夜努极
这9个汉字字根形状特点是三角形下有两条腿,与英文字母“A”的外形特点一致,故以字母A作为代码。(注:上面两行中,第一行为汉字字根,第二行为与上述汉字字根对应的一个例子,下同。)
2.a形
瓦
瓮
字根“瓦”与字母“a”外形相象,以字母A作为其代码。
编码B:
方框上下重叠
日曰甘目且耳目
明昂某蓑眼咀真聚其身追
这11个字根都有“方框上下重叠”的特点,与字母“B”形状相象,取字母B作为其代码。
编码C:
1.三面包围,开口向右
饣巨臣
区卯氏越留饭距宦熙
这9个字母的外形特点是“三面包围,开口向右”,取字母C作为其代码。
2.虫类读音
虫禺
蛀惠寓禹
这4个字根与英文字母无相象之处,但是,内部都含有“虫”,取“虫”字读音首字母C作为代码。
编码D:
1.点笔读音:
丶冫丷氵灬火
太冰曾其寒飞海学煮伙炮雨鬯
这13个字根都属于汉字的“点”笔画,在书法中分别称为“冰旁点”、“曾头点”、“其脚点”、“三点水”等,与英文字母无相象之处,取“点”笔读音首字母D作为其代码。
2.D形
把
这个字根与英文字母D相象,以字母D作为其代码。
编码E:
1.三面包围中含一舌
彐山屮巾习
印虐扫录密出逆搜币黎戳
这11个字根与英文字母E有共同的特点,“三面包围中含一舌”,以字母E作为其代码。
2.儿类读音
儿几尢冘
光机风见龚沈既羌免鬼
这10个字根外形与“儿”字相似,好象十个人从右向左跑,但与英文字母无相象之处,取“儿”字读音首字母E作为其代码。
编码F:
1.一竖多横
扌丰中串申
半手那打年慧寿书姊肺制伟婕仲患审囊革
肀聿車事
唐肃隶建甫庸墼
这26个字根的共同特点是“一竖多横”,中间一竖至少穿过两横笔,与英文字母F有共同的特点,取字母F作为其代码。
2.F形
镸钅
钙婿段肆钱这5个字母与英文字母F都有一定程度的相象之处,取字母F作为其代码。编码G:戈类读音 戈曳弋 戏绕钱或拽民代
这7个字根以“戈”字带头,在书法中都含有戈钩,外形与英文字母无相象之处,取戈字读音首字母G作为其代码。
编码H:
1.一横多竖
艹廾廿卅世册
艾异革带 屉舞删
这8个字根的共同特点是“一横多竖”,中间一横至少穿过两竖笔,与英文字母H有共同的特点,取字母H作为其代码。
2.横笔读音
一二三
旦示假闫刁
这5个字根属于汉字的横笔画,取横字读音首字母H为其代码。
3.小h
ク夕勹刀乃
色欠久多然万菊召扔
这9个字根与英文字母H的小写体相象,取字母h作为其代码。
编码I:
1.讠旁(点下一横类)
讠礻衤亠六立主
语福初衷帝校章住崔
这9个字母以言字旁“讠”带头,含点下有横笔的共同特点,取字母“i”作为其代码。
2.竖笔
丨忄
引州恨店临而
这6个字根是竖笔或以竖笔为主,取字母I为其代码。
3.大I
工王正五里
汞攻皇理整悟童黑
这8个字母以工字带头,中间一竖上下有横,若上下横写短一些就和英文字母“I”相近,取字母I为其代码是合情合理的。
编码J:
1.大J
丁于
汀可予芋碍牙争
这7个字母以“丁”字为代表,都有横下竖左钩的特点,取字母J为代码。
2.犭旁
豕犭豸
家聚象犹貌
这5个字根归为一类,中间都含有竖左钩,也取字母J为其代码。
3.竖左钩
亅刂 小
水别少常步添永
这7个字根都含有竖左钩的特点,尤其是字根就是英文字母j,故这类字母取j为其代码。
4.丿类
丿八彡川爫
渊州师制才公界勿反形训荒爱
这13个字母都属于撇笔类,有以撇笔为主,有以撇开头,有两撇的,有三撇的,字母J写简单些就成一撇,故取J为其代码。5.横下 厂广疒 石页援辰府皮虎病这8个字根是横下有撇,也取J为其代码。编码KK形丬片爿辰监气竿作将羊兴畀良牌奘这13个字根都是K的变形,取K为其代码。编码L:竖折匕七乜也孔亡鼠鼠丐比颖乇切 池毛吨绳龟军东练这18个字根都含有竖折笔画,先竖后折,取L为其代码。编码M:
木类读音
木本未末禾耒束柬果
李笨来茉和耙策枣刺谏裹乐秉
这13个字根与英文字母无相象之处,但其共同特点是都含有“木”,取木字读音首字母m为其代码。
编码N:
1.三面包围,开口向下
冂门冖宀月丹冉
奂罔周闫幂宝朋彤船再骨
这11个字根的特点是“三面包围开口向下”,与英文字母N的小写体n相象,取n为其代码。
2.捺笔读音
尺
这个字根取捺笔读音首字母N为其代码。
编码O:
框中无物
口凹凸
咒兕 兵互
这5个字母都是封闭的空框,框中无物,取字母O为其代码。
编码P:
方框左边下拖辫子
卩阝尸尹
御卫遐服陈尺层民眉卵即君
这12个字根是“方框左边下拖辫子”,取字母P为其代码。
编码Q:
框中有竖
囙囬罒四皿田母毋口
卣面罗泗血曾临象牌猫惯海 国
这14个字根的特点是“框中有竖”,取字母Q为其代码。
编码R:
大丈夫类
臾央大丈夫史吏夷
决庚更庾英太仗扶驶使姨春
这12个字根都象“大丈夫”的样子,两腿叉开立在那里。从第一个字根的样子来看,象英文字母R,故取R为其代码。
编码S:
1.S弯
与马
考污写驱乌岛鸟专
这8个字母粗看外形都象S,故取S为其代码。
2.两竖多横
井开弗西酉曲
讲研昔鹿兼费寒要硒酒蛐曹典
这13个字根的特点是两竖穿过至少两横,与美元符号相象,美元符号中含有字母S,故取S代为其代码。
编码T:
横下一竖
不干甲
斤歪平拜需师雨第钾郸
这10个字根的共同特点是“横下一竖”,取字母T为其代码。
编码U:
三面包围开口向上
凵丩心臼
凶叫孩必陷
这5个字根都有“三面包围开口向上”的特点,取字母U为其代码。
编码V:
两边夹角
人入亻彳厶ㄍ巛
会籴足年使衡台瓜粼巡
这10个字根都有几何图形“两边夹角”的特点,取V为其代码。
编码W:W形幺纟ㄋ了弓丝系红杨函张这6个字根都与W有不同程度的相象,取W为其代码。编码X:1.单交叉力九爻朝协丑有乎长发别旭这10个字根都是两条线简单交叉,取X为其代码。2.左右对称癶北兆非水函鳏业变亦登祭肃鼎兜舆芈燕逃辈这16个字根的特点是“左右对称”的,以第一个字根为代表,与英文字母X相象,故取X为其代码。
编码Y:
1.横上一竖
上止土士由
卡步此赤吉卖责贵卸勤聘妻垂重熏
这15个字根都有“横上一竖”的特点,说不上与英文字母都有相象之处。但是,如果在纸上写一个“横上一竖”的符号丄(最好下面的一横稍长一些,上面一竖稍短一些),再把纸按逆时针转45度,这样,就是一个“Y”,故取Y为“横上一竖”这类字母的代码。
2.丫形
丫
吖
这个字根就是Y
3.复合读音
鱼
鲁
这是一个复合字根,可由“hqh”组成。但是,“鱼”已成为常用汉字部首,取读音首字母Y为其代码。
编码Z:
1.横折
辶 廴乙
眨近廷艺飞司丑今买敢令己侯劲
这14个字根属“横折”类,先写横笔再连一折,与Z有共同的特点,故取Z为其代码。
2.子类
子孑孓
李孙 承
这4个字根都含“子”,外形与Z的小写相同,故取Z为其代码。
3.复合读音
走
践趣
这是两个复合字根,但是已成为汉字的常用部首,取其读音首字母Z为代码。这里把足字旁“”定码为Z,不包括“足”字。“足”字作为一个整字,其码为oiv。
上面对编码进行了描述,下面作进一步说明。
A.字根表说明:
在字根表里明确反映了字根设置、字根定码、字根分类、字根排序等几个主要特点。
一、字根设置
本编码共设406个字根。这些字根是从国标汉字字库6763个字中仔细选出的,包括了各类的笔画部件,具有完全的代表性,同时又不过多。掌握了这些字根就可以迅速准确地给出6763个字中每个字的编码。
二、字根定码
字根定码是各类形码的核心部分。一般认为,“象”实际上是一个相对的概念,从有一点点象至非常象,在程度上有很大的差异。在这个范围以外的情况是一点也不象或者不仅象而且就是相同,譬如汉字的言字旁“讠”和英文字母“I”的小写体象到相同的程度;汉字“永”中间的部分和英文字母“j”差不多就是一个样;汉字“斤”右下边就是英文字母“T”。在这里还有一个“合理”的概念,合理与不合理也有程度上的差异,也有相对性。本发明人对形码教学十多年,讲授几十遍,有几百人的大课,也有几十人的中课,几个人甚至个别人的讲课,哪个字根定得有道理,哪个字根道理勉强,心里有数。例如,字根“”都属横下一竖,原定码“T”是很自然的。后来觉得这两个字根不是很象“F”吗?。因此,本编码技术包含了各码之长,拚弃了它们的无理部分。现将本汉字输入技术独特合理之处列于下表:
B:
C:饣
D:丷火
E:儿几ㄤ冘
F:钅
G:戈曳曳弋
H:二三
夕ク
I:礻衤六立
忄
J:丁于
豕犭豸
亅刂小
八彡川爫
K:
L:
M:禾
n:
S:
T:
V:厶巜巛
Y:鱼
Z:走
上述字根定码都是本发明的独到之处,也正是已有的各类形声码的不足之处或是错误之处。
三、字根分类
有些码字根本身分成离聚型、交叉型、包围型、粘连型、字架型等五大类,把字根归到这些类里,与英文字母顺序不同,易造成混乱。本发明的编码把字根直接与英文字母形状类比,大写、小写、印刷、手书象哪一类字母就分成哪一类字根,拉近了汉字字根与英文字母的距离,增加了用英文字母拼写汉字的直感,通俗简明容易掌握。下面以定码为“J”的字根为例说明:
1、大J类
丁于
这7个汉字字根横、竖、左钩,规规矩矩清清楚楚和大写字母“J”几乎一样。
2、犭类
豕犭豸
这5个汉字字母如同五只小狗,以第一个为例,明显含有横竖、左钩,五个字母归为一类理所当然。
3、竖左钩类
亅刂小
这7个汉字字根以竖、左钩为特点,即大J上的一小横忽略,只考虑竖、左钩,也是字母J。
4、撇类
丿八彡川爫
这13个汉字字根主要是有撇笔画,由撇笔开始或以撇笔为主,手写字母J就是一撇。
5、横下撇
丆厂 广疒
这8个汉字字根的特点是横下一撇,字母J上的小横放大了还是J。
上述五类汉字字根,每一类的特点都很突出、很典型,只要几个字“大J类”、“竖左钩类”、……就把各类字根的特点勾画得清清楚楚,易理角、易记忆。
四、字根排序
每类字根先后顺序也是很有讲究的。首位是排头兵,应是典型性最强的、最有代表性的、最象的。接下来是渐变的,如:“撇类”,从简单的一撇至一点一撇、一竖一撇、…、一撇一捺、一撇一竖、左右两撇、上下两撇、三撇、…;在竖左钩类中,最后一个是,更象小写字母“j”,把最象的放在最后也给人以更可信赖的效果。
B、重要规定:
一、最多四码
汉字结构复杂,有的字多于四个字根。但是,在电脑输入时只取第一、二、三、末四个字母,如:
汉字 所含字根 实取字根
鹆 dvojs dvos
族 ihvvr ihvr
鼠 uldldl uldl
蹁 zdpnh zdph
二、结束码
不足四个字根的汉字以一个空格作为结束码。
三、读音码
只有两个字母的汉字,信息量少可能出现重码字,一般加上两个该字拼音的首字母作为“读音”码,基本上可以唯一确定该字,可加快输入速度。但是,当不认识该字时,在两个字母后加一个结束码也可以。
四、填充码
只有一个字母的汉字重码会较多,要在一个字母后加两个字母K,称为“填充码”,后面还可以再加一个该字的读音码,一般也可以唯一确定该字。但是,当不认识该字时,也可以在填充码后加一个结束码。当然,填充码也可以用其它字母来代替,只要重叠两个即可。
五、未知码
当难以确定一个汉字的某一字母时,可在该码处输入一个问号,代替该字母,称为“未知码”。
六、笔画顺序
汉字笔画顺序是一个难题,因为某些汉字的笔画顺序一般人习惯常有所不同。但是,本输入技术是取汉字字根,字根顺序一般不会出现错乱。因而,避开了笔画顺序这个难题。
七、字母拆分原则
已设字根的不可再拆,如“丶、冫、氵、灬”不可再拆成单点;都应是D。
八、词组码
二字词:每字取前两码,对单码字补一个字母K。
例如:电脑(lkni) 党员(jnon) 光明(jhbn)
三字词:首字取首两码,当首字为单码时第二码补K;第二、三字各取首码。
例如:总路线(dozw) 新中国(imfq) 小学生(jkdj)
多字词:取第一、二、三、末字的字首码。
例如:舍己为人(vzdv) 有志者事竟成(xyyj)
九、为了发挥26个英文字母的作用,提高汉字输入速度,让每一个字母代表一个汉字,一个字母键和一个空格键就输入一个汉字,26个英文字母分别代表了26个汉字。这26个汉字应该符合两方面的要求。一是使用率高,二是容易掌握无需记忆。根据这个要求选定26个汉字及其相应字母列于下面:又 不 出 的 而 分 个 和 以 就 可 了 们A B C D E F G H I J K L M你 一 平 起 大 是 他 于 人 我 下 有 在N O P Q R S T U V W X Y Z
这26个字中只有“一”以字母O代表没有道理,其它25个字一看就知道:有的字是本身的代码;有的字是拼音首字母;有的字是拼音的谐音。
本输入技术通俗简明,不受文化程度限制不受地区方影响,以八岁小学生为例,三个小时即可掌握,即可使用。不需强记,不易忘记。本技术不但不影响的的汉字学习,而且还可以从根本上改善人们的文化素质。因为本技术不仅科学合理地解决了计算机汉字输入问题,而且还解决了汉字排序这个难题,按这个顺序编排的汉字字典,将是汉字字典的新的里程碑。