本发明涉及到一种电子计算机汉字输入方法及其键盘。 电子计算机汉字输入方法,一直是在中国普及计算机的“瓶颈”问题。国内外许多专家进行了大量的研究,提出了500多种汉字输入方法。这些输入方法可分为六大类:
一、音码:即根据汉字的读音来编码。如汉语拼音码、山东省唐樊宽的《中文声数码》。音码的优点是容易学、直观。缺点是码长长,重码率高,不会读的字无法输入。
二、形码:即根据汉字的字形来编码。如河南省王永民的《五笔字型》、陈国斌的《层次四角》、江西省万仁芳的《前三末一》。优点是重码率低,码长短,不会念的字也能输入。缺点是有一套拆分汉字进行编码的规则,要记忆字根在键盘上的分布位置,难学。
三、音形码:即同时根据汉字的读音和字型来编码。如四川省陈代于的《大众码》、北京市郭淑珍的《声韵声声》、扶良文的《智能码》、周志农的《自然码》。根据汉字“同音不同形、形似不同音”的规律,音形码的重码率大为降低。但是仍然存在难学、不会念或念不准的字难输入的问题。
四、数码:用数字进行编码,如区位码、电报码。数字编码的优点是只用10数字编码,容易操作、无重码。缺点是用一般的学习方法极难记忆。
五、声控输入:即读出汉字的音,就可输入汉字。如北京四达技术中心开发的声控卡。优点是不用对汉字编码,缺点是错误率高,对同音字无法区分。
六、手写输入:即写出汉字的形,就可输入汉字。如哈尔滨工业大学开发的手写识别系统。优点是不用键盘,适合文秘人员用笔地习惯。缺点是输入速度慢,每字平均10画,远远大于每个汉字击键的次数,错误率高,形相近的字难识别。
本发明的目的,在于向公众提供一种把汉字音和形的信息转化为数字,用数字对汉字进行编码的无理序号数字综合编码法。
本发明具体结构和细节,从附图说明和实施例中给出。
本发明的实施方案是:键盘设计、中文信息数字化、汉字编码、词组编码、中文输入方法等具体内容。
一、键盘设计:
本发明将标准英文键盘的英文字母、符号30个键设计成0.-9.、◎-⑨、(0)-(9)等30个带符号的数字键。从键盘中部Y、H、N分开、右边是双数,左边是单数,键盘中部数值小,边部数值大。见附图1。
二、中文信息数字化:
本发明将汉语拼音的声母、韵母、汉字的字型笔画、部首各分成10类,编码0-9,分别叫声母码、韵母码、字型笔画码、部首码。见附图2
(一)、声母码:汉语拼音包括23个声母,见附图3
数字0、1、2、3、4、5、6、7、8、9有多种读音,如:
1、按普通话正常读音,如0零、1一、2二……
2、电讯读音,如0洞、1妖、7拐……
3、音符读音,如4发、6拉……
在以上读音的基础上,我们把声母作如下归类:(见附图2)
0-因为电讯读音“洞”的声母为d,t是与d成对的声母,所以把d、t归到0。
1-因为读音“一”的声母为y,r的读音与y相近,所以把y、r归到1。
2-因为读音“二”无声母,以韵母e开头,能位于读音首字母的韵母还有a、o,所以把e、a、o开头的汉字称为无声母汉字,其声母码规定为2。
3-因为读音“三”的声母为s,sh、x的读音与s相近,所以把s、sh、x归到3。
4-因为音符“发”的声母为f,h的读音与f相近,所以把f、h归到4。
5-因为读音“五”的声母为w,所以把w归到5。
6-因为读音“六”的声母为l,n、m的读音与l相近,所以把l、n、m归到6。
7-因为读音“七”的声母为q,电讯读音“拐”的声母为g,k是与g成对的声母,所以把q、g、k归到7。
8-因为读音“八”的声母为b,p是与b成对的声母,所以把b、p归到8。
9-因为读音“九”的声母为j,所以把j归到9。
还剩z、zh、c、ch没有归类,考虑到把汉字均匀地归到0-9,本发明把z、zh归到2,c、ch归到5。
如果声母归类与数字读音相抵触,则以数字读音为准,即零的声母为l,四的声母为s,但根据零、四的读音,零归到0,四归到4。
(二)、韵母码:汉语拼音有37个韵母,包括6个单韵母,15个复韵母,16个鼻韵母。首先根据韵母首字母a、o、e、i、u(包括ü),把韵母分成5大类,每一类又分成单韵母、复韵母、鼻韵母。共分成15类,见附图4。其中e、er、ei、en、eng、a、ai、ao、o、ou、ong的使用频率很小,把使用频率小的韵母合为一类,计有e、er、ei、en、eng合为一类,o、ou、ong合为一类,a、ai、ao合为一类。这样共分成10类,按照数字0-9的韵母读音,用0-9进行编码,见附图2。具体是:
0-因读音“零”的韵母为ing,所以以i开头的鼻韵母归到0。
1-因读音“一”的韵母为i,所以单韵母i归到1。
2-因读音“二”的韵母为er,所以以e开头的韵母归到2。
3-因读音“三”的韵母为an,所以以a开头的鼻韵母到3。
4-因音符读音“发”的韵母为a,所以以a开头的单韵母、复韵母归到4。
5-因读音“五”的韵母为u,所以单韵母u归到5。
6-因读音“六”的韵母为iou,所以以i开头的复韵母归到6。
7-因电讯读音“拐”的韵母为uai,所以以u开头的复韵母归到7。
以o开头的韵母和u开头的鼻韵母没有对应的数字读音,数字8、9尚未编码,故规定以o开头的韵母归到8,以u开头的鼻韵母归到9。
(三)、字型笔画码:根据笔画的读音声母码和汉字字型结构,把字型和笔画分成10类,编码0-9,具体编码是:汉字的字型可分为左右型、其它型。汉字的笔画可分成6个单笔,横、竖、撇、捺、点、折,2个复笔,口、直交。字型分成两类:0-左右型、1-其它型,笔画分成8类,取笔画读音的声母码(点例外),即2-折(包括钩、折弯钩)、3-竖、4-横、5-点(包括提)、6-捺、7-口、8-撇、9-直交。见附图2。
(四)、部首码:采用新华字典规定的部首和取部首原则,根据部首的笔画数和部首的使用频率,把部首分成10类,编码0-9。具体编码是:取部首的笔画数为部首码,7画以上的部首归到7。分不清部首的字归入单笔部首,取1,例:-1、冫-2、广-3、王-4、目-5、耳-6、赤-7。数字0、8、9尚未编码,一些部首的使用频率很大,构字能力很强,为了离散重码,选出33个构字能力很强的部首分配到0、8、9。例氵-0、扌-8、土-9。见附图2,
三、汉字的编码
按照无理序号越小、即越常用的字击键次数越少,击键越容易的原则,对汉字编码。分为音形码和形码两类:
(一)音形码:
1.常用字三位:声母码+韵母码+字型码,例:是-411(shi其它型)、们-620(men左右型)。
2.次常用字四位:声母码+韵母码+首笔笔画码+字型码。例:理-6140(li-左右型)、齐-7151(qi、其它型)。
3.稀用字五位:声母码+韵母码+首笔笔画码+尾笔笔画码+字型码。例:揖-11440(yi-左右型)、字-15521(yu、乙其它型)。
4.罕用字五位:声母码+韵母码+首笔笔画码+尾笔笔画码+部首码。例:徘-84843(pai丿-彳)、疸-03548(dan、-疒)。
(二)、形码:
1.常用字三位:首笔笔画码+尾笔笔画码+字型码。例:时-350(丨、左右型)、会-851(丿、其它型)。
2.次常用字四位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+字型码。例:宫-5771(丶口口其它型)、控-4450(-、左右型)。
3.稀用字五位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+余部第二笔笔画码+字型码。例:屠-24941(乙-十-其它型)、沼-57280(丶口乙丿左右型)。
4.罕用字五位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+余部第二笔笔画码+部首码。例:檐-97820(十口丿乙木)、奢-44948(-十-大)。
当部首位于起笔时,余部第一笔、第二笔指除部首外的第一笔、第二笔,当部首不在起笔时,余部第一笔、第二笔指整个字的第二笔、第三笔。
四、词组编码:分二字词、三字以上词。
(一)、二字词:
1.音形码:首字声母码+首字韵母码+首字首笔笔画码+二字首笔笔画码+二字声母码。例:提高-01457(ti-、g)、他们-04886(ta丿丿m)。
2.形码:首字首笔笔画码+首字尾笔笔画码+二字首笔笔画码+二字尾笔笔画码+二字部首码。例:方法-52550(、乙、、氵)、已经-22240(乙乙乙-纟)。
(二)三字以上词:
1.音形码:首字声母码+二字声母码+二字首笔笔画码+未字首笔笔画码+未字声母码。例:北京市-89554(bj、、s)、为什么-53886(ws丿丿m)。
2.形码:首字首笔笔画码+二字首笔笔画码+未字首笔笔画码+未字尾笔笔画码+未字部首码。例:桂林市-44532(-、丨亠)、邮政编码-34445(丨-石)。
按词的使用频率从大到小排列,二字词、三字以上词依次取前一位、二位、三位、四位简码。
五、图形符号编码:图形符号码长五位。编码方法是:根据图形符号的读音、意义,挑选两个关键字作为图形符号的名称,根据图形符号的名称对图形符号编码。在音形码状态下为:首字声母码+首字韵母码+首字首笔笔画码+二字首笔笔画码+二字声母码。如:▲-41543(实三si、-s)、≠-85480(不等bu一丿d)。
在形码状态下为:首字首笔笔画码+首字尾笔笔画码+二字首笔笔画码+二字尾笔笔画码+二字部首码。例:△-54441(空三、-),%-44888(百分-丿丿八)。
六、中文输入法:由于本发明把中文信息转化为了0-9十个数字,输入3-5数字,就可以输入一个字或词组、图形符号。计算机识别10个数字远比识别几千个汉字容易得多,也比识别26个英文字母容易,因此本发明可广泛应用于计算机键盘输入、声控输入、手写输入,还可以用于中文信息有线、无线电数字通信,字典、词典的编码排序等。
1.计算机键盘输入:计算机标准英文键盘可分为左边英文键盘和右边数字键盘。本发明提出的3-5位字编码,5位词编码和图形符号编码,1-4位词简码用于右边10个数字键输入。输入2-4位数字后,以0结束左右型汉字上屏,以1结束其它型汉字上屏,输入1-4位数字后,以回车结束,左右型汉字打头的二字词上屏,以“·”结束,其它型汉字打头的二字词上屏,以“+”号结束,三字以上词上屏,输入5位数字,字、词、图形符号上屏。
3-5位字编码,5位词编码和图形符号编码,1-4位词简码用于左边30个键输入,基本键位为中排键,输入中排2-4位数字后,以0结束左右型字上屏,以1结束其它型字上屏,击满5键字、图形符号上屏。输入中排1-4位数字,以上排键结束,左右型汉字打头的二字词上屏,以下排键结束,其它型汉字打头的二字词上屏,以空格结束三字以上词上屏。
左右两边共用一套字、词库,可采用左中文右数字,左英文右中文,左中文右中文的输入方式,输入纯中文和中英文混合输入。
2.计算机小键盘输入:对于只有10个数字键,没有英文键的计算机,可用3-5位字编码,5位词及图形编码输入中文。
3.声控输入:可用3-5位字编码,5位词及图形符号编码输入中文,只要读出0-9中3-5位数字的读音,就可输入一个汉字或词组、图形符号。
4.手写输入:使用3-5位字编码,5位词及图形符号编码输入中文,只要写出0-9中3-5个数字,就可输入一个汉字或词组、图形符号。
5.手指接触输入:一双电子手套,10个手指代表10个数字,一个手指按任何一物体,就可输入一个数字,用手指按物体输入字、词组、图形符号的数字编码,就可输入中文。
6.有线、无线电通信:应用3-5位字编码,5位词及图形符号编码,实现有线、无线电中文传送,可取代中国现行的4位数字电报码。
7.应用3-5位数字编码,5位词及图形符号编码,作为计算机的内码和交换码,使内码和外码统一起来,可降低计算机的成本。
8.应用3-5位字编码,5位词及图形符号编码对字典、词典、图书资料、人名、地名、物品进行编码排序。
附图说明:
图1:3×10键盘图
图2:中文信息数字转化表
图3:汉语拼音声母表
图4:汉语拼音韵母分类表
本发明的优点:
1.英文键盘数字化,把30个英文、字符键盘设计成3套0-9数字键盘;
2.中文信息数字化,把中文音、形信息转化为0-9数字;
3.在使用31个键位,一万条常用词的条件下,平均码长每字1.5键。在使用13个键位,一万条常用词的条件下,平均码长每字2.2键,字、词均无重码,中文输入速度快;
4.充分利用国民知识汉语拼音和部首、笔画,易学、易用;
5.能快速输入图形符号,方便地制作表格;
6.可用音形码、形码输入中文,适应不同用户的需要;
7.在同一输入状态下,实现中英文、数字混合输入;
8.占用计算机内存少,在无硬盘,只有512K内存的普及型微机中都能运行本方法。