汉字数字化输入法 1技术领域
本发明提供了一种在数字键盘上输入汉字的方法,根据这一方法制作的汉字输入软件,可以应用于各种信息、通讯设备,属于汉字信息处理技术领域。
2背景技术
2.1目前,用于数字键盘的汉字输入法主要有拼音输入、笔形输入和音形输入三大类。
2.2拼音输入主要有两种输入方式:一种是逐个选择拼音字母,另一种是组合选择拼音字母;目前主要采用输入速度较快的后一种方式,并逐步引进了用于字母键盘的智能拼音模式。
2.3笔形输入以笔画输入为主。目前流行于手机的T9就是按照笔画顺序输入横、竖、撇、捺、折五种笔画,分别对应数字键12345,再用数字键6789和星号键进行选择或用专门选择键进行选择。其他一些输入法多是在横、竖、撇、捺、折五种笔画的基础上,增加一些自定义部件,如六键六码的五笔数码增加了口、双笔码增加了叉。只有纵横码等少数输入法是模仿四角号码方式,将十种笔形放置在十个数字键上。纯笔画输入方法简单,掌握容易,但选字很烦,速度较慢。笔形输入方法复杂,规则较多,但重码较少,速度较快。
2.4音形输入既输入汉字拼音,又输入汉字笔形,二笔数码是其代表。这种方法需要掌握拼音、笔形两套体系,输入速度又不快,因而普及率不高。
2.5目前,基于数字键盘的汉字输入法主要应用于手机输入短信。T9、iTAP和字能是三种在手机上应用最广的输入法。其中T9输入法是目前使用最为普遍的输入法,诺基亚、三星、索尼、飞利浦、TCL和NEC等不少品牌手机都是用的这种输入法。T9输入法又分拼音和笔画两种。T9拼音输入的好处是,只需要输入该字母所在的按键一次,手机会自动组成拼音以供选择。T9笔画输入法主要是通过五个笔画组合成字。iTAP是在T9的基础上发展起来地,它的好处是即使有些人发倒笔,也可以根据不同笔划自由组合出所需的汉字来。这种输入法多在摩托罗拉手机上可见。字能输入法也以笔画为基本,但将折笔细分为四种,其优势在于设置了询问键,去代替其中不知应该怎样分拆的疑问笔画。使用这种输入法的手机有爱立信、联想等。这种输入法在输入时不是太快,但在词语联想方面非常丰富。
3发明目的
3.1科学技术的发展,使各类电子产品愈来愈集成化和小型化,特别是移动通信和数字电视的出现,给汉字输入法带来了巨大的市场。汉字输入平台正在大规模地从字母键盘转向数字键盘。随着短信业务的发展、移动上网的普及和互动节目的开通,迫切需要一种易学、好用、快速的基于数字键盘的汉字输入法。本发明就是为了满足这一市场需求。
3.2基于数字键盘的汉字输入法大都应用于手持、便携、随身的电子产品。这些电子产品的显示屏幕都很小,如果要在屏幕上选字或者写字的话,本已十分珍贵的显示空间要被选字框或写字栏占用近一半;由于屏幕显示空间有限,每页显示的备选字就比较少,翻页次数、找字时间都会大量增加,这就使汉字输入的效率大大降低。本发明就是要提供一种字词都不用选、即字词重码率都为零的汉字输入法。
3.3现有基于数字键盘上的汉字输入法,不仅重码率很高,而且输入词语的功能很弱,大都借助于联想方式输入数量较少的两字词语,不能以直接方式输入大量词语,更不能整体输入短语、句子和定制短信,这就极大地限制了汉字输入速度的提高。本发明就是要提供一种在数字键盘上可以直接输入词语、短信和句子的汉字输入法。
3.4只有采用笔形输入,才能实现汉字输入不重码。如果只用五种笔画来输入汉字,由于汉字笔画数较多,既使研制出的汉字输入法没有重码,平均输入一个汉字的击键次数也会很多,反而会降低输入速度。本发明就是要提供一种基于一笔和两笔的汉字输入法,这种输入法如同笔画输入法一样简单,而且平均每字击键次数最少。
4发明内容
4.1基本原理
汉字是由笔形组成的。本发明将众多笔形统统化成横、竖、撇、捺这一最简形式。横、竖、撇、捺不脱笔书写就构成了折笔和钩笔,脱笔书写取最简单的两个笔画和组字最多的口笔。无论是折笔、钩笔,还是两笔,都根据其中最有代表意义的一个笔形来归类。
汉字由哪些笔形组成,就按照书写顺序输入这些笔形,所需的汉字将唯一地出现在屏幕上,击确认键就完成了这个汉字的输入。如果不击确认键,继续输入后续汉字的字形,就输入这个汉字与后续汉字组成的词语。
4.2汉字笔形
4.2.1基本笔形
汉字的基本笔形有横、竖、撇、捺四种。
(1)横:从左向右书写的笔形,形状为一;提的书写方向与横大体相同,归为横,
(2)竖:从上向下书写的笔形,形状为丨;
(3)撇:从右上方向左下方书写的笔形,形状为丿;
(4)捺:从左上方向右下方书写的笔形,形状为;点丶的书写方向与捺相同,归为捺。
4.2.2钩笔笔形
钩笔中的钩是用毛笔书写汉字收笔时留下的痕迹,不属于基本笔形。根据钩笔的起笔,将钩笔分为横钩、竖钩、撇钩和捺钩四种。
(1)横钩:以横起笔的钩笔,形状为乛;
(2)竖钩:以竖起笔的钩笔,形状为亅;
(3)撇钩:以撇起笔的钩笔,形状为
(4)捺钩:以捺起笔就钩笔,形状为
4.2.3折笔笔形
折笔是由若干个基本笔形构成的。根据构成折笔的最后一个笔形,将折笔分为横折、竖折、撇折和捺折四种。
(1)横折:以横、提结尾的折笔,如
(2)折竖:以竖、竖钩结尾的折笔,如ㄋ
(3)折撇:以撇、撇钩结尾的折笔,如
(4)折捺:以捺、捺钩结尾的折笔,如
4.2.4两笔笔形
两笔是由两个基本笔形构成的。根据构成两笔的第二个笔形,将两笔分为横对、竖对、撇对和捺对四种。
(1)横对:第二笔是横、提的两笔,如亻
(2)竖对:第二笔是竖、竖钩的两笔,如
(3)撇对:第二笔是撇、撇钩的两笔,如ナ丆丷
(4)捺对:第二笔是点、捺钩的两笔,如ハ乂人
4.2.5口笔形
口指汉字“口”以及与“口”形状相似的笔形,这是一种特殊笔形。口有三种情形:
(1)作为汉字的口,如品、唱、由、罗中的口;
(2)作为外框的口,如国、园、囟、粤中的口;
(3)由两个折笔组成的口,如贯中的口。
4.3笔形键位
4.3.1汉字的基本笔形、钩笔笔形和折笔笔形,都是汉字笔画,放置在数字键1至4上,所以数字键1至4称为笔画区。
(1)数字键1:对应横、横钩和横折,用“横笔”来统一命名,其标识符号是黑色“一”;
(2)数字键2:对应竖、竖钩和竖折,用“竖笔”来统一命名,其标识符号是黑色“丨”;
(3)数字键3:对应撇、撇钩和撇折,用“撇笔”来统一命名,其标识符号是黑色“丿”;
(4)数字键4:对应捺、捺钩和捺折,用“捺笔”来统一命名,其标识符号是黑色“”。
4.3.2汉字的两笔笔形放置在数字键5至8上,所以数字键5至8称为两笔区。
(1)数字键5:对应横对,其标识符号是红色“一”;
(2)数字键6:对应竖对,其标识符号是红色“丨”;
(3)数字键7:对应撇对,其标识符号是红色“丿”;
(3)数字键8:对应撇对,其标识符号是红色“”。
4.3.3汉字的口笔形对应数字键9,所以数字键9称为口笔区,其标识符号是红色“口”。
4.4笔形取法
4.4.1按照笔画顺序,横、竖、撇、捺每两笔取作一个笔形。例如:王平左 5 5 8 5 2 7 6 1正杯征 6 6 1 6 8 7 8 7 5 5 5年奔汪 5 6 6 7 5 5 6 8 5 6 1
4.4.2钩笔、折笔和口单独取作一个笔形。例如:了区达 3 2 7 4 1 7 8 3 4马电阵 2 2 1 9 1 4 3 5 1 6万安男 1 2 3 8 1 4 5 9 6 2 3
4.5汉字输入
4.5.1按照笔画顺序输入笔形,当所需汉字出现时,按确认键。例如:在国放 7 9 5 5 2 7明骨按 9 7 2 2 2 1 2 8 4前麻党 7 6 5 5 7 8 8 1 9
4.5.2输入完全部笔形,所需汉字仍未出现时,再从头依次输入笔画。例如: 八八十十尸 8 3 6 1 2 2 7 2 1乙乙乙 天犬 4 4 5 8 1 7 8 1 3口 口兴乡 9 2 2 8 5 8 4 1 1 3 1
4.6词语输入
4.6.1当第一个汉字出现时,不按确认键,继续输入第二个汉字,以此类推,直到所需词语全部出现时,按确认键。例如:工作→工+→工作 6 1 6 5快点来→快+→快点+ 8 2 2 5 9 8→快点来心想事成→心+→心想 4 4 8 6 8+→心想事成 1中国共产党→中+→中国 9 2 9+→中国共产党 6
5技术特点
5.1本发明在以下几个主要方面具有创新性:
(1)无论是由一个笔画构成的笔形,还是由多个笔画构成的笔形,都只根据其中最具代表意义的一个笔形来分类,这样就把结构较为复杂的笔形简化为横、竖、撇、捺四种最简单的笔形,这是本发明独有的汉字笔形分类方法。
(2)将汉字的钩笔从折笔中分离出来,并根据钩笔的起笔将钩笔分为横钩、竖钩、撇钩和捺钩,还钩笔本来的面目,这是本发明对钩笔重新定义。
(3)输入汉字笔形,当所需汉字出现在屏幕上时,按确认键就输入完该汉字的输入,如果不按确认键,继续输入下一个汉字,就能输入由这两个字组成的词语,以此类推,按照这种方式可以整体输入三字词、四字词,甚至是短语和句子,这是本发明独特的词语输入方法。
5.2本发明在以下几个主要方面具有先进性:
(1)本发明实现了字词不重码,即字词重码率为0%(国家标准规定在数字键盘上逐个汉字输入重码率不超过8%,字词混合输入重码率不超过10%),输入时不需要选字或选词。这是目前世界上唯一的有规则汉字字词不重码技术。
(1)本发明独有的不重码技术,使汉字输入不需设置选择栏,输入的字、词直接出现在文本处,不再另外占用屏幕空间,非常适合配备于只有数字键盘的小型信息设备和通讯设备。
(3)本发明使数字键盘上汉字输入的速度达到了字母键盘上汉字的输入速度。使用本发明逐个输入汉字时,平均输入一个汉字需击键3.5次(国家标准为6键/字);字词混合输入时,平均输入一个汉字需击键2.3次(国家标准为4键/字,五笔字型是2.5键/字)。
5.3本发明在以下几个主要方面具有实用性:
(1)本发明只用九个数字键输入汉字,数字键盘上的“0”、“#”、“*”三键用作确认键(空格键)、删除键和回车键,不再另设功能键。
(2)本发明对常用汉字的典型笔顺错误具有容错能力,常用汉字的输入,即使输入的笔形顺序不符合汉字笔顺规范,只要属于典型错误的,照样能够打出。
(3)本发明对汉字和词语容量没有限制,可达十万级水平,输入速度随词库容量的增大而提高。
6实施方式
6.1根据本发明制作的汉字数码输入软件,可装入各类电脑,适用于WINDOWS各种版本。
6.2根据本发明制作的汉字数码输入软件,可嵌入各类电话机、传呼机、机顶盒、遥控器、记事本、收银机、游戏机、掌上机、上网机、字典机等。
6.3根据本发明制作的汉字数码字典软件,可嵌入各类电子字典。
附表 笔形代码表