书签 分享 收藏 举报 版权申诉 / 13

无理序号数字综合编码法及其键盘.pdf

  • 上传人:a****
  • 文档编号:4555886
  • 上传时间:2018-10-20
  • 格式:PDF
  • 页数:13
  • 大小:481.63KB
  • 摘要
    申请专利号:

    CN91111316.9

    申请日:

    1991.11.30

    公开号:

    CN1072785A

    公开日:

    1993.06.02

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情:

    ||||||公开

    IPC分类号:

    G06F3/023

    主分类号:

    G06F3/023

    申请人:

    肖水清;

    发明人:

    肖水清

    地址:

    541004广西壮族自治区桂林市七星路3巷9号

    优先权:

    专利代理机构:

    桂林市专利事务所

    代理人:

    黄流

    PDF完整版下载: PDF下载
    内容摘要

    一种电子计算机汉字输入方法和键盘设计,利用标准键盘可输入国标基本字符集和扩充字符集,共2万多个汉字和30万条词组。按照越常用的字,击键次数越少,击键越容易的原则对字、词编码。字、词平均码长1.5键,把汉字音、形信息转化为数字,利用10个数字编码,输入或读入、写入1—5个数字,就可输入一个字、词组。字词均无重码。充分利用国民知识汉语拼音和部首、笔画,易学易用。占用计算机内存小,在无硬盘,只有512K内存的低档计算机上也能运行本方法。

    权利要求书

    1: 一种汉字编码方法,本发明的特征是,根据数字0-9的读音,把汉语拼音的声母分成10类,编码0-9,韵母分成10类,编码0-9,根据部首的笔画数和使用频率,把部首分成10类,编码0-9,根据笔画的读音和字型结构,把笔画和字型分成10类,编码0-9。
    2: 根据权利要求1所述,其特征是,按照越常用的字、词,击键次数越少、击键越容易,用0-9十个数字对汉字、词组和图形符号编码。
    3: 根据权利要求2所述,其特征是,用10个数字键,实现中文输入,击入字、词组、图形符号的数字编码,就可输入中文。
    4: 根据权利要求2所述,其特征是,用10个数字键和3个字、词识别键,实现中文输入,击入字、词组、图形符号的数字编码,再击一键字、词识别键,就可输入中文。
    5: 根据权利要求2所述,其特征是,用声控方法输入中文,读入字、词组、图形符号的数字编码,就可输入中文。
    6: 根据权利要求2所述,其特征是,用手写方式输入中文,写出字、词组、图形符号的数字编码,就可输入中文。
    7: 根据权利要求2所述,其特征是,用手指接触方法输入中文,一双电子手套,10个手指代表10个数字,一个手指按任何一物体,即可输入一个数字,用手指按物体输入字、词组、图形符号的数字编码,就可输入中文。
    8: 根据权利要求2所述,其特征是,用字、词组、图形符号的数字编码、实现中文信息的有线、无线电通信。
    9: 根据权利要求2所述,其特征是,用字、词组、图形符号的数字编码、作为计算机的内码、交换码,使内码和外码统一起来,降低计算机的成本。
    10: 根据权利要求2所述,其特征是,用字、词组、图形符号的数字编码,实现字典、词典、图书资料、人名、地名、物品的编码排序。
    11: 根据权利要求1所述,其特征是,将标准英文键盘的30个键按键盘中部数字小、边部数字大,组成3套0-9数字键。
    12: 根据权利要求11所述,其特征是按照越常用的字、词,击键次数越少、击键越容易,用30个数字对汉字、词组、图形符号编码。
    13: 根据权利要求12所述,其特征是,在普通计算机键盘上用30个数字键加一个空格键实现中文输入,击入字、词组、图形符号的数字编码,就可输入中文。

    说明书


    本发明涉及到一种电子计算机汉字输入方法及其键盘。

        电子计算机汉字输入方法,一直是在中国普及计算机的“瓶颈”问题。国内外许多专家进行了大量的研究,提出了500多种汉字输入方法。这些输入方法可分为六大类:

        一、音码:即根据汉字的读音来编码。如汉语拼音码、山东省唐樊宽的《中文声数码》。音码的优点是容易学、直观。缺点是码长长,重码率高,不会读的字无法输入。

        二、形码:即根据汉字的字形来编码。如河南省王永民的《五笔字型》、陈国斌的《层次四角》、江西省万仁芳的《前三末一》。优点是重码率低,码长短,不会念的字也能输入。缺点是有一套拆分汉字进行编码的规则,要记忆字根在键盘上的分布位置,难学。

        三、音形码:即同时根据汉字的读音和字型来编码。如四川省陈代于的《大众码》、北京市郭淑珍的《声韵声声》、扶良文的《智能码》、周志农的《自然码》。根据汉字“同音不同形、形似不同音”的规律,音形码的重码率大为降低。但是仍然存在难学、不会念或念不准的字难输入的问题。

        四、数码:用数字进行编码,如区位码、电报码。数字编码的优点是只用10数字编码,容易操作、无重码。缺点是用一般的学习方法极难记忆。

        五、声控输入:即读出汉字的音,就可输入汉字。如北京四达技术中心开发的声控卡。优点是不用对汉字编码,缺点是错误率高,对同音字无法区分。

        六、手写输入:即写出汉字的形,就可输入汉字。如哈尔滨工业大学开发的手写识别系统。优点是不用键盘,适合文秘人员用笔地习惯。缺点是输入速度慢,每字平均10画,远远大于每个汉字击键的次数,错误率高,形相近的字难识别。

        本发明的目的,在于向公众提供一种把汉字音和形的信息转化为数字,用数字对汉字进行编码的无理序号数字综合编码法。

        本发明具体结构和细节,从附图说明和实施例中给出。

        本发明的实施方案是:键盘设计、中文信息数字化、汉字编码、词组编码、中文输入方法等具体内容。

        一、键盘设计:

        本发明将标准英文键盘的英文字母、符号30个键设计成0.-9.、◎-⑨、(0)-(9)等30个带符号的数字键。从键盘中部Y、H、N分开、右边是双数,左边是单数,键盘中部数值小,边部数值大。见附图1。

        二、中文信息数字化:

        本发明将汉语拼音的声母、韵母、汉字的字型笔画、部首各分成10类,编码0-9,分别叫声母码、韵母码、字型笔画码、部首码。见附图2

        (一)、声母码:汉语拼音包括23个声母,见附图3

        数字0、1、2、3、4、5、6、7、8、9有多种读音,如:

        1、按普通话正常读音,如0零、1一、2二……

        2、电讯读音,如0洞、1妖、7拐……

        3、音符读音,如4发、6拉……

        在以上读音的基础上,我们把声母作如下归类:(见附图2)

        0-因为电讯读音“洞”的声母为d,t是与d成对的声母,所以把d、t归到0。

        1-因为读音“一”的声母为y,r的读音与y相近,所以把y、r归到1。

        2-因为读音“二”无声母,以韵母e开头,能位于读音首字母的韵母还有a、o,所以把e、a、o开头的汉字称为无声母汉字,其声母码规定为2。

        3-因为读音“三”的声母为s,sh、x的读音与s相近,所以把s、sh、x归到3。

        4-因为音符“发”的声母为f,h的读音与f相近,所以把f、h归到4。

        5-因为读音“五”的声母为w,所以把w归到5。

        6-因为读音“六”的声母为l,n、m的读音与l相近,所以把l、n、m归到6。

        7-因为读音“七”的声母为q,电讯读音“拐”的声母为g,k是与g成对的声母,所以把q、g、k归到7。

        8-因为读音“八”的声母为b,p是与b成对的声母,所以把b、p归到8。

        9-因为读音“九”的声母为j,所以把j归到9。

        还剩z、zh、c、ch没有归类,考虑到把汉字均匀地归到0-9,本发明把z、zh归到2,c、ch归到5。

        如果声母归类与数字读音相抵触,则以数字读音为准,即零的声母为l,四的声母为s,但根据零、四的读音,零归到0,四归到4。

        (二)、韵母码:汉语拼音有37个韵母,包括6个单韵母,15个复韵母,16个鼻韵母。首先根据韵母首字母a、o、e、i、u(包括ü),把韵母分成5大类,每一类又分成单韵母、复韵母、鼻韵母。共分成15类,见附图4。其中e、er、ei、en、eng、a、ai、ao、o、ou、ong的使用频率很小,把使用频率小的韵母合为一类,计有e、er、ei、en、eng合为一类,o、ou、ong合为一类,a、ai、ao合为一类。这样共分成10类,按照数字0-9的韵母读音,用0-9进行编码,见附图2。具体是:

        0-因读音“零”的韵母为ing,所以以i开头的鼻韵母归到0。

        1-因读音“一”的韵母为i,所以单韵母i归到1。

        2-因读音“二”的韵母为er,所以以e开头的韵母归到2。

        3-因读音“三”的韵母为an,所以以a开头的鼻韵母到3。

        4-因音符读音“发”的韵母为a,所以以a开头的单韵母、复韵母归到4。

        5-因读音“五”的韵母为u,所以单韵母u归到5。

        6-因读音“六”的韵母为iou,所以以i开头的复韵母归到6。

        7-因电讯读音“拐”的韵母为uai,所以以u开头的复韵母归到7。

        以o开头的韵母和u开头的鼻韵母没有对应的数字读音,数字8、9尚未编码,故规定以o开头的韵母归到8,以u开头的鼻韵母归到9。

        (三)、字型笔画码:根据笔画的读音声母码和汉字字型结构,把字型和笔画分成10类,编码0-9,具体编码是:汉字的字型可分为左右型、其它型。汉字的笔画可分成6个单笔,横、竖、撇、捺、点、折,2个复笔,口、直交。字型分成两类:0-左右型、1-其它型,笔画分成8类,取笔画读音的声母码(点例外),即2-折(包括钩、折弯钩)、3-竖、4-横、5-点(包括提)、6-捺、7-口、8-撇、9-直交。见附图2。

        (四)、部首码:采用新华字典规定的部首和取部首原则,根据部首的笔画数和部首的使用频率,把部首分成10类,编码0-9。具体编码是:取部首的笔画数为部首码,7画以上的部首归到7。分不清部首的字归入单笔部首,取1,例:-1、冫-2、广-3、王-4、目-5、耳-6、赤-7。数字0、8、9尚未编码,一些部首的使用频率很大,构字能力很强,为了离散重码,选出33个构字能力很强的部首分配到0、8、9。例氵-0、扌-8、土-9。见附图2,

        三、汉字的编码

        按照无理序号越小、即越常用的字击键次数越少,击键越容易的原则,对汉字编码。分为音形码和形码两类:

        (一)音形码:

        1.常用字三位:声母码+韵母码+字型码,例:是-411(shi其它型)、们-620(men左右型)。

        2.次常用字四位:声母码+韵母码+首笔笔画码+字型码。例:理-6140(li-左右型)、齐-7151(qi、其它型)。

        3.稀用字五位:声母码+韵母码+首笔笔画码+尾笔笔画码+字型码。例:揖-11440(yi-左右型)、字-15521(yu、乙其它型)。

        4.罕用字五位:声母码+韵母码+首笔笔画码+尾笔笔画码+部首码。例:徘-84843(pai丿-彳)、疸-03548(dan、-疒)。

        (二)、形码:

        1.常用字三位:首笔笔画码+尾笔笔画码+字型码。例:时-350(丨、左右型)、会-851(丿、其它型)。

        2.次常用字四位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+字型码。例:宫-5771(丶口口其它型)、控-4450(-、左右型)。

        3.稀用字五位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+余部第二笔笔画码+字型码。例:屠-24941(乙-十-其它型)、沼-57280(丶口乙丿左右型)。

        4.罕用字五位:首笔笔画码+尾笔笔画码+余部第一笔笔画码+余部第二笔笔画码+部首码。例:檐-97820(十口丿乙木)、奢-44948(-十-大)。

        当部首位于起笔时,余部第一笔、第二笔指除部首外的第一笔、第二笔,当部首不在起笔时,余部第一笔、第二笔指整个字的第二笔、第三笔。

        四、词组编码:分二字词、三字以上词。

        (一)、二字词:

        1.音形码:首字声母码+首字韵母码+首字首笔笔画码+二字首笔笔画码+二字声母码。例:提高-01457(ti-、g)、他们-04886(ta丿丿m)。

        2.形码:首字首笔笔画码+首字尾笔笔画码+二字首笔笔画码+二字尾笔笔画码+二字部首码。例:方法-52550(、乙、、氵)、已经-22240(乙乙乙-纟)。

        (二)三字以上词:

        1.音形码:首字声母码+二字声母码+二字首笔笔画码+未字首笔笔画码+未字声母码。例:北京市-89554(bj、、s)、为什么-53886(ws丿丿m)。

        2.形码:首字首笔笔画码+二字首笔笔画码+未字首笔笔画码+未字尾笔笔画码+未字部首码。例:桂林市-44532(-、丨亠)、邮政编码-34445(丨-石)。

        按词的使用频率从大到小排列,二字词、三字以上词依次取前一位、二位、三位、四位简码。

        五、图形符号编码:图形符号码长五位。编码方法是:根据图形符号的读音、意义,挑选两个关键字作为图形符号的名称,根据图形符号的名称对图形符号编码。在音形码状态下为:首字声母码+首字韵母码+首字首笔笔画码+二字首笔笔画码+二字声母码。如:▲-41543(实三si、-s)、≠-85480(不等bu一丿d)。

        在形码状态下为:首字首笔笔画码+首字尾笔笔画码+二字首笔笔画码+二字尾笔笔画码+二字部首码。例:△-54441(空三、-),%-44888(百分-丿丿八)。

        六、中文输入法:由于本发明把中文信息转化为了0-9十个数字,输入3-5数字,就可以输入一个字或词组、图形符号。计算机识别10个数字远比识别几千个汉字容易得多,也比识别26个英文字母容易,因此本发明可广泛应用于计算机键盘输入、声控输入、手写输入,还可以用于中文信息有线、无线电数字通信,字典、词典的编码排序等。

        1.计算机键盘输入:计算机标准英文键盘可分为左边英文键盘和右边数字键盘。本发明提出的3-5位字编码,5位词编码和图形符号编码,1-4位词简码用于右边10个数字键输入。输入2-4位数字后,以0结束左右型汉字上屏,以1结束其它型汉字上屏,输入1-4位数字后,以回车结束,左右型汉字打头的二字词上屏,以“·”结束,其它型汉字打头的二字词上屏,以“+”号结束,三字以上词上屏,输入5位数字,字、词、图形符号上屏。

        3-5位字编码,5位词编码和图形符号编码,1-4位词简码用于左边30个键输入,基本键位为中排键,输入中排2-4位数字后,以0结束左右型字上屏,以1结束其它型字上屏,击满5键字、图形符号上屏。输入中排1-4位数字,以上排键结束,左右型汉字打头的二字词上屏,以下排键结束,其它型汉字打头的二字词上屏,以空格结束三字以上词上屏。

        左右两边共用一套字、词库,可采用左中文右数字,左英文右中文,左中文右中文的输入方式,输入纯中文和中英文混合输入。

        2.计算机小键盘输入:对于只有10个数字键,没有英文键的计算机,可用3-5位字编码,5位词及图形编码输入中文。

        3.声控输入:可用3-5位字编码,5位词及图形符号编码输入中文,只要读出0-9中3-5位数字的读音,就可输入一个汉字或词组、图形符号。

        4.手写输入:使用3-5位字编码,5位词及图形符号编码输入中文,只要写出0-9中3-5个数字,就可输入一个汉字或词组、图形符号。

        5.手指接触输入:一双电子手套,10个手指代表10个数字,一个手指按任何一物体,就可输入一个数字,用手指按物体输入字、词组、图形符号的数字编码,就可输入中文。

        6.有线、无线电通信:应用3-5位字编码,5位词及图形符号编码,实现有线、无线电中文传送,可取代中国现行的4位数字电报码。

        7.应用3-5位数字编码,5位词及图形符号编码,作为计算机的内码和交换码,使内码和外码统一起来,可降低计算机的成本。

        8.应用3-5位字编码,5位词及图形符号编码对字典、词典、图书资料、人名、地名、物品进行编码排序。

        附图说明:

        图1:3×10键盘图

        图2:中文信息数字转化表

        图3:汉语拼音声母表

        图4:汉语拼音韵母分类表

        本发明的优点:

        1.英文键盘数字化,把30个英文、字符键盘设计成3套0-9数字键盘;

        2.中文信息数字化,把中文音、形信息转化为0-9数字;

        3.在使用31个键位,一万条常用词的条件下,平均码长每字1.5键。在使用13个键位,一万条常用词的条件下,平均码长每字2.2键,字、词均无重码,中文输入速度快;

        4.充分利用国民知识汉语拼音和部首、笔画,易学、易用;

        5.能快速输入图形符号,方便地制作表格;

        6.可用音形码、形码输入中文,适应不同用户的需要;

        7.在同一输入状态下,实现中英文、数字混合输入;

        8.占用计算机内存少,在无硬盘,只有512K内存的普及型微机中都能运行本方法。

    关 键  词:
    无理 序号 数字 综合 编码 及其 键盘
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:无理序号数字综合编码法及其键盘.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4555886.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1