涉及分词的汉字输入方法及装置.pdf
![涉及分词的汉字输入方法及装置.pdf_第1页](https://img.zhuanlichaxun.net/fileroot5/2021-8/5/38305f76-50a3-46ae-8571-9f163c251236/38305f76-50a3-46ae-8571-9f163c2512361.gif)
![涉及分词的汉字输入方法及装置.pdf_第2页](https://img.zhuanlichaxun.net/fileroot5/2021-8/5/38305f76-50a3-46ae-8571-9f163c251236/38305f76-50a3-46ae-8571-9f163c2512362.gif)
![涉及分词的汉字输入方法及装置.pdf_第3页](https://img.zhuanlichaxun.net/fileroot5/2021-8/5/38305f76-50a3-46ae-8571-9f163c251236/38305f76-50a3-46ae-8571-9f163c2512363.gif)
《涉及分词的汉字输入方法及装置.pdf》由会员分享,可在线阅读,更多相关《涉及分词的汉字输入方法及装置.pdf(16页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910915268.0 (22)申请日 2019.09.26 (66)本国优先权数据 201811126466.0 2018.09.26 CN (71)申请人 王道平 地址 432234 湖北省武汉市黄陂区六指乡 许桥村王家湾77号 (72)发明人 不公告发明人 (51)Int.Cl. G06F 3/023(2006.01) G06F 40/289(2020.01) G06F 40/237(2020.01) (54)发明名称 一种涉及分词的汉字输入方法及装置 (57)摘要 。
2、本发明实施例提供了一种涉及分词的汉字 输入方法, 先根据大词库将用户输入的语音或拼 音流转换为语段, 再根据小词库对语段进行分 词, 然后根据小词库和字词编码规则对字词进行 处理, 这样既可以充分发挥大词库的优势, 使得 根据词频和算法以及相关特征转换出来的语段 尽量是用户所希望看到的, 又能充分发挥小词库 的优势, 使语段分成若干个更小字词, 便于用户 根据有相对固定的、 有相应方法的小词库来对切 分后的字词进行处理, 从而达到提高文字处理速 度和效率的目的。 权利要求书2页 说明书12页 附图1页 CN 110955338 A 2020.04.03 CN 110955338 A 1.一种涉。
3、及分词的汉字输入方法, 其特征在于, 所述方法包括至少一个大词库和至少一个小词库, 以及至少一个字词处理规则: 根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 根据所述字词处理规则, 对所述字词进行处理; 所述大词库是包含众多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字。
4、词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 2.一种涉及分词的汉字输入装置, 其特征在于, 所述装置包括: 存储单元, 用于存储至少一个大词库和至少一个小词库, 以及至少一个字词处理规则: 转换单元, 用于根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 分词单元, 用于根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 字词处理单元, 用于根据所述字词处理规则, 对所述字词进行处理; 所述大词库是包含众多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 包含以下至少。
5、一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 3.一种涉及分词的汉字输入装置, 其特征在于, 所述装置包括: 一个或多个存储器, 用于存储程序代码, 并存储至少一个大词库和至少一个小词库, 以 及至少一个字词处理规则: 一个或多个处理器, 用于调用所述程序代码、 所述至少一个大词库和至少一个小词库, 以及至少一个字词处。
6、理规则来执行如下操作: 根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 根据所述字词处理规则, 对所述字词进行处理; 所述大词库是包含众多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 为至少下列之一: (1)所述字词被选中, 并被删除; 权利要求书 1/2 页 2 CN 110955338 A 2 (2)所述字词被选中, 所述字词对应的拼音被增加字符, 。
7、从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 4.如权利要求1所述方法, 或权利要求2或3所述的装置, 其特征在于, 所述字词处理规 则, 具体为至少下列之一: (1)所述字词被选中, 并被删除, 所述 “被选中” 和 “被删除” 为对应于用户的一次操作完 成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 所述 “被增加字符” 和 “被其他同音字词替换” 为对应于用户的一次操作完成的功 能, 或所述 “被选中” 、“被增加字符” 和 “被其他同音字词替换” 为对应于用户的一次操作完 成的功能。
8、; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 所述 “被选中” 和 “弹出重码候 选项” 为对应于用户的一次操作完成的功能。 5.如权利要求1所述方法, 或权利要求2或3所述的装置, 其特征在于, 所述字词处理规 则, 具体为至少下列之一: (1)所述字词被选中, 并被删除, 然后光标返回到处理之前的位置, 所述 “被选中” 、“被 删除” 和 “光标返回” 为对应于用户的一次操作完成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 然后光标返回到处理之前的位置, 所述 “被增加字符” 、“被其他同音字词替换” 和 “光标返回。
9、” 为对应于用户的一次操作完成的功能, 或所述 “被选中” 、“被增加字符” 、“被其 他同音字词替换” 和 “光标返回” 为对应于用户的一次操作完成的功能; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 在用户选择后光标返回到处理 之前的位置, 所述 “选择” 和 “光标返回” 为对应于用户的一次操作完成的功能。 6.如权利要求1、 4或5所述的方法, 其特征在于, 还包括, 对所述若干字词中的部分或全部字词依次标序, 所述部分或全部字词中的每一个字词 分别对应一个不同的序标, 以便用户通过输入一个序标来选中与该序标对应的字词。 7.如权利要求1、 4或5的所述的方法, 其特征在于。
10、, 所述方法用于并击输入中, 适用于支持并击输入的并击式键盘装置中。 8.如权利要求2、 4或5任一所述的装置, 其特征在于, 所述装置还包括: 标序单元, 用于对所述若干字词中的部分或全部字词依次标序, 所述部分或全部字词 中的每一个字词分别对应一个不同的序标, 以便用户通过输入一个序标来选中与该序标对 应的字词。 9.如权利要求3、 4或5任一所述的装置, 其特征在于, 所述一个或多个处理器还用于执 行如下操作: 对所述若干字词中的部分或全部字词依次标序, 所述部分或全部字词中的每一个字词 分别对应一个不同的序标, 以便用户通过输入一个序标来选中与该序标对应的字词。 10.如权利要求25、。
11、 89任一所述的装置, 其特征在于, 所述装置为支持并击输入的并击式键盘装置。 权利要求书 2/2 页 3 CN 110955338 A 3 一种涉及分词的汉字输入方法及装置 技术领域 0001 本发明涉及语言文字信息处理领域, 特别适用于汉字输入领域。 背景技术 0002 目前的主流输入法都基于大词库, 即少则几十万词条, 多则百万、 千万, 甚至更多 词条的词库。 所谓词库, 拿个包含一千万词条的词库来说, 其中是词汇(词汇是一种语言里 所有的或特定范围的词和固定短语的总和, 例如汉语词汇、 英语词汇或一般词汇、 基本词 汇、 文言词汇、 方言词汇等) 的词条可能只占整个词库的13, 占比。
12、更多的是短语或短 句的词条。 所以这类输入法的特点主要是输入的基本单位可以从字、 词汇跨越到短语甚至 是短句。 在这个基础上, 借助统计学原理, 根据统计模型、 语言模型、 语义模型来计算, 使得 输入很长的拼音串(也可称之为拼音流), 也可以一次转换成对应的汉字, 而且错误较少, 大 大提高了中文使用者的工作效率。 0003 但是, 这种计算结果并不能百分百让人满意。 在主要以拼音来输入汉字的过程中, 往往会因同音而产生同音字词问题, 就算常用字词的输入, 通常也需要用户瞪大了眼睛, 在 几个同音字词中间手动选择。 如不及时排除错误, 那么常常是打完一个意群(意群是一个稍 长的句子分成的具有。
13、一定意义的若干个短语)或一句话才发现前面出现了并非想要的同音 字词, 或是多了不需要的字词, 或是少了必要的字词, 或是打错成了别的字词。 这时, 一般的 方法是按左右箭头键移动光标回头来修改。 这样处理方式既不便捷, 效率也低。 发明内容 0004 本发明提供一种涉及分词的汉字输入方法及装置, 以提高文字输入速度和效率。 0005 本发明实施例提供了一种涉及分词的汉字输入方法, 其特征可以是: 所述方法包括至少一个大词库和至少一个小词库, 以及至少一个字词处理规则: 根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 根据字。
14、词处理规则, 对所述字词进行处理; 所述大词库是包含众多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 可以包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 可以为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 0006 还可以包括, 对所述若干字词中的部分或全部字词依次标序, 所述部分或全部字 词中的每一个字词分别对应一个。
15、不同的序标, 以便用户通过输入一个序标来选中与该序标 说明书 1/12 页 4 CN 110955338 A 4 对应的字词。 0007 所述方法可以用于并击输入中, 适用于支持并击输入的并击式键盘装置中。 0008 本发明的实施例还提供了一种涉及分词的汉字输入装置, 所述装置可以包括: 存储单元, 用于存储至少一个大词库和至少一个小词库, 以及至少一个字词处理规则: 转换单元, 用于根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 分词单元, 用于根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 字词处理单元, 用于根据所述字词处理规则, 对所述字词进行处理; 所述大词库。
16、是包含众多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 可以包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 可以为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 0009 所述装置还可以包括标序单元, 用于对所述若干字词中的部分或全部字词依次标 序, 所述部分或全部字词中的每一个字词分别对应一个不同的序标, 以便用户通过。
17、输入一 个序标来选中与该序标对应的字词。 0010 所述装置可以为支持并击输入的并击式键盘装置。 0011 本发明的实施例还提供了另一种涉及分词的汉字输入装置, 所述装置可以包括: 一个或多个存储器, 用于存储程序代码, 并存储至少一个大词库和至少一个小词库, 以 及至少一个字词处理规则: 一个或多个处理器, 用于调用所述程序代码、 所述至少一个大词库和至少一个小词库, 以及至少一个字词处理规则来执行如下操作: 根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 根据所述字词处理规则, 对所述字词进行处理; 所述大词库是包含众。
18、多词汇及短语的词库, 所述小词库以词汇为核心内容; 所述大词库, 和/或所述小词库, 可以包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 可以为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 0012 所述一个或多个处理器还可以用于执行如下操作: 对所述若干字词中的部分或全 部字词依次标序, 所述部分或全部字词中的每一个字词分别对应一个不同的序标, 以便用 。
19、户通过输入一个序标来选中与该序标对应的字词。 0013 所述装置可以为支持并击输入的并击式键盘装置。 说明书 2/12 页 5 CN 110955338 A 5 0014 上述方法或装置中所述字词处理规则, 可以具体为至少下列之一: (1)所述字词被选中, 并被删除, 所述 “被选中” 和 “被删除” 为对应于用户的一次操作完 成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 所述 “被增加字符” 和 “被其他同音字词替换” 为对应于用户的一次操作完成的功 能, 或所述 “被选中” 、“被增加字符” 和 “被其他同音字词替换” 为对应于用。
20、户的一次操作完 成的功能; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 所述 “被选中” 和 “弹出重码候 选项” 为对应于用户的一次操作完成的功能。 0015 上述方法或装置中所述字词处理规则, 还可以具体为至少下列之一: (1)所述字词被选中, 并被删除, 然后光标返回到处理之前的位置, 所述 “被选中” 、“被 删除” 和 “光标返回” 为对应于用户的一次操作完成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 然后光标返回到处理之前的位置, 所述 “被增加字符” 、“被其他同音字词替换” 和 “光标返回” 为对应于用户的。
21、一次操作完成的功能, 或所述 “被选中” 、“被增加字符” 、“被其 他同音字词替换” 和 “光标返回” 为对应于用户的一次操作完成的功能; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 在用户选择后光标返回到处理 之前的位置, 所述 “选择” 和 “光标返回” 为对应于用户的一次操作完成的功能。 0016 本发明所提供的实施例中, 像目前流行的智能输入法一样, 根据大词库将用户输 入的语音流或拼音流转换为汉字流(所谓 “流” , 就是一个接一个, 一串儿, 因此语音流可以 理解为一个接一个的语音或语音串儿, 拼音流可以理解为一个接一个的拼音或拼音串儿, 而汉字流可以理解为一个接一个。
22、的汉字或汉字串儿), 但又创造性地增加了小词库方法, 根 据小词库对汉字流进行分词, 这样既可以充分发挥大词库的优势, 使得根据词频和算法以 及相关特征转换出来的汉字流尽量是用户所希望看到的, 又能充分发挥小词库的优势, 将 汉字流切分成若干个更小的字词, 便于用户基于对小词库的了解, 根据字词处理规则对切 分后的某些不是用户所希望看到的字词进行更便捷的处理, 使之转变为用户希望看到的内 容, 从而达到提高文字处理速度和效率的目的。 附图说明 0017 图1为本发明提供的一种涉及分词的汉字输入装置的示意图; 0018 图2为本发明提供的又一种涉及分词的汉字输入装置的示意图。 具体实施方式 00。
23、19 下面结合本发明实施例, 对本发明的技术方案进行清楚、 完整地描述, 显然, 所描 述的实施例仅是本发明的一部分而非全部的实施例。 基于本发明中的实施例, 本领域普通 技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例, 都属于本发明保护的 范围。 0020 本发明实施例提供了一种涉及分词的汉字输入方法, 所述方法可以包括至少一个大词库和至少一个小词库, 以及至少一个字词处理规则: 说明书 3/12 页 6 CN 110955338 A 6 根据所述大词库, 将用户输入的语音流或拼音流转换为汉字流; 根据所述小词库, 对所述汉字流进行分词, 切分成若干字词; 根据所述字词处理规则,。
24、 对所述字词进行处理; 所述大词库是包含词汇及短语的词库, 所述小词库以词汇为核心内容, 所述小词库包 含的词条的数量一般来说小于所述大词库包含的词条的数量; 所述大词库, 和/或所述小词库, 可以包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征; 所述字词处理规则, 可以为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 0021 所述词汇, 一般指一种语言里所有的(或特定范围的)。
25、词和固定短语的总和, 在本 发明中所述词汇既可以是这个一般所指, 也可以只包含其中的基本词汇、 一般词汇, 或文言 词汇、 方言词汇, 或其中若干, 还可以包括人名、 地名、 特定称谓等, 还可以指某一个人或某 一作品所用的词和固定短语的总和; 也即是说, 所述词汇并不一定要穷尽所有属于词汇范 畴的对象, 对词汇具体对象的选择, 主要依据实际需要。 因此, 所述小词库以词汇为核心内 容, 也并非一定要穷尽某一词汇范围的所有具体的字、 词以及固定短语, 也并非绝对排除词 组, 它只是要强调, 这个词库其核心是词汇的具体对象, 主要由词汇构成, 但不排除实际需 要的部分词组等。 只要大词库能起到将。
26、用户输入的语音流或拼音流转换为汉字流的作用, 小词库能起到对所述汉字流进行分词, 切分成更小的若干字词的作用即可,大词库和小词 库各自包含的具体内容可以根据需要来确定, 本发明对此不作限制。 0022 所述大词库, 可以包含以下至少一种特征: (1)词频特征; (2)语音特征; (3)语义特 征; (4) 语用特征; (5)字形特征。 换句话说, 也就是词库中具体的词条具有以上至少一种特 征。 其用途可以主要是充分利用词条的这一个或多个特征, 根据统计模型、 语言模型、 语义 模型等中的一个或多个来计算, 使得输入很长的拼音串或语音流也可以采用词库中的词条 来转换成对应的汉字流, 以充分发挥大。
27、词库的优势。 所述小词库, 可以包含以下至少一种特 征: (1)词频特征; (2)语音特征; (3)语义特征; (4)语用特征; (5)字形特征。 其作用主要是对 利用大词库得到的汉字流进行分词, 将其切分成一个个的词(词汇中的词), 以便对这些词 进行处理, 以充分发挥小词库的优势。 0023 我们知道, 一种语言的语句单元可以是无限的, 但构成无限语句单元的词汇是有 限的。 一个较大的语句单元包含若干个词, 当这个语句单元只有其中一个词有误时, 如果我 们直接对这个语句单元进行修改, 势必比较困难, 特别是当这个语句单元还处在一个更大 的语句中时; 反之, 如果已经将这个语句单元作了处理,。
28、 使之变成了一个个单独的词, 便于 我们直接对其中有误的词进行处理, 那么修改起来就简单得多。 这是小词库的第一大用途。 第二大用途是, 正如前面陈述的那样, 小词库包含的词汇量是有限的, 这就便于采用简单的 处理规则来统一对它们进行处理。 比如在拼音的基础上, 加入字词的字形特征, 就可以比较 简便有效地区分同音字词 “国情” 和 “国庆” , 如用户可以通过输入 “guoqingwx” 来输入 “国 情” , 而通过输入 “guoqingwg” 来输入 “国庆” , 其中 “wx” 和 “wg” 可以分别对应这两个同音词 说明书 4/12 页 7 CN 110955338 A 7 中每个字。
29、的部首的读音首字母, 是每个字字形特征的体现。 当用guoqing输入出现的是 “国 庆” 而我们实际需要的是 “国情” 时, 就可以接着输入 “wx” 这个字形特征来将其转变为 “国 情” 。 0024 所述大词库和小词库之分, 并不一定非得分成两个视觉上看起来是独立存在的词 库(如这两个词库分别对应一个单独的文档)不可, 只要两者能被区分开, 比如表面的视觉 可区分开, 或内在的逻辑上可区分开, 或其他方式, 能分别发挥不同功能即可。 比如在一个 词库中, 存在一些词条具有甲特征, 而另一些词条具有甲、 乙两种特征, 在使用上, 如果使用 甲特征时要用到所有词条(这所有词条可以理解为对应一。
30、个大词库), 而使用乙特征时只使 用了上述 “另一些词条” (可以理解为对应一个小词库), 则这样的词库, 尽管只有一个文档 或者从视觉上看是被融为了一体的, 但因为逻辑上可区分使用, 也可以看作是大小两个词 库。 同理, 所述大词库和小词库之分, 也并不一定非得分成两个视觉上看起来是独立存在的 词库不可, 即使分成再多个也可以看作是一个大词库和一个小词库, 不影响人们对它们是 大词库和小词库的理解, 因两者会有不同作用。 本发明对词库的具体表现形式不作限制。 0025 比如, 一个大词库中, 可以包含有:“成”“很”“时”“很有成效”“我”“地”“的”“间” “有”“时间”“实践”“效”“事。
31、件”“成效”“我们的时间”“事情”“有成效”“很有” 这些词条。 如果用户输入的是womendeshijianhenyouchengxiao这样一个拼音流, 这个时候, 一种可能 的实现方式是, 根据大词库的词频和相关算法, 会选择其中的 “我们的时间” 和 “很有成效” 这两个词条, 生成 “我们的时间很有成效” 这样一个汉字流。 然而, 假如用户要打的是 “我们 的实践很有成效” , 此时 womendeshijianhenyouchengxiao拼音流已经输入完毕, 怎么办? 是把光标移到womendeshijian之后选择 “我们的实践” , 还是先删掉henyouchengxiao,。
32、 再选 择 “我们的实践” 后, 然后继续输入 henyouchengxiao? 这两种方法是目前主流输入法的常 用方法, 回改效率都很低下。 0026 一个小词库, 包含的可以主要是单字和词汇, 比如可以以国家颁布的 现代汉语常 用词表(草案) 中的词汇为基础, 补入部分文言词汇、 方言词汇、 专有名词等。 这样, 这个小 词库所包含的词条数量就是比较有限的, 它的作用就是能将成百上千万级的大词库中分量 最多的非固定短语转变成有限的词汇, 也就是变成一个个的字或词。 0027 这个时候, 可以根据小词库, 将 “我们的时间很有成效” 这样一个汉字流进行分词, 切分成若干字词, 如下: 002。
33、8 我们|的|时间|很|有|成效 (a1) 0029 这显然不同于如下形式: 0030 我们的时间|很有成效 (*) 0031 即使(*)这个形式, 也只是直接对大词库内组成这个语句的语句单元也就是词组 之间进行了隔离, 而要想将 “我们的时间” 变为 “我们的实践” , 更多的可能就是用户紧盯候 选项, 看看哪个同音词才是真正所需的, 同音字词较多的话还得来回翻页查找; 假如大词库 里恰巧没有 “我们的实践” 这个词组, 那么就得先把光标移到 “我们的” 之后, 确认 “我们的” 为所需, 然后再对shijian所对应的字词进行选择, 同音字词较多的话还得来回翻页查找, 从中选择 “实践” 。
34、一词。 上述修改处理方式无疑是极为繁琐的。 要想较快地, 甚至是像本发明 提出的一些处理方法这样一步到位地将 “时间” 转变为同音词 “实践” , 那种仅对语句单元进 行隔离的处理方法显然是无法满足需求的。 说明书 5/12 页 8 CN 110955338 A 8 0032 本发明在根据大词库将用户输入的语音流或拼音流转换为汉字流的基础上, 创造 性地增加了小词库, 并结合小词库的特点制定了字词处理规则, 从而依据小词库对所述汉 字流进行分词, 即切分成若干字词, 进而能依据字词处理规则更为便捷地解决上述问题。 本 发明还可以对所述若干字词依次标序。 0033 基于(a1), 可以对上述切分。
35、出的若干字词中的部分字词(如可以只对其中有同码 的字词才进行标序)或全部字词依次标序, 下面以对切分出的若干字词中的全部字词用包 含数字的序标标在字词右下角为示例: 0034 我们1|的2|时间3|很4|有5|成效6 (a2) 0035 用户可以通过输入一个键来定位到一句话中的某一个字词, 这个键与该字词的序 标有关联关系。 当然, 标序的位置可以有多种, 如序标也可以标在字词正下方。 序标可以仅 包含数字, 也可以还包含其他非数字的字符, 如可以分别为F1、 F2、 F3Fn(n为整数)等, 其 中, Fn可以是对应于键盘上的Fn键, 当用户按下Fn键时, 可以定位到该Fn序标所对应的字 词。
36、。 序标也可以仅包含非数字的字符, 如可以分别为能表示先后顺序的a、 b、 c等。 序标可以 对用户可见, 也可以对用户不可见(如只通过分隔符号将各个字词区分开, 但各个字词在逻 辑上依次分别可以对应一个序标, 即对应有相对的先后位置关系, 用户只要输入某一字词 所对应的序标就可选中该字词), 可见的序标与实际用户按下的按键(或按下的按键所对应 的编码)也不需要完全一样(只要两者的先后顺序能一致, 能相互对应即可, 如可见的序标 为1、 2、 3, 而按下的按键分别可以为F1、 F2、 F3, 或者分别可以为a、 b、 c 等), 只要逻辑上对各 个切分出的字词, 用户能分别通过按下一些能表示。
37、先后顺序的按键来对其中某个字词进行 方便的定位即可。 0036 此时, 用户可根据字词处理规则, 对 “时间” 一词进行处理, 使之转换成 “实践” 。 0037 所述字词处理规则, 可以具体为至少下列之一: (1)所述字词被选中, 并被删除; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换; (3)所述字词被选中, 并弹出重码候选项以便用户选择。 0038 结合以上字词处理规则对切分后的 “时间” 一词所作的处理, 可以参照如下应用进 行理解: 0039 (1)在普通键盘上, 若F1-Fn(n为正整数)键被设置为能分别定位到标序为1-n的字 词处,。
38、 则用户可按F3键将光标定位到标序为3的 “时间” 后, 再按Delete键或backspace键将 “时间” 删除 (假设输入错了, 输入的是shijia “事假” 而不是shijian), 然后输入shijian, 选择输入法候选框中的 “实践” , 然后用户按end键将光标跳回到 “我们的时间很有成效” 的 句末以便继续输入; 在一种支持并击的输入键盘或速录机上, 用户可以以并击方式按下若 干键或键组合实现以下功能: 先用一个键或键组合(相当于普通键盘上按F3键)将光标定位 到 “时间” 后, 也就是shijian后, 再通过一个键或键组合(相当于普通键盘上按Delete键或 backs。
39、pace键)将 “时间” 删除(假设输入错了, 输入的是shijia “事假” 而不是shijian), 再并 击输入shijian, 然后用一个键或键组合(相当于普通键盘上的数字键)选择输入法候选框 中的 “实践” , 最后按一个键或键组合(相当于普通键盘上按end键)将光标跳回到 “我们的时 间很有成效” 的句末以便继续输入; 说明书 6/12 页 9 CN 110955338 A 9 0040 (2)在普通键盘上, 若F1-Fn(n为正整数)键被设置为能分别定位到标序为1-n的字 词处, 则用户可按F3键将光标定位到标序为3的 “时间” 后, 也就是shijian后, 然后依次输入 sh。
40、ijian对应的 “实践” 的两个部首 “宀”“足” 的首字母bz, 就可以将 “时间” 转换为 “实践” , 然 后用户按end 键将光标跳回到 “我们的时间很有成效” 的句末以便继续输入; 在一种支持并 击的输入键盘或速录机上, 用户可以以并击方式按下若干键或键组合实现以下功能: 先用 一个键或键组合(相当于普通键盘上按F3键)将光标插入到 “时间” 后, 也就是shijian后, 再 通过一个键或键组合输入shijian对应的 “实践” 的两个部首 “宀”“足” 的首字母bz, 就可以 将 “时间” 转换为 “实践” , 然后按一个键或键组合(相当于普通键盘上按end键)将光标跳回 到 。
41、“我们的时间很有成效” 的句末以便继续输入; 0041 (3)在普通键盘上, 若F1-Fn(n为正整数)键被设置为能分别定位到标序为1-n的字 词处, 则用户可按F3键将光标定位到标序为3的 “时间” 后, 也就是shijian后, 此时输入法会 弹出重码 “实践” , 选择 “实践” 即可, 然后用户按end键将光标跳回到 “我们的时间很有成效” 的句末以便继续输入; 在一种支持并击的输入键盘或速录机上, 用户可以以并击方式按下 若干键或键组合实现以下功能: 先用一个键或键组合(相当于普通键盘上按F3键)将光标插 入到 “时间” 后, 也就是shijian后, 此时输入法会弹出重码 “实践”。
42、 , 再用一个键或键组合(相 当于普通键盘上的数字键)选择 “实践” 即可, 然后按一个键或键组合(相当于普通键盘上按 end键)将光标跳回到 “我们的时间很有成效” 的句末以便继续输入。 0042 所述字词处理规则, 也可以具体为至少下列之一: (1)所述字词被选中, 并被删除, 所述 “被选中” 和 “被删除” 为对应于用户的一次操作完 成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 所述 “被增加字符” 和 “被其他同音字词替换” 为对应于用户的一次操作完成的功 能, 或所述 “被选中” 、“被增加字符” 和 “被其他同音字词替换。
43、” 为对应于用户的一次操作完 成的功能; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 所述 “被选中” 和 “弹出重码候 选项” 为对应于用户的一次操作完成的功能。 0043 结合以上字词处理规则对切分后的 “时间” 一词所作的处理, 可以参照如下应用进 行理解: 0044 (1)在一种支持并击的输入键盘或速录机上, 用户可以以并击方式一次按下一个 键组合来直接定位并删掉 “时间” , 也就是shijia(假设输入错了, 输入的是shijia “事假” 而 不是shijian), 这种情况下通过一次按下一个键组合就可以删除 “时间” , 达到一次操作实 现两个功能的效果, 第一个功。
44、能是选中(或光标定位到) “时间” , 第二个功能是删除 “时间” ; 再并击输入shijian, 然后用一个键或键组合(相当于普通键盘上的数字键)选择输入法候 选框中的 “实践” , 最后按一个键或键组合(相当于普通键盘上按end键)将光标跳回到 “我们 的时间很有成效” 的句末以便继续输入; 0045 (2)在一种支持并击的输入键盘或速录机上, 用户可以以并击方式一次按下一个 键组合, 来直接选中 “时间” (也就是选中shijian, 相当于普通键盘上按F3键), 同时通过该 键组合输入shijian 对应的 “实践” 的两个部首 “宀”“足” 的首字母bz(相当于是在普通键盘 上按F3。
45、键之后增加了两个字符), 来将 “时间” 转换为 “实践” , 也就是说, 此时一次按下一个 说明书 7/12 页 10 CN 110955338 A 10 键组合, 这一次操作实现三个功能, 第一个功能是选中 “时间” , 第二个功能是在shijian之 后增加了bz两个字符, 第三个功能是将 “时间” 转换为 “实践” ; 也可以是, 用户以并击方式一 次按下一个键组合, 来直接选中 “时间” (也就是选中shijian, 相当于普通键盘上按F3键), 再按一个键组合来输入shijian对应的 “实践” 的两个部首 “宀”“足” 的首字母bz(相当于是 在普通键盘上按F3键之后增加了两个字。
46、符), 将 “时间” 转换为 “实践” , 也就是说, 此时第二 次按下的一个键组合操作实现了两个功能, 第一个功能是在shijian之后增加了bz两个字 符, 第二个功能是将 “时间” 转换为 “实践” ; 然后按一个键或键组合(相当于普通键盘上按 end键)将光标跳回到 “我们的时间很有成效” 的句末以便继续输入。 0046 (3)在普通键盘上, 若F1-Fn(n为正整数)键被设置为能分别定位到标序为1-n的字 词处, 则用户可按F3键将光标定位到标序为3的 “时间” 后, 也就是shijian后, 此时输入法会 弹出重码 “实践” , 也即是, 此时按F3键实现了两个功能, 第一个功能是。
47、选中 “时间” , 第二个 功能是弹出重码 “实践” ; 再选择 “实践” 即可, 然后用户按end键将光标跳回到 “我们的时间 很有成效” 的句末以便继续输入; 在一种支持并击的输入键盘或速录机上, 用户可以以并击 方式按下若干键或键组合来实现以下功能: 先用一个键或键组合(相当于普通键盘上按F3 键)将光标插入到 “时间” 后, 也就是shijian 后, 此时输入法会弹出重码 “实践” , 也即是, 此 时一次按下的一个键组合操作实现了两个功能, 第一个功能是选中 “时间” , 第二个功能是 弹出重码 “实践” ; 再用一个键或键组合(相当于普通键盘上的数字键)选择 “实践” 即可, 然。
48、 后按一个键或键组合(相当于普通键盘上按end键)将光标跳回到 “我们的时间很有成效” 的 句末以便继续输入。 0047 所述字词处理规则, 还可以具体为至少下列之一: (1)所述字词被选中, 并被删除, 然后光标返回到处理之前的位置, 所述 “被选中” 、“被 删除” 和 “光标返回” 为对应于用户的一次操作完成的功能; (2)所述字词被选中, 所述字词对应的拼音被增加字符, 从而使所述字词被其他同音字 词替换, 然后光标返回到处理之前的位置, 所述 “被增加字符” 、“被其他同音字词替换” 和 “光标返回” 为对应于用户的一次操作完成的功能, 或所述 “被选中” 、“被增加字符” 、“被其。
49、 他同音字词替换” 和 “光标返回” 为对应于用户的一次操作完成的功能; (3)所述字词被选中, 并弹出重码候选项以便用户选择, 在用户选择后光标返回到处理 之前的位置, 所述 “选择” 和 “光标返回” 为对应于用户的一次操作完成的功能。 0048 结合以上字词处理规则对切分后的 “时间” 一词所作的处理, 可以参照如下应用进 行理解: 0049 (1)在一种支持并击的输入键盘或速录机上, 用户可以以并击方式一次按下一个 键组合, 来选中 “时间” (也就是选中shijian, 相当于普通键盘上按F3键), 并通过该键组合 删掉 “时间” (相当于普通键盘上按Delete键或backspac。
50、e键), 还通过该键组合使输入光标 返回到处理之前的位置(相当于普通键盘上按end键), 也就是说, 此时一次按下一个键组 合, 这一次操作实现三个功能, 第一个功能是选中 “时间” , 第二个功能是删掉 “时间” , 第三 个功能是使光标跳回到 “我们的时间很有成效” 的句末; 0050 (2)在一种支持并击的输入键盘或速录机上, 用户可以以并击方式一次按下一个 键组合, 来选中 “时间” (也就是选中shijian, 相当于普通键盘上按F3键), 并通过该键组合 输入shijian对应的 “实践” 的两个部首 “宀”“足” 的首字母bz(相当于是在普通键盘上按F3 说明书 8/12 页 1。
- 内容关键字: 涉及 分词 汉字输入 方法 装置
用于挤压片状弹簧的压簧装置.pdf
用于回收硫酸装置低温废热的热量回收塔.pdf
汽车零部件冲压定位机构.pdf
弹簧快速弹出的送料装置.pdf
输液杆的主供电箱排水结构.pdf
农业经济果树种植嫁接用防护装置.pdf
车用尿素溶液水解反应装置.pdf
可自由组合堆叠式户用储能电源.pdf
财务凭证卷绕器.pdf
建筑施工卸料平台.pdf
具有应急照明功能的户内多功能储能电源.pdf
多托板自动分离机构.pdf
发动机精密配件加工用稳定支架.pdf
便于清理的橡胶促进剂过滤装置.pdf
防偏移内衣点胶机.pdf
耐插拔动力信号混合式储能防水连接器.pdf
棋类设备的智能裁判器、对弈棋子及棋类设备.pdf
大杯可脱带两用式文胸.pdf
振动传感器及车载扬声器系统.pdf
无酒精的香水配方及其制备方法.pdf
石油勘探用三角异型管电池壳性能检测装置及其检测方法.pdf
耐高温陶瓷纤维毡.pdf
转向器摇臂轴花键相对齿形位置间隙测具.pdf
盐碱土壤改良用松土装置.pdf
铝粉生产线.pdf
用于臭氧催化剂生产的混料器.pdf
新能源锂电池材料高效研磨设备及其研磨方法.pdf
地质勘测样品粉碎机.pdf
管道支撑架.pdf
行星减速机的防松脱结构.pdf
带音响装置的操作模块.pdf
基于机器视觉的反射膜生产质控的方法及系统.pdf
一种饰颜片、由饰颜片和贮器构成的一套用具及一种方法.pdf
阴道乳杆菌药物.pdf
脂基免疫调节剂组合物.pdf
治疗腹泻疾病和从结肠中除去特定细菌种群的方法.pdf
具有非多孔毛细芯给功能的液态空气清凉剂散发装置.pdf
控梢促花剂.pdf
米粉团或米粉饼.pdf
水田除草剂.pdf
双-1,2,4-三唑在制备癌症治疗药物中的用途.pdf
一种旋光纯化合物的药用.pdf
稳定的含磨料的含水牙用过氧化物增白组合物.pdf
胶原凝胶.pdf
一种溶栓消栓药剂及其制备方法.pdf
松仁乳制品.pdf
中成药“胃肠安”.pdf
显示针对内分泌细胞反应性的配体包括抗体.pdf
一种风湿藏药药浴及其制备工艺.pdf
一种治疗性病的药物.pdf
一种中药复方制剂及其制备工艺.pdf
相关文档
更多![空气开关固定装置.pdf](/Images/s.gif)
![数据处理方法、装置及存储介质.pdf](/Images/s.gif)
![基于计算机虚拟界面的人机交互系统.pdf](/Images/s.gif)
![信息资源共享交换平台.pdf](/Images/s.gif)
![方便安装的气动蝶阀.pdf](/Images/s.gif)
![生物酶除臭降解智能无水厕所装置及方法.pdf](/Images/s.gif)
![商用车无人驾驶转角补偿系统及其控制方法.pdf](/Images/s.gif)
![基于组织外泌体磷酸化蛋白组的多组学分析方法.pdf](/Images/s.gif)
![变压器用防护装置.pdf](/Images/s.gif)
![场景识别方法及装置.pdf](/Images/s.gif)
![以二阶谱强度为参考的高频地波雷达一阶回波谱区域检测方法.pdf](/Images/s.gif)
![信息处理方法及电子设备.pdf](/Images/s.gif)
![小样机织轴及其使用方法.pdf](/Images/s.gif)
![水溶性荧光着色剂、包含其的墨水及墨水制备方法.pdf](/Images/s.gif)
![PEG包覆多孔稀土磷酸盐荧光纳米材料的制备方法.pdf](/Images/s.gif)
![电子商务平台.pdf](/Images/s.gif)
![基于DSP技术的电能质量智能控制器.pdf](/Images/s.gif)
![白泥回转石灰窑脱硝装置及方法.pdf](/Images/s.gif)
![区域化垃圾分类投放及分拣回收系统.pdf](/Images/s.gif)
![一机多级过滤孔板格栅及其使用方法.pdf](/Images/s.gif)