《输入法编辑器.pdf》由会员分享,可在线阅读,更多相关《输入法编辑器.pdf(25页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103026318 A (43)申请公布日 2013.04.03 CN 103026318 A *CN103026318A* (21)申请号 201080068141.7 (22)申请日 2010.05.21 G06F 3/023(2006.01) (71)申请人 谷歌公司 地址 美国加利福尼亚州 (72)发明人 曾健 区良裔 孙伟 肖湘晔 张荫芾 王咏刚 张元博 (74)专利代理机构 中原信达知识产权代理有限 责任公司 11219 代理人 周亚荣 安翔 (54) 发明名称 输入法编辑器 (57) 摘要 用于浏览和编辑对输入法编辑器的输入的方 法、 系统、 装置, 包。
2、括计算机程序产品。 在一个实施 方式中, 提供了方法。该方法包括 : 接收第一书写 系统中的字符输入序列 ; 在字符输入序列中识别 一个或多个第一连续字符子序列, 其中每一个子 序列表示在不同的第二书写系统中的音节 ; 在字 符输入序列中识别一个或多个第二子序列, 其中 每一个第二子序列包括一个或多个连续第一子序 列并且表示在不同的第二书写系统中的项目 ; 确 定为一个或多个第二子序列划界的一个或多个边 界 ; 以及生成一个或多个可选指示符以供在用户 界面中显示, 其中一个或多个可选指示符中的每 一个识别由一个或多个边界划界的相应第二子序 列。 (85)PCT申请进入国家阶段日 2013.01。
3、.18 (86)PCT申请的申请数据 PCT/CN2010/073052 2010.05.21 (87)PCT申请的公布数据 WO2011/143827 EN 2011.11.24 (51)Int.Cl. 权利要求书 3 页 说明书 11 页 附图 10 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 11 页 附图 10 页 1/3 页 2 1. 一种方法, 包括 : 接收第一书写系统中的字符输入序列 ; 在所述字符输入序列中识别一个或多个第一连续字符子序列, 其中每一个子序列表示 在不同的第二书写系统中的音节 ; 在所述字符输入序列中识别一个或多。
4、个第二子序列, 其中每一个第二子序列包括一个 或多个连续第一子序列并且表示在所述不同的第二书写系统中的项目 ; 确定为所述一个或多个第二子序列划界的一个或多个边界 ; 以及 生成一个或多个可选指示符以供在用户界面中显示, 其中所述一个或多个可选指示符 中的每一个识别由所述一个或多个边界划界的相应第二子序列。 2. 根据权利要求 1 所述的方法, 进一步包括 : 从整个所述字符输入序列确定在第三书写系统中的一个或多个第一输入候选, 其中所 述第三书写系统不同于所述第一书写系统和所述第二书写系统, 以及其中每一个第一输入 候选对应于一个或多个连续第二子序列的序列 ; 以及 将所述一个或多个第一输入。
5、候选显示为对所述字符输入序列的可选替选。 3. 根据权利要求 2 所述的方法, 进一步包括 : 检测触发器事件 ; 以及 响应于检测到所述触发器事件, 在所述用户界面中显示所述可选指示符, 其中每一个 可选指示符识别相应第二子序列。 4. 根据权利要求 3 所述的方法, 进一步包括 : 接收对第一可选指示符的用户选择 ; 以及 从第三字符子序列确定在所述第三书写系统中的一个或多个第二输入候选, 其中所述 第三子序列包括如下顺序的所有所述第二子序列 : 直至所述第一可选指示符所识别的特定 第二子序列为止的所有所述第二子序列在所述输入序列中出现的顺序。 5. 根据权利要求 4 所述的方法, 进一步。
6、包括 : 将所述一个或多个第二输入候选而不是所述第一输入候选显示为对所述第三字符子 序列的可选替选。 6. 根据权利要求 2 所述的方法, 进一步包括 : 接收将文本光标移动到特定第一子序列的用户输入, 其中所述文本光标识别当前的文 本输入位置 ; 以及 从第三字符子序列确定在所述第三书写系统中的一个或多个第二输入候选, 其中所述 第三子序列包括如下顺序的所有完整的所述第二子序列 : 直至所述特定第一子序列为止的 所述完整的第二子序列在所述输入序列中出现的顺序, 后跟如下顺序的所有所述第一子序 列 : 直至所述特定第一子序列为止并且包括所述特定第一子序列的所有所述第一子序列在 所述输入序列中出。
7、现的顺序。 7. 根据权利要求 6 所述的方法, 进一步包括 : 将所述一个或多个第二输入候选而不是所述第一输入候选显示为对所述第三字符子 序列的可选替选。 8. 根据权利要求 2 所述的方法, 其中所述第一书写系统是拉丁, 所述不同的第二书写 系统是拼音, 以及所述第三书写系统是汉字。 权 利 要 求 书 CN 103026318 A 2 2/3 页 3 9. 一种方法, 包括 : 将用户输入的多个字符分成一个或多个代符, 其中代符是一个或多个字符的组 ; 将所述代符聚组成一个或多个代符组 ; 根据操作粒度, 生成用于所述代符组的一个或多个边界 ; 以及 响应于接收指示触发器的激活的输入, 。
8、可视地指示用于所述代符组的所述边界。 10. 根据权利要求 9 所述的方法, 其中所述操作粒度从包括以下的粒度组中选择 : 字符级, 其中针对单个字符执行操作 ; 代符级, 其中针对代符执行操作, 以及其中代符表示音节 ; 以及 代符组级, 其中针对代符组执行操作, 以及其中代符组表示短语。 11. 根据权利要求 9 所述的方法, 进一步包括 : 通过按下一个或多个热键来使插入符向 左移动一个代符组或向右移动一个代符组, 其中所述插入符识别当前的文本输入位置。 12. 根据权利要求 9 所述的方法, 其中所述触发器由所述用户所按下的一个或多个热 键激活。 13. 根据权利要求 12 所述的方法。
9、, 其中当所述一个或多个热键被连续地按下时, 使用 数字来可视地指示用于所述代符组的所述一个或多个边界。 14. 根据权利要求 9 所述的方法, 其中用于所述代符组的所述一个或多个边界是使用 语言模型来生成的。 15. 根据权利要求 14 所述的方法, 其中每一个代符组对应于所述语言模型中的语言模 型格阵项, 其中所述语言模型格阵项是词汇项或短语。 16. 根据权利要求 9 所述的方法, 进一步包括 : 响应于接收选择用于一个代符组的边界 的输入, 选择该代符组。 17. 根据权利要求 16 所述的方法, 其中选择所述边界的所述输入是通过由控制键和与 用于所述边界的所述视觉指示符相对应的数字组。
10、成的热键来生成的。 18. 一种系统, 包括 : 包括程序产品的机器可读存储设备 ; 以及 可操作来执行所述程序产品并且执行操作的一个或多个处理器, 所述操作包括 : 接收第一书写系统中的字符输入序列 ; 在所述字符输入序列中识别一个或多个第一连续字符子序列, 其中每一个子序列表示 在不同的第二书写系统中的音节 ; 在所述字符输入序列中识别一个或多个第二子序列, 其中每一个第二子序列包括一个 或多个连续第一子序列并且表示在所述不同的第二书写系统中的项目 ; 确定为所述一个或多个第二子序列划界的一个或多个边界 ; 以及 生成一个或多个可选指示符以供在用户界面中显示, 其中所述一个或多个可选指示符。
11、 中的每一个识别由所述一个或多个边界划界的相应第二子序列。 19. 一种系统, 包括 : 包括程序产品的机器可读存储设备 ; 以及 可操作来执行所述程序产品并且执行操作的一个或多个处理器, 所述操作包括 : 将用户输入的多个字符分成一个或多个代符, 其中代符是一个或多个字符的组 ; 将所述代符聚组成一个或多个代符组 ; 权 利 要 求 书 CN 103026318 A 3 3/3 页 4 根据操作粒度, 生成用于所述代符组的一个或多个边界 ; 以及 响应于接收指示触发器的激活的输入, 可视地指示用于所述代符组的所述边界。 20. 一种编码在计算机可读介质上、 可操作来促使数据处理装置执行操作的。
12、计算机程 序产品, 所述操作包括 : 接收第一书写系统中的字符输入序列 ; 在所述字符输入序列中识别一个或多个第一连续字符子序列, 其中每一个子序列表示 在不同的第二书写系统中的音节 ; 在所述字符输入序列中识别一个或多个第二子序列, 其中每一个第二子序列包括一个 或多个连续第一子序列并且表示在所述不同的第二书写系统中的项目 ; 确定为所述一个或多个第二子序列划界的一个或多个边界 ; 以及 生成一个或多个可选指示符以供在用户界面中显示, 其中所述一个或多个可选指示符 中的每一个识别由所述一个或多个边界划界的相应第二子序列。 21. 一种编码在计算机可读介质上、 可操作来促使数据处理装置执行操作。
13、的计算机程 序产品, 所述操作包括 : 将用户输入的多个字符分成一个或多个代符, 其中代符是一个或多个字符的组 ; 将所述代符聚组成一个或多个代符组 ; 根据操作粒度, 生成用于所述代符组的一个或多个边界 ; 以及 响应于接收指示触发器的激活的输入, 可视地指示用于所述代符组的所述边界。 权 利 要 求 书 CN 103026318 A 4 1/11 页 5 输入法编辑器 技术领域 0001 本说明书涉及输入法。 背景技术 0002 书写系统使用符号 (例如, 字符或字形) 来表示语言的发音。在书写系统中符号集 合可以被称为文字。例如, 在一个或多个罗马文字中包括罗马字符集合的拉丁书写系统可 。
14、以用来表示英语。拉丁书写系统可以包括块状罗马字符 (例如, 大写字母字符 “B” ) 、 类型化 罗马字符 (例如, 纯字符 “b” ) 以及草书罗马字符 (例如, 草书字符 “b” ) 。在拉丁书写系统中, 字符 “b” 的每一个可视化表示表示相同字形。 0003 作为另一个示例, 中文可以由多于一个书写系统表示。 例如, 中文可以由例如拼音 (或罗马化的中文) 的第一书写系统表示。作为另一个示例, 中文可以使用例如汉语拼音或 注音符号 ( “注音” ) 的第二书写系统来表示。作为又一个示例, 中文可以使用例如汉字的第 三书写系统来表示。具体地, 拼音和注音是用于表示汉字字符的语音系统。 0。
15、004 使用其中例如字符的一个或多个符号大致对应于一个词或含义的语标书写系统 的语言, 具有比在标准输入设备, 诸如移动设备键区上的计算机键盘, 上的键更多的字符。 然而, 输入法编辑器帮助使用计算机键盘来输入这些书写系统中的字符。 例如, 输入法编辑 器可以采用拼音书写系统中的罗马字符输入, 并且将输入映射到中文的许多汉字字符。因 此, 为在第一书写系统中的输入设计的键盘可以用来输入第二书写系统中的文本, 例如用 于罗马文字的键盘 (例如, QWERTY 键盘) 可以用来输入中文、 日文或韩文字符。 发明内容 0005 总的来说, 在本说明书中描述的主题的一个方面可以在包括以下动作的方法中具。
16、 体化 : 接收第一书写系统中的字符输入序列 ; 在字符输入序列中识别一个或多个第一连续 字符子序列, 其中每一个子序列表示在不同的第二书写系统中的音节 ; 在字符输入序列中 识别一个或多个第二子序列, 其中每一个第二子序列包括一个或多个连续第一子序列并且 表示在不同的第二书写系统中的项目 (term) ; 确定为一个或多个第二子序列划界的一个或 多个边界 ; 以及生成一个或多个可选指示符以供在用户界面中显示, 其中一个或多个可选 指示符中的每一个识别由一个或多个边界划界的相应第二子序列。 本方面的其他实施例包 括对应的系统、 装置和计算机程序产品。 0006 这些和其他实施例可以可选地包括以。
17、下特征中的一个或多个。该方法进一步包 括 : 从整个字符输入序列确定在第三书写系统中的一个或多个第一输入候选, 其中第三书 写系统不同于第一书写系统和第二书写系统, 以及其中每一个第一输入候选对应于一个或 多个连续第二子序列的序列 ; 以及将一个或多个第一输入候选显示为对字符输入序列的可 选替选。 0007 该方法进一步包括 : 检测触发器事件 (trigger event) ; 以及响应于检测到触发器 事件, 在用户界面中显示可选指示符, 其中每一个可选指示符识别相应第二子序列。 该方法 说 明 书 CN 103026318 A 5 2/11 页 6 进一步包括 : 接收对第一可选指示符的用。
18、户选择 ; 以及从第三字符子序列确定在第三书写 系统中的一个或多个第二输入候选, 其中第三子序列包括如下顺序的所有第二子序列 : 直 至第一可选指示符所识别的特定第二子序列为止的所有第二子序列在输入序列中出现的 顺序。 该方法进一步包括将一个或多个第二输入候选而不是第一输入候选显示为对第三字 符子序列的可选替选。 0008 该方法进一步包括 : 接收将文本光标移动到特定第一子序列的用户输入, 其中文 本光标识别当前的文本输入位置 ; 以及从第三字符子序列确定第三书写系统中的一个或多 个第二输入候选, 其中第三子序列包括如下顺序的所有完整第二子序列 : 直至特定第一子 序列为止的所有完整第二子序。
19、列在输入序列中出现的顺序, 后跟如下顺序的所有第一子序 列 : 直至特定第一子序列为止并且包括该特定第一子序列的所有第一子序列在输入序列中 出现的顺序。 该方法进一步包括将一个或多个第二输入候选而不是第一输入候选显示为对 第三字符子序列的可选替选。 第一书写系统是拉丁, 不同的第二书写系统是拼音, 并且第三 书写系统是汉字。 0009 在本说明书中描述的主题的另一个方面可以在包括以下动作的方法中具体化 : 将 用户输入的多个字符分成一个或多个代符 (token) , 其中代符是一个或多个字符的组 ; 将 代符聚组成一个或多个代符组 ; 根据操作粒度, 生成用于代符组的一个或多个边界 ; 以及 。
20、响应于接收指示触发器的激活的输入, 可视地指示用于代符组的边界。本方面的其他实施 例包括对应的系统、 装置以及计算机程序产品。 0010 这些和其他实施例可以可选地包括以下特征中的一个或多个。操作粒度从包括 以下的粒度组中选择 : 字符级, 其中针对单个字符执行操作 ; 代符级, 其中针对代符执行操 作, 以及其中代符表示音节 ; 以及代符组级, 其中针对代符组执行操作, 以及其中代符组表 示短语。 0011 该方法进一步包括通过按下一个或多个热键来使插入符向左移动一个代符组或 向右移动一个代符组, 其中插入符识别当前的文本输入位置。触发器由用户所按下的一个 或多个热键激活。当一个或多个热键被。
21、连续地按下时, 使用数字来可视地指示用于代符组 的一个或多个边界。 0012 使用语言模型来生成用于代符组的一个或多个边界。 每一个代符组对应于语言模 型中的语言模型格阵 (lattice) 项, 其中语言模型格阵项是词汇项或短语。该方法进一步 包括响应于接收选择用于代符组的边界的输入而选择代符组。 选择边界的输入通过由控制 键和与用于边界的视觉指示符相对应的数字组成的热键生成。 0013 可以实现在本说明书中描述的主题的特定实施例, 以实现以下优势中的一个或多 个。在用户输入中自动识别可选文本序列, 例如表示项目的文本序列, 减少了修改用户输 入以及获取对输入的可选替选 (例如, 输入的音译。
22、) 所需的用户交互的程度。自动识别可选 文本序列在浏览通过以及编辑所输入的字符组时节省了用户时间, 因为可以减少导航输入 (例如, 移动文本光标的输入) 或编辑输入 (例如, 删除 / 添加字符的输入) 的数量。 0014 在附图和下面的描述中阐述了在本说明书中描述的主题的一个或多个实施例的 细节。本主题的其他特征、 方面和优势从描述、 附图和权利要求将变得显而易见。 附图说明 说 明 书 CN 103026318 A 6 3/11 页 7 0015 图 1A 是图示显示输入和对该输入的可选替选的示例输入法编辑器界面的截屏。 0016 图 1B 是图示显示带有打字错误的输入和对该输入的可选替选。
23、的示例输入法编辑 器界面的截屏。 0017 图 2 是图示图 1A 的示例输入法编辑器界面的截屏, 其中输入的不同部分被加标 签。 0018 图 3 是图示观察到的文本输入序列和由观察到的文本输入序列表示的潜在项目 序列的框图。 0019 图 4 是示出用于在输入法编辑器中提供浏览和编辑功能的示例过程的流程图。 0020 图 5 是图示显示输入的示例输入法编辑器界面的截屏, 其中输入的不同部分被加 标签。 0021 图 6-18 是图示用于浏览和编辑输入的示例输入法编辑器界面和交互的截屏。 0022 图 19 是示出用于在输入法编辑器中提供浏览和编辑功能的另一个示例过程的流 程图。 0023 。
24、图 20 是可以利用来实现在本文中描述的系统和方法的示例系统的框图。 0024 图 21 包括可以利用来实现图 20 中的输入法编辑器的示例软件的框图。 具体实施方式 0025 图 1A 是图示显示输入和对该输入的可选替选的示例输入法编辑器 (IME) 界面的 截屏。IME 界面可以包括用于提供第一书写系统 (例如, 拼音) 中的输入的第一界面元素 (例 如, 组合框) , 以及用于显示在不同的第二书写系统中的可选替选 (例如, 汉字 - 中文的候选 音译) 的第二界面元素 (例如, 候选窗口) 。在图 1A 中, 输入是 “pin yin shu ru fa” , 以及可 选替选是汉字 - 。
25、中文的五个候选音译, 即 “拼音输入法” (例如, 拼音的 “p n y n sh r f” ) ;“拼音输入” (例如, 拼音的 “p n y n sh r” ) ;“拼音” (例如, 拼音的 “p n y n” ) ;“品” (例如, 拼音的 “p n” ) ; 以及 “拼” (例如, 拼音的 “p n” ) 。 0026 总的来说, 输入可以包括一个或多个字符序列。作为示例, 输入可以是字符、 包含 多个字符的项目 (例如词或短语) 、 或包含多个项目的句子。有时, 输入可以是期望音译的完 整语音拼写。例如, 在图 1A 中, 输入 “pin yin shu ru fa” 可以是 “拼音。
26、输入法” 的完整语 音拼写。在一些情况下, 用户输入完全拼音表示 (完整语音拼写) 可能是不方便的, 例如尤其 在移动设备 (例如, 移动电话) 上。因此, 用户有时可能输入比完全拼音表示少的多个字符 (例如, 缩写) 。例如, 用户可以将 “pysrf” 作为输入提供, 并且 IME 可以将输入 “pysrf” 映 射到完全拼音表示 “pin yin shu ru fa” 。 0027 在两个示例中, 例如, 当输入包括打字错误时, 用户对输入进行修改可能均是不方 便的。在如同图 1A 的 IME 或用户界面中, 用户将需要例如通过一次为将文本光标的当前位 置与打字错误的位置分离的每一个可选。
27、对象 (例如每一个可选替选、 或每一个划界的罗马 字符组) 按下 LEFT/RIGHT(左 / 右) 光标键, 将文本光标 (例如, 插入符或 | 条) 移动到打字 错误的位置。文本光标识别当前的文本输入或修改位置。 0028 图 1B 是图示显示带有打字错误的输入和对该输入的可选替选的示例输入法编辑 器界面的截屏。 在图1B中, 用户意在提供输入 “Pin yinshu ru fa shi zhe yang gong zuo de” (增加了强调) 。然而, 用户在预期的字符序列 “shu” (例如拼音音节) 中没有输入字符 说 明 书 CN 103026318 A 7 4/11 页 8 “。
28、s” 。因此, 输入当前包括字符序列 “Pin yin hu ru fa shi zhe yang gong zuo de” (增 加了强调) 。因此, 可选替选 (例如, 中文的音译候选) 可能不同于用户意在获取的内容。 0029 在图 1B 中, 注意到, 文本光标当前位于可选替选 “拼音呼入法是这样工作的” 上, 如第一可选替选的高亮所示。为了校正打字错误, 用户将按下 LEFT 光标键九次 (例如, 以通 过 (1) “de” ,(2) “zuo” ,(3) “gong” ,(4) “yang” ,(5) “zhe” ,(6) “shi” ,(7) “fa” ,(8) “ru” 以及 。
29、(9) “hu” ) 、 或 RIGHT 光标键七次 (例如, 以通过 (1) “拼音” ,(2) “品” ,(3) “拼” , (4) “频” ,(5) “pin” ,(6) “yin” 以及 (7) “hu” ) , 来将文本光标移动到 “hu” 并且插入缺少 的字符 “s” 。 0030 图 2 是图示图 1A 的示例输入法编辑器界面的截屏, 其中输入的不同部分被加标 签。不同部分对应于不同语言单元, 例如关于字符的单元, 关于音节的单元, 关于项目 (例 如, 一个或多个词) 的单元以及关于句子的单元。根据操作粒度, 例如可以针对单元作为整 体执行浏览和编辑操作 (例如, 高亮、 删除。
30、、 复制、 粘贴、 替换) 的级别, 每一个语言单元对应 于可操作单元。 0031 总的来说, 操作粒度级包括字符级、 代符级、 项目级以及句子级。 在字符级, 可以针 对在原始输入的第一书写系统中的字符执行操作。在代符级, 可以针对由第一书写系统中 的字符所表示的代符 (例如, 音节) 执行操作。在代符组级, 可以针对代符组 (例如, 项目或短 语) 执行操作。句子级将整个输入看作操作单元, 例如, 该整个输入可以是或可以不是句子。 0032 在图 2 中, 根据用于拼音书写系统的示例操作粒度级, 为拼音输入加标签。具体 地, 字符级被加标签为 “拼音字符” 级, 其中针对单个拉丁字符执行操。
31、作。代符级被加标签 为 “拼音代符” 级, 其中针对拼音代符, 例如拼音音节或拼音音节的缩写, 对应于中文字符的 最小音译单元, 执行操作。代符组级被加标签为 “短语 / 代符组” 级, 其中针对代符组, 例如 拼音项目或短语执行操作。句子级被加标签为 “句子” 级。注意到, 图 2 中的级标签实际上 不在所图示的 IME 界面中显示。 0033 在图 2 中, 输入 “pin yin shu ru fa” 包括五个拼音代符 :“pin” 、“yin” 、“shu” 、 “ru” 以及 “fa” , 其每一个可以表示中文字符的拼音音节。作为另一个示例, 输入 “p y shu r fa” 也表。
32、示五个拼音音节, 其中 “p” 、“y” 、“r” 是拼音音节的缩写。一个或多个五个拼音 代符的各种组合可以是拼音代符组, 其对应于汉字 - 中文项目。 0034 图 3 是图示观察到的文本输入序列和由观察到的文本输入序列表示的潜在项目 序列的框图。图 3 中所图示的数据可以被存储在语言模型中的格阵中。可以使用语言模型 来为观察到的文本序列, 例如图 3 中的文本序列 “pin yin shu ru fa” 生成候选音译, 如参 考图 21 进一步描述的。在图 3 的格阵中, 可以通过遍历不同路径通过格阵项来选择最可能 的候选音译。具体地, 一些示例候选音译包括 “拼音输入法” 、“拼因数入法。
33、” 、“频因输入法” 以及 “贫引书如发” 。在示例中, 最佳路径, 即最可能的候选音译, 是 “拼音输入法” 。将输入 分割成表示目标书写系统中的项目的字符子序列, 可以由语言模型提供。可以使用常规方 法来生成并使用语言模型。 0035 图 4 是示出用于在输入法编辑器中提供浏览和编辑功能的示例过程 400 的流程 图。过程 400 包括将用户输入的多个字符分成 402 一个或多个代符。代符是一个或多个字 符的组。作为示例, 当用户提供输入 “pinyinshurufa” 时, 将输入中的字符分成五个代符 “pin” 、“yin” 、“shu” 、“ru” 以及 “fa” , 如图 2 中所。
34、示。过程 400 还包括将代符聚组 403 成 说 明 书 CN 103026318 A 8 5/11 页 9 一个或多个代符组。在示例中, 可以将五个字符代符 “pin” 、“yin” 、“shu” 、“ru” 以及 “fa” 聚组成两个代符组 (也被称为 “短语代符” ) “pinyin” 和 “shurufa” 。 0036 过程 400 还包括根据操作粒度为代符组生成 404 一个或多个边界。在一些实施方 式中, 通过使用语言模型来识别最可能的音译候选, 例如由通过语言模型的格阵的最可能 路径所表示的音译候选, 来生成一个或多个边界。在示例中, 可以识别为代符组 “pinyin” 和 。
35、“shurufa” 划界的边界。此外, 可以识别为代符 “pin” 和 “yin” 划界的边界, 以及为代符 “shu” 、“ru” 和 “fa” 划界的边界。 0037 过程 400 还包括响应于接收指示触发器的激活的输入, 可视地指示 406 用于代符 组的边界。可视地指示边界可以包括为由边界划界的代符组加标签, 例如紧挨每一个代符 组显示数字或字母。还可以使用不同颜色、 图案或用来区分代符组的其他视觉方面来可视 地指示边界。 0038 在对输入的浏览和编辑期间, 用户可以使用视觉指示符来快速辨识代符组, 并且 直接导航到特定代符组, 例如, 不用将文本光标移动通过在特定代符组和文本光标的。
36、当前 位置之间的代符组。 0039 图 5 是图示显示输入的示例输入法编辑器界面的截屏, 其中输入的不同部分被加 标签。在图 5 中, 输入 “pinyinshurufadegongneng” 是用来表示拼音的罗马字符序列。注 意到, 用户没有典型地输入分隔符 (例如, 空格、“|” 字符) 来明确划界该罗马字符之间的边 界。 0040 图 5 中的 IME 界面示出了在输入的拼音 “pinyinshurufadegongneng” 被分成八个 拼音代符 “pin” 、“yin” 、“shu” 、“ru” 、“fa” 、“de” 、“gong” 以及 “neng” 之后的输入版本。识 别将八个。
37、拼音代符中的每一个与邻近拼音代符划界的边界, 例如代符边界。此外, IME 可以 从八个拼音代符识别四个代符组 “pinyin” 、“shurufa” 、“de” 以及 “gongneng” 。识别将四 个代符组中的每一个与邻近拼音代符划界的边界, 例如代符组边界。可以从使用语言模型 来识别的分割确定边界。 0041 图 6-18 是图示用于浏览和编辑输入的示例输入法编辑器界面和交互的截屏。具 体地, 图 6-14 示出浏览操作, 例如执行来将文本光标从一个可操作单元直接移动到另一个 可操作单元的操作。图 15-18 示出编辑操作, 例如针对可操作单元作为整体执行来修改该 可操作单元的操作。 。
38、0042 图 6 示出在检测到触发器事件之前的示例 IME 界面。作为示例, 触发器事件可以 是从用户接收指示用户意在激活浏览通过或编辑输入的可操作单元的功能的命令输入。 作 为示例, 命令输入可以是热键的激活, 例如通过按下控制 ( “CTRL” ) 键。 命令输入还可以是一 个或多个物理键, 例如在物理键盘设备上的键, 或虚拟键, 例如在显示器上键的可视表示, 的激活。 0043 当按下 CTRL 键时, 在 IME 界面上显示区分代符组 “pinyin” 、“shurufa” 、“de” 以 及 “gongneng” 的视觉指示符。在图 7 中, 代符组 “pinyin” 被加标签有数字。
39、 “0” , 代符组 “shurufa” 被加标签有数字 “1” , 代符组 “de” 被加标签有数字 “2” , 以及代符组 “gongneng” 被加标签有数字 “3” 。 0044 当触发器事件结束时, 可以从显示移除视觉指示符。 作为示例, 触发器事件可以在 CTRL 键被按下期间继续, 并且在 CTRL 键被释放时结束。作为另一个示例, 触发器事件可以 说 明 书 CN 103026318 A 9 6/11 页 10 在 CTRL 键被按下一次时开始, 并且在 CTRL 键被再次按下时结束。在图 8 中, 触发器事件已 结束, 并且 IME 界面返回到如图 6 中的状态, 例如, 其。
40、中标签 “0” 、“1” 、“2” 和 “3” 消失。 0045 当响应于触发器事件而显示标签时, 图 9 中的 IME 界面示出与在图 6 中相同的状 态。注意到, 在用户界面中, 例如插入符的文本光标当前位于代符组 “gongneng” 的右边。通 过提供命令输入, 可以选择特定代符组, 并且可以将文本光标同时移动到与特定代符组邻 近的位置, 例如, 在特定代符组和在输入中在特定代符组之前或之后发生的邻近代符组之 间的位置。 0046 在图 10 中, 当同时按下 CTRL 键和数字键 (CTRL+ 数字) 时, 文本光标被移动到以对 应数字加标签的代符组边界。如图 10 中所图示, 当同。
41、时按下 CTRL 键和数字 “2” 键时, 文本 光标被移动到以 “2” 加标签的代符组边界, 例如紧靠代符组 “de” 的左边的位置。如图 10 中所图示, 在一些实施方式中, 从显示移除与在输入中在所选择的、 特定代符组之后发生的 代符组相关联的视觉指示符。在图 10 中, 已从显示移除了标签 “2” 和 “3” 。 0047 在触摸屏显示器上显示 IME 界面的一些实施方式中, 可以通过触摸在触摸屏显示 器上的视觉指示符的图形表示来选择视觉指示符。 0048 在一些实施方式中, 对在输入中在选择的特定代符组之后发生的代符组的视觉属 性 (例如颜色、 大小) 进行修改, 以指示从用于确定可。
42、选替选的考虑临时移除这些代符组。移 除被认为是临时的, 因为当触发器事件结束时, 这些代符组可以被添加回到考虑作为输入 的一部分。当触发器事件结束时, 用户更可能具有输入的在这些代符组之前发生的完成编 辑的部分。 0049 在图 10 中, 代符组 “de” 和 “gong neng” 的字体颜色已被修改, 例如, 被改变成更 浅的颜色, 以指示在 IME 界面的当前状态下不考虑 “de gong neng” 。因此, IME 确定并提 供为输入的不包括 “gong neng” 的部分显示可选替选。注意到, 在图 9 中, 关于输入 “pin yin shu rufa de gong neng。
43、” 的第一可选替选 “拼音输入法的公能” (例如, 拼音的 “p n y n sh r f de g ng nng” ) 与关于输入的在图 10 中被考虑的部分即 “pin yin shu ru fa” 的第一可选替选 “拼音输入法” (例如, p n y n sh r f) 不相同。 0050 在图 11 中, IME 用户界面的状态与图 9 中的相同。再次, 注意到, 在用户界面中, 文本光标位于代符组 “gongneng” 的右边。在一些实施方式中, 通过提供方向输入将文本光 标从一个代符组边界直接移动到另一个代符组边界。例如, 在图 12 中, 当同时按下 CTRL 键 和 LEFT 。
44、键 (例如,“” 光标键) 时, 文本光标从图 11 中所示的位置被移动到图 12 中所示的 位置, 即在文本光标的原始位置的左边的第一代符组边界的位置。 0051 类似地, 图 13-14 示出可以如何使用方向输入来将光标从一个代符边界直接移动 到另一个代符边界。在示例中, CTRL+RIGHT(例如, CTRL+ ) 将文本光标移动到在文本光 标的原始位置的右边的第一代符组的位置, 即从紧靠代符 “de” 的右边的位置到紧靠代符 “gong” 的右边的位置。其他浏览操作 (例如, 朝其他方向 (例如, 向上、 向下) 移动文本光标) 是可能的。 0052 在图 15-16 中, 针对代符执。
45、行编辑操作, 例如退格操作。注意到, 在图 15 中, 在用 户界面中, 文本光标位于代符 “fa” 的右边。在图 18 中, 当同时按下 CTRL 键和 BACKSPACE 键时, 位于紧靠文本光标的左边的地方的代符即 “fa” 被删除。 0053 在图 17-18 中, 针对代符执行编辑操作, 例如删除操作。注意到, 在图 17 中, 在用 说 明 书 CN 103026318 A 10 7/11 页 11 户界面中, 文本光标位于紧靠代符 “fa” 的左边的地方。在图 18 中, 当同时按下 CTRL 键和 DELETE 键 ( “DEL” 键) 时, 位于紧靠文本光标的右边的地方的代符。
46、即 “fa” 被删除。其他编 辑操作 (例如复制、 粘贴、 替换) 是可能的。 0054 上面的描述描述了特定实施方式。 随后是这些和其他实施方式的一般特征的另外 描述。 0055 在一些实施方式中, 接收第一书写系统中的字符输入序列。 例如, 第一书写系统可 以是拉丁。在图 5 中, 字符输入序列的示例是 “pinyinshurufadegongneng” 。 0056 在字符输入序列中, 识别一个或多个第一连续字符子序列。每一个子序列表示在 不同的第二书写系统中的音节。该不同的第二书写系统可以是中文拼音, 其中音节对应于 汉字字符。在图 5 中, 第一子序列的示例是 “pin” 、“yin。
47、” 、“shu” 、“ru” 、“fa” 、“de” 、“gong” 以及 “neng” 。 0057 在字符输入序列中, 识别一个或多个第二子序列。每一个第二子序列包括一个或 多个连续第一子序列, 并且表示在不同的第二书写系统中的项目。在图 5 中, 示例第二子序 列包括 “pinyin” (包括连续第一子序列 “pin” 和 “yin” ) 、“shurufa” (包括连续第一子序 列 “shu” 、“ru” 和 “fa” ) 、“de” 以及 “gongneng” (包括连续第一子序列 “gong” 和 “neng” ) 。 0058 确定为一个或多个第二子序列划界的一个或多个边界。在图。
48、 5 中, 关于第二子序 列的边界的示例是在 “pinyin” 和 “shurufa” 之间的代符组边界。 0059 生成一个或多个可选指示符以在用户界面中显示。 一个或多个可选指示符中的每 一个识别由一个或多个边界划界的相应第二子序列。在图 7 中, 示例可选指示符包括识别 四个第二子序列 “pinyin” 、“shurufa” 、“de” 和 “gongneng” 的标签 “0” 、“1” 、“2” 和 “3” 。 0060 在一些实施方式中, 从整个字符输入序列确定在第三书写系统中的一个或 多个第一输入候选, 并且将一个或多个第一输入候选显示为对字符输入序列的可选 替选。例如, 第三书写。
49、系统可以是汉字、 片假名或谚文。在图 5 中, 在用户界面上为 “pinyinshurufadegongneng” 生成并显示示例第一输入候选 “拼音输入法的功能” 、“拼音输 入法” 、“拼音输入” 、“拼音” 以及 “品” 。 0061 在一些实施方式中, 当接收了对第一可选指示符的用户选择时, 从第三字符子序 列确定在第三书写系统中的一个或多个第二输入候选。 第三子序列包括如下顺序的所有第 二子序列 : 直至第一可选指示符所识别的特定第二子序列为止的所有第二子序列在输入序 列中出现的顺序。作为示例, 在图 10 中, 当用户选择第一可选指示符 “2” 时, 从包括第二子 序列 “pin yin” 和 “shurufa” 的第三子序列 “pinyin shurufa” 确定第二输入候选 “拼音输 入法” 。 0062 将一个或多个第二输入候选而不是第一输入候选显示为对第三字符子序列的可 选替选。作为示例, 在图 10 中, 从 “pin yin shu ru fa” 确定第二输入候。