标签转换处理方法、装置、电子设备及可读存储介质.pdf

上传人:二狗 文档编号:10024906 上传时间:2021-06-02 格式:PDF 页数:17 大小:683.37KB
收藏 版权申诉 举报 下载
标签转换处理方法、装置、电子设备及可读存储介质.pdf_第1页
第1页 / 共17页
标签转换处理方法、装置、电子设备及可读存储介质.pdf_第2页
第2页 / 共17页
标签转换处理方法、装置、电子设备及可读存储介质.pdf_第3页
第3页 / 共17页
文档描述:

《标签转换处理方法、装置、电子设备及可读存储介质.pdf》由会员分享,可在线阅读,更多相关《标签转换处理方法、装置、电子设备及可读存储介质.pdf(17页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010867140.4 (22)申请日 2020.08.25 (71)申请人 文思海辉智科科技有限公司 地址 102200 北京市昌平区未来科学城英 才北二街鞍钢未来钢铁研究院三号楼 426室 (72)发明人 郭云辉陈海燕 (74)专利代理机构 北京超凡宏宇专利代理事务 所(特殊普通合伙) 11463 代理人 衡滔 (51)Int.Cl. G06F 40/42(2020.01) G06F 40/58(2020.01) (54)发明名称 标签转换处理方法、 装置、 电子设备及。

2、可读 存储介质 (57)摘要 本申请提供一种标签转换处理方法、 装置、 电子设备及可读存储介质, 方法包括: 识别待翻 译文件中的目标标签, 目标标签为具有逻辑成对 标签特征的标签; 根据逻辑成对标签特征中的标 签类型特征, 判断目标标签的标签类型; 标签类 型包括逻辑开始标签或逻辑结束标签; 根据目标 标签的标签名, 确定目标标签的替换标签名; 根 据标签类型和替换标签名, 生成更新标签, 以使 更新标签能够被识别为形式上成对的标签; 将目 标标签替换为更新标签。 这样, 由于目标标签替 换为了更新标签, 而更新标签可被识别, 这就使 得逻辑上属于标签对的独立标签也可以在翻译 过程中被译员正。

3、确放置, 从而降低了对于译员的 计算机专业知识要求, 也提高了翻译作业的质量 和效率。 权利要求书2页 说明书11页 附图3页 CN 111967274 A 2020.11.20 CN 111967274 A 1.一种标签转换处理方法, 其特征在于, 包括: 识别待翻译文件中的目标标签, 所述目标标签为具有逻辑成对标签特征的标签; 根据所述逻辑成对标签特征中的标签类型特征, 判断所述目标标签的标签类型; 标签 类型包括逻辑开始标签或逻辑结束标签; 根据所述目标标签的标签名, 确定所述目标标签的替换标签名; 根据所述标签类型和所述替换标签名, 生成更新标签, 以使所述更新标签能够被识别 为形式上。

4、成对的标签; 将所述目标标签替换为所述更新标签。 2.如权利要求1所述的标签转换处理方法, 其特征在于, 识别所述待翻译文件中的目标 标签包括: 获取所述待翻译文件中标签的标签名和/或标签属性, 并识别该标签名和/或标签属性 中是否包含所述逻辑成对标签特征; 若该标签名和/或标签属性中包含所述逻辑成对标签特征, 确定该标签为所述目标标 签。 3.如权利要求1所述的标签转换处理方法, 其特征在于, 根据所述目标标签的标签名, 确定所述目标标签的替换标签名, 包括: 根据预设对应关系, 确定所述目标标签的标签名对应的预设替换标签名作为所述替换 标签名。 4.如权利要求3所述的标签转换处理方法, 其。

5、特征在于, 所述根据所述标签类型和所述 替换标签名, 生成更新标签, 包括: 若所述标签类型为逻辑开始标签, 则获取所述目标标签, 将所述目标标签的标签名替 换为所述替换标签名, 以得到所述更新标签; 若所述标签类型为逻辑结束标签, 则获取所述目标标签, 将所述目标标签的标签名替 换为所述替换标签名, 在所述替换标签名之前添加结束标签标识, 并缺省所述目标标签的 标签属性, 以得到所述更新标签。 5.如权利要求1所述的标签转换处理方法, 其特征在于, 所述方法还包括: 确定所述待翻译文件的文件类型; 根据所述文件类型确定用于识别所述目标标签的逻辑成对标签特征。 6.如权利要求1-5任一项所述的。

6、标签转换处理方法, 其特征在于, 所述方法还包括: 判断所述目标标签中是否包括配对组区分属性; 若包括, 则根据所述目标标签中的配对组区分属性配置所述更新标签中的配对组区分 属性。 7.如权利要求1-5任一项所述的标签转换处理方法, 其特征在于, 所述方法还包括: 记录所述目标标签与所述更新标签的对应关系; 若接收到翻译完成指令, 则在翻译完成文件中将所述更新标签替换为所述目标标签; 其中, 所述翻译完成文件为对所述待翻译文件翻译完毕后的文件, 所述翻译完成文件中保 留有所述待翻译文件中的标签。 8.一种标签转换处理装置, 其特征在于, 包括: 识别模块、 判断模块、 确定模块和替换模 块; 。

7、权利要求书 1/2 页 2 CN 111967274 A 2 所述识别模块, 用于识别待翻译文件中的目标标签, 所述目标标签为具有逻辑成对标 签特征的标签; 所述判断模块, 用于根据所述逻辑成对标签特征中的标签类型特征, 判断所述目标标 签的标签类型; 标签类型包括逻辑开始标签或逻辑结束标签; 所述确定模块, 用于根据所述目标标签的标签名, 确定所述目标标签的替换标签名; 所述替换模块, 用于根据所述标签类型和所述替换标签名, 生成更新标签, 以使所述更 新标签能够被识别为形式上成对的标签; 将所述目标标签替换为所述更新标签。 9.一种电子设备, 其特征在于, 包括: 控制器、 存储器及通信总。

8、线; 所述通信总线用于实现所述控制器、 存储器之间的连接通信; 所述控制器用于执行存储器中存储的一个或者多个程序, 以实现如权利要求1至7任一 项所述的标签转换处理方法。 10.一种可读存储介质, 其特征在于, 所述可读存储介质存储有一个或者多个程序, 所 述一个或者多个程序可被一个或者多个控制器执行, 以实现如权利要求1至7任一项所述的 标签转换处理方法。 权利要求书 2/2 页 3 CN 111967274 A 3 标签转换处理方法、 装置、 电子设备及可读存储介质 技术领域 0001 本申请涉及数据处理技术领域, 具体而言, 涉及一种标签转换处理方法、 装置、 电 子设备及可读存储介质。。

9、 背景技术 0002 文件中常常会有标签, 这些标签从形式上可分为标签对(即开始标签和结束标签) 以及独立标签。 为了便于译员识别和处理这些标签, 降低对译员的技术知识储备要求, CAT (Computer Assitant Tool, 计算机辅助翻译工具)会将这些标签处理为不同的外观(左右 两端的形状), 如: 开始标签会处理为结束标签会处理为独立标签会处理为 “” 。 这样, 译员就能通过标签外观准确判断标签类别, 以保证能够对开始标签和结束标签 正确配对, 且包裹合适的文本。 尤其因源语言和目标语言特性不同, 而需要在译文中调整语 序时, 译员就更依赖于此功能。 0003 然而在某些类别。

10、的文件中, 存在一类特殊的标签, 它们虽具有独立标签的形式, 但 在功能上属于开启或关闭某个特性或动作, 或者表示某个范围的开始或结束位置。 即在逻 辑上属于标签对。 目前CAT将这类逻辑配对的特殊独立标签与普通独立标签统一处理为独 立标签的外观 “” 。 这样就容易使译员将这类特殊独立标签误解为普通的独立标签, 从而 可能造成标签无法配对(比如将具有开始功能的标签位于具有结束功能的标签之后, 或者 配对的两方缺失其一)。 同时, 译员为了避免此类错误, 就需要进行一定的技术知识储备, 了 解相应的文件格式编码知识, 来识别此类特殊标签。 发明内容 0004 本申请实施例的目的在于提供一种标签。

11、转换处理方法、 装置、 电子设备及可读存 储介质, 用以解决相关技术无法区分出逻辑上属于标签对的特殊独立标签, 从而导致的提 高了译员的计算机专业知识要求, 也降低了翻译作业的质量和效率的问题。 0005 本申请实施例提供了一种标签转换处理方法, 包括: 识别待翻译文件中的目标标 签, 所述目标标签为具有逻辑成对标签特征的标签; 根据所述逻辑成对标签特征中的标签 类型特征, 判断所述目标标签的标签类型; 标签类型包括逻辑开始标签或逻辑结束标签; 根 据所述目标标签的标签名, 确定所述目标标签的替换标签名; 根据所述标签类型和所述替 换标签名, 生成更新标签, 以使所述更新标签能够被识别为形式上。

12、成对的标签; 将所述目标 标签替换为所述更新标签。 0006 在本申请实施例中, 通过识别待翻译文件中的目标标签, 并根据目标标签的逻辑 成对标签特征中的标签类型特征, 确定出标签类型。 同时根据目标标签的标签名, 确定对应 的替换标签名, 从而根据标签类型和替换标签名, 生成更新标签, 使的更新标签能够被识别 为形式上成对的标签, 最后将目标标签替换为更新标签。 这样, 由于目标标签替换为了更新 标签, 而更新标签可被识别, 这就使得在进行翻译时, 对于逻辑上属于标签对的独立标签, 也可以实现区别性翻译, 从而使得译员能够区分出逻辑上属于标签对的特殊独立标签, 进 说明书 1/11 页 4 。

13、CN 111967274 A 4 而降低了对于译员的计算机专业知识要求, 也提高了翻译作业的质量和效率。 0007 进一步地, 识别所述待翻译文件中的目标标签包括: 获取所述待翻译文件中标签 的标签名和/或标签属性, 并识别该标签名和/或标签属性中是否包含所述逻辑成对标签特 征; 若该标签名和/或标签属性中包含所述逻辑成对标签特征, 确定该标签为所述目标标 签。 0008 在实际应用过程中, 具有逻辑成对标签特征的独立标签, 与其他普通独立标签相 比, 由于具有逻辑成对标签特征的独立标签需要能够在逻辑上实现标签对的功能, 因此其 在名称和/或标签属性上往往需要具有相应的标识逻辑成对特性的特征,。

14、 比如会具有 “start” 、“end” 这种特征, 而不具有逻辑成对标签特征的独立标签(即普通独立标签)则不 会具有这种特征。 据此, 在上述实现过程中, 可以通过识别该标签名和/或标签属性中是否 包含所述逻辑成对标签特征, 快速、 可靠地实现对于目标标签的识别确定。 0009 进一步地, 根据所述目标标签的标签名, 确定所述目标标签的替换标签名, 包括: 根据预设对应关系, 确定所述目标标签的标签名对应的预设替换标签名作为所述替换标签 名。 0010 进一步地, 所述根据所述标签类型和所述替换标签名, 生成更新标签, 包括: 若所 述标签类型为逻辑开始标签, 则获取所述目标标签, 将所述。

15、目标标签的标签名替换为所述 替换标签名, 以得到所述更新标签; 若所述标签类型为逻辑结束标签, 则获取所述目标标 签, 将所述目标标签的标签名替换为所述替换标签名, 在所述替换标签名之前添加结束标 签标识, 并缺省所述目标标签的标签属性, 以得到所述更新标签。 0011 应理解, 在实际应用过程中, CAT翻译时, 能够允许标签对缺省部分特征, 只要其后 具有相应的结束标签标识即可。 为此, 在本申请实施例中, 可以允许对于逻辑开始标签不设 置开始标签标识, 而对于逻辑结束标签设置结束标签标识, 从而在满足相关翻译要求的基 础上, 能够简化标签。 此外, CAT翻译时, 对于标签对中的结束标签。

16、需要其省略标签属性。 为 此, 在本申请中可以缺省目标标签的标签属性, 从而使得逻辑结束标签对应的更新标签能 够有效被CAT识别。 0012 进一步地, 所述方法还包括: 确定所述待翻译文件的文件类型; 根据所述文件类型 确定用于识别所述目标标签的逻辑成对标签特征。 0013 应当理解的是, 在实际应用过程中, 不同类型的文件中, 属于标签对的这类特殊的 独立标签, 所具有的可用于实现逻辑成对功能的逻辑成对标签特征可能是不同的。 比如, 对 于某一类文件而言, 其内属于标签对的独立标签的逻辑成对标签特征可能是 “start” 和 “end” , 而对于另一类文件而言, 其内属于标签对的独立标签。

17、的逻辑成对标签特征可能是 “open” 和 “close” 。 对此, 在上述实现过程中通过待翻译文件的文件类型, 从而确定出用于 识别目标标签的逻辑成对标签特征, 从而可以确保本申请实施例中对于目标标签的有效识 别, 从而确保本申请实施例所提供的方案的可靠性。 0014 进一步地, 所述方法还包括: 判断所述目标标签中是否包括配对组区分属性; 若包 括, 则根据所述目标标签中的配对组区分属性配置所述更新标签中的配对组区分属性。 0015 在实际应用过程中, 可能存在多对(即多个配对组)属于标签对的独立标签, 而为 了区分不同配对组的独立标签, 标签中会设置配对组区分属性, 从而区分出不同对属。

18、于标 签对的独立标签。 而通过上述实现过程, 即可使得替换后的更新标签在翻译后能够按照设 说明书 2/11 页 5 CN 111967274 A 5 定的配对组实现相应功能, 不致导致翻译出现逻辑错误。 0016 进一步地, 所述方法还包括: 记录所述目标标签与所述更新标签的对应关系; 若接 收到翻译完成指令, 则在翻译完成文件中将所述更新标签替换为所述目标标签; 其中, 所述 翻译完成文件为对所述待翻译文件翻译完毕后的文件, 所述翻译完成文件中保留有所述待 翻译文件中的标签。 0017 在上述实现过程中, 通过将翻译完成文件中将更新标签替换为目标标签, 从而可 以保证翻译完成文件与原文件中标。

19、签的一致性, 从而便于翻译完成文件用于进行后续操 作。 0018 本申请实施例还提供了一种标签转换处理装置, 包括: 识别模块、 判断模块、 确定 模块和替换模块; 所述识别模块, 用于识别待翻译文件中的目标标签, 所述目标标签为具有 逻辑成对标签特征的标签; 所述判断模块, 用于根据所述逻辑成对标签特征中的标签类型 特征, 判断所述目标标签的标签类型; 标签类型包括逻辑开始标签或逻辑结束标签; 所述确 定模块, 还用于根据所述目标标签的标签名, 确定所述目标标签的替换标签名; 所述替换模 块, 用于根据所述标签类型和所述替换标签名, 生成更新标签, 以使所述更新标签能够被识 别为形式上成对的。

20、标签; 将所述目标标签替换为所述更新标签。 0019 本申请实施例还提供了一种电子设备, 包括: 控制器、 存储器及通信总线; 所述通 信总线用于实现所述控制器和存储器之间的连接通信; 所述控制器用于执行存储器中存储 的一个或者多个程序, 以实现上述任一种的标签转换处理方法。 0020 本申请实施例中还提供了一种可读存储介质, 所述可读存储介质存储有一个或者 多个程序, 所述一个或者多个程序可被一个或者多个控制器执行, 以实现上述任一种的标 签转换处理方法。 附图说明 0021 为了更清楚地说明本申请实施例的技术方案, 下面将对本申请实施例中所需要使 用的附图作简单地介绍, 应当理解, 以下附。

21、图仅示出了本申请的某些实施例, 因此不应被看 作是对范围的限定, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他相关的附图。 0022 图1为本申请实施例提供的一种标签转换处理方法的基本流程示意图; 0023 图2为本申请实施例提供的一种特殊独立标签的结构示意图; 0024 图3为本申请实施例提供的一种具体的标签转换处理方法的流程示意图; 0025 图4为本申请实施例提供的一种标签转换处理装置的结构示意图; 0026 图5为本申请实施例提供的一种电子设备的结构示意图。 具体实施方式 0027 下面将结合本申请实施例中的附图, 对本申请实施例中的技术方案。

22、进行描述。 0028 实施例一: 0029 为解决相关技术无法区分出逻辑上属于标签对的特殊独立标签, 从而导致的提高 了译员的计算机专业知识要求, 也降低了翻译作业的质量和效率的问题, 本申请实施例提 供了一种标签转换处理方法, 参见图1所示, 包括: 说明书 3/11 页 6 CN 111967274 A 6 0030 S101: 识别待翻译文件中的目标标签。 0031 在本申请实施例中, 待翻译文件可以由工程师根据实际翻译需求提供, 或根据实 际翻译需求从相关文件系统中读取。 0032 在本申请实施例中, 目标标签是指待翻译文件中的具有独立标签的形式, 但在逻 辑上属于标签对(即在功能上属。

23、于开启或关闭某个特性或动作, 或者表示某个范围的开始 或结束位置)的独立标签(为便于表述, 本申请中后续称逻辑上属于标签对的独立标签为特 殊独立标签)。 0033 在本申请实施例中, 目标标签具有逻辑成对标签特征的标签。 所谓逻辑成对标签 特征, 是指能够使得特殊独立标签实现标签对功能的那部分有别于普通独立标签的特征, 比如具有的 “start” 和 “end” 、“open” 和 “close” 、“1” 或 “0” 等特征。 0034 需要理解的是, 在实际应用过程中, 不同类型的文件中, 特殊独立标签所具有的逻 辑成对标签特征可能是不同的。 比如, 对于某一类文件而言, 其内属于标签对的。

24、独立标签的 逻辑成对标签特征可能是 “start” 和 “end” , 而对于另一类文件而言, 其内属于标签对的独 立标签的逻辑成对标签特征可能是 “open” 和 “close” 。 0035 为此, 在本申请实施例中, 可以预先记录下各类型的文件与逻辑成对标签特征的 对应关系, 从而可以先确定待翻译文件的文件类型, 进而根据文件类型确定对应的逻辑成 对标签特征。 0036 在本申请实施例中, 可以基于逻辑成对标签特征, 从待翻译文件中识别出特殊独 立标签, 被识别出来的特殊独立标签即为目标标签。 0037 需要说明的是, 参见图2所示, 在实际应用中, 对于处理指令(Processing 。

25、Instruction)元素类的特殊独立标签, 具有结构: 。 其中,“target” 指定了 处理指令的处理器,“data” 是指令的内容。 为了便于描述, 本申请中将 “target” 称为标签 名,“data” 称为标签属性。 例如, 对于特殊独立标签和 ,“rb-cbt_start” 和 “rb-cbt_end” 即为标签名, 而 “namestudent” 即为 标签属性。 此外, 还存在有普通元素类的特殊独立标签, 例如, 特殊独立标签和,“bookmark” 即为标签名, 而 “type start” 和 “typeend” 即为标签属性。 0038 需要理解的是, 对于一个标签。

26、而言, 其标签属性中可以同时具有多个具体的属性。 比如, 可以同时具有 “typestart” 和 “id1” 这两个属性。 0039 还需要说明的是, 在实际应用过程中, 由于特殊独立标签需要能够在逻辑上实现 标签对的功能, 因此其在标签名和/或标签属性上往往需要具有相应的标识逻辑成对特性 的特征, 而不具有逻辑成对标签特征的独立标签(即普通独立标签)则不会具有这种特征。 比如对于前例而言, 标签属性中的 “start” 和 “end” 即为标识逻辑成对特性的特征; 又例如, 对于特殊独立标签和, 标签名 “rb- cbt_start” 和 “rb-cbt_end” 中的 “start” 和。

27、 “end” 即为标识逻辑成对特性的特征。 应理解, 除前述两示例的情况外, 还可能存在标签名和标签属性中都具有标识逻辑成对特性的特征 的情况, 在此不再示例。 0040 因此, 在本申请实施例中, 可以获取待翻译文件中标签的标签名和/或标签属性, 并识别该标签名和/或标签属性中是否包含逻辑成对标签特征。 若该标签名和/或标签属性 说明书 4/11 页 7 CN 111967274 A 7 中包含逻辑成对标签特征, 即可确定该标签为目标标签。 这样, 基于特殊独立标签与普通独 立标签所具有的区别特征, 即可快速、 可靠地识别出待翻译文件中的目标标签。 0041 S102: 根据逻辑成对标签特征。

28、中的标签类型特征, 判断所述目标标签的标签类型。 0042 在实际应用过程中, 传统的标签对由具有一个开始标签和一个结束标签构成, 而 特殊独立标签与传统的标签对类似, 同样需要由一个实现开始功能的标签和一个用于实现 结束功能的标签共同组成一个配对组, 才能在逻辑上实现完整的标签对的功能。 0043 因此, 在实际应用中, 特殊独立标签的逻辑成对标签特征中会具有标签类型特征, 以标识该特殊独立标签在逻辑上实现的是标签对的开始功能还是结束功能。 0044 在本申请实施例中, 定义用于标识特殊独立标签在逻辑上实现的是标签对的开始 功能的标签类型特征为第一类标签类型特征, 比如 “start” 、“。

29、open” 等, 而定义用于标识特 殊独立标签在逻辑上实现的是标签对的结束功能的标签类型特征为第二类标签类型特征, 比如 “end” 、“close” 等。 0045 在识别到逻辑成对标签特征中的标签类型特征为第一类标签类型特征, 即可确定 目标标签的标签类型为逻辑开始标签, 而在识别到逻辑成对标签特征中的标签类型特征为 第二类标签类型特征, 即可确定目标标签的标签类型为逻辑结束标签。 0046 在本申请实施例中, 逻辑开始标签和逻辑结束标签分别对应于传统标签对中的开 始标签和结束标签。 0047 S103: 根据目标标签的标签名, 确定目标标签的替换标签名。 0048 在本申请实施例的一种可。

30、行实施方式中, 可以预先定义好各类标签名对应的替换 标签名, 并配置好标签名与替换标签名之间的对应关系表, 从而可以根据目标标签的标签 名, 自动查找得到对应的替换标签名。 0049 需要注意的是, 本可行实施方式中, 定义的替换标签名应满足计算机辅助翻译工 具的解析规则, 以便计算机辅助翻译工具可以正确识别出该替换标签名。 示例性的, 对于特 殊独立标签的标签名 “rb-cbt_start” , 可以定义一个 形式为传统标签对中开始标签的标签名 “Q_cbt” 。 从而在方案执行过程中, 确定出的标签名 “rb-cbt_start” 的替换标签名即为 “Q_cbt” , 使得计算机辅助翻译工。

31、具可以准确识别出该 替换标签。 0050 在本申请实施例的另一种可行实施方式中, 也可以由工程师预先配置相应的标签 名转换规则, 从而按照标签名转换规则自动将目标标签的标签名转换为替换标签名。 0051 同样需要注意的是, 本可行实施方式中, 配置的标签名转换规则应当使得转换得 到的替换标签名能够满足计算机辅助翻译工具的解析规则, 以便计算机辅助翻译工具可以 正确识别出该替换标签名。 示例性的, 可以配置标签名转换规则为将目标标签的标签名转 换为HTML(HyperText Markup Language, 超文本标记语言)的固有标签span。 比如, 标签名 即可以转换为, 从而使得计算机辅。

32、助翻译工具可以准确识 别出该替换标签。 0052 S104: 根据标签类型和替换标签名, 生成更新标签, 以使更新标签能够被识别为形 式上成对的标签。 0053 S105: 将目标标签替换为更新标签。 0054 在本申请实施例中, 标签中的标签名外的其余内容可以继承, 也可以缺省, 具体以 说明书 5/11 页 8 CN 111967274 A 8 计算机辅助翻译工具能够识别为准, 从而生成得到更新标签。 0055 在本申请实施例中, 对于标签类型为逻辑开始标签的目标标签, 由于计算机辅助 翻译工具允许开始标签中缺省表示其为开始标签的标识, 因此可以直接将目标标签的标签 名替换为替换标签名, 。

33、从而得到更新标签。 当然也可以在将目标标签的标签名替换为替换 标签名后, 在其中添加开始标签标识, 以便于计算机辅助翻译工具确定其为特殊独立标签 中的逻辑开始标签。 0056 而对于标签类型为逻辑结束标签的目标标签而言, 为了保证计算机辅助翻译工具 能够准确识别出构成逻辑标签对的两个特殊独立标签, 则不仅需要将目标标签的标签名替 换为替换标签名, 还需要在替换标签名之前添加结束标签标识, 以确保计算机辅助翻译工 具能够准确识别出对应的逻辑开始标签和逻辑结束标签。 0057 示例性的, 对于文本: 0058 Quiz for students&teachers 0059 Answer for t。

34、eachers only 0060 文本中与是一对 特殊独立标签; 而和又是另一对特殊 独立标签。 该文本可以转换为: 0061 Quiz for students&teachers 0062 Answer for teachers only 0063 可见, 转换前的标签转换为了, 缺省了用于表示其为开始标签的标识 “_start” , 而转换 前的标签则转换为了, 具有结束标签标识 “/” , 据此, 计算机辅助 翻译工具即可确定出逻辑开始标签为在先的那个标签, 而逻辑结束标签即为。 0064 类似的, 计算机辅助翻译工具即可确定出逻辑开始标签和逻辑结束标签, 从而实现对于文本的准确翻译。。

35、 0065 需要说明的是, 所谓形式上成对的标签是指具有相同标签名, 且在结束标签中有 结束标识符, 使得计算机辅助翻译工具能够将其识别为成对标签的那一种标签。 如与这类形式等。 0066 需要说明的是, 对于计算机辅助翻译工具而言, 其对于结束标签要求缺省标签属 性。 因此对于属于逻辑结束标签的特殊独立标签而言, 其在转换时, 需要缺省掉特殊独立标 签的标签属性。 比如, 对于特殊独立标签, 其转换后得到的更新 标签即可以为, 缺省掉了标签属性 “typeend” 。 0067 需要理解的是, 在一个文本中往往存在多组成对的特殊独立标签, 比如上例中即 具有两组成对的特殊独立标签。 0068。

36、 而在实际应用中, 除了前例中这种依次出现的多组成对的特殊独立标签的情况 外, 往往还可能存在各组成对的特殊独立标签相互嵌套等情况, 因此就需要明确各组特殊 独立标签的关系。 而为了更明确各组特殊独立标签的对应关系, 往往会在标签中设置有配 说明书 6/11 页 9 CN 111967274 A 9 对组区分属性。 比如对于标签, 其中的 “id0” 即为配对 组区分属性, 标识该标签属于ID为0的配对组。 0069 在本申请实施例中, 若目标标签中包括配对组区分属性, 则可以根据目标标签中 的配对组区分属性配置更新标签中的配对组区分属性。 0070 需要理解的是, 在本申请实施例中, 对于配。

37、对组区分属性的更新, 可以继承原标签 中的配对组区分属性, 但也可以经由特定的转换或编码规则重新生成配对组区分属性。 比 如对于上例中的 “id0” , 即可以重新编号使得id1或者id取其余可标识的字符。 0071 需要注意的是, 配对组区分属性属于标签属性的一种, 因此对于属于逻辑结束标 签的特殊独立标签而言, 在生成更新标签时需要进行缺省。 但是为了使得计算机辅助翻译 工具可以准确确定出属于同一配对组的两特殊独立标签, 在本申请实施例中, 可以在生成 更新标签时, 将生成的配对组区分属性加入到标签名中, 作为标签名的一部分, 从而在满足 计算机辅助翻译工具识别要求的基础上, 能够实现对于。

38、属于同一配对组的两特殊独立标签 的准确识别。 0072 还需要注意的是, 在本申请实施例中, 只要采用的配对组区分属性转换方式能够 使得同一配对组的两特殊独立标签, 在转换后具有的配对组区分属性仍旧一致, 且能被计 算机辅助翻译工具识别即可。 并不限定其具体实现方式。 0073 在本申请实施例中, 在将目标标签替换为更新标签后, 可以记录目标标签与更新 标签的对应关系。 进而, 可以在接收到翻译完成指令时, 在翻译完成文件中将更新标签重新 替换回目标标签。 0074 应理解, 前述翻译完成文件为对待翻译文件翻译完毕后的文件, 而翻译完成文件 中保留有待翻译文件中的标签。 这样, 可以保证翻译完。

39、成文件与原文件中标签的一致性, 从 而便于翻译完成文件用于进行后续操作。 0075 本申请实施例中提供的标签转换处理方法, 通过识别待翻译文件中的目标标签, 并根据目标标签的逻辑成对标签特征中的标签类型特征, 确定出标签类型。 同时根据目标 标签的标签名, 确定对应的替换标签名, 从而根据标签类型和替换标签名, 生成更新标签, 使的更新标签能够被识别为形式上成对的标签, 最后将目标标签替换为更新标签。 这样, 由 于目标标签替换为了更新标签, 而更新标签可被识别, 这就使得在进行翻译时, 对于逻辑上 属于标签对的独立标签, 也可以实现区别性翻译, 从而使得译员能够区分出逻辑上属于标 签对的特殊。

40、独立标签, 进而降低了对于译员的计算机专业知识要求, 也提高了翻译作业的 质量和效率。 0076 实施例二: 0077 本实施例在实施例一的基础上, 以一种具体的标签转换处理过程为例, 对本申请 的方案进行示例说明。 0078 参见图3所示, 标签转换处理过程包括: 0079 S301: 获取待翻译文件, 确定待翻译文件的文件类型。 0080 S302: 根据文件类型确定用于识别目标标签的逻辑成对标签特征。 0081 S303: 获取待翻译文件中标签的标签名和标签属性。 0082 S304: 识别标签名和/或标签属性中是否包含逻辑成对标签特征。 若存在, 执行步 骤S305; 否则, 结束。 。

41、说明书 7/11 页 10 CN 111967274 A 10 0083 S305: 根据预设的标签名对应关系, 确定目标标签的标签名对应的替换标签名。 0084 S306: 根据逻辑成对标签特征中的标签类型特征, 确定目标标签的标签类型。 0085 应理解, 步骤S305和S306之间没有时序限制。 即步骤S305可以在步骤S306之前执 行, 也可以在在步骤S306之后执行, 还可以与步骤S306同时执行。 0086 S307: 在标签类型为逻辑开始标签时, 获取目标标签, 将目标标签的标签名替换为 替换标签名, 以得到更新标签。 0087 S308: 在标签类型为逻辑结束标签时, 获取目。

42、标标签, 将目标标签的标签名替换为 替换标签名, 在替换标签名之前添加结束标签标识, 并缺省目标标签的标签属性, 以得到更 新标签。 0088 S309: 判断目标标签中是否包括配对组区分属性, 若包括, 转至步骤S310; 否则, 转 至步骤S311。 0089 S310: 根据目标标签中的配对组区分属性配置更新标签中的配对组区分属性。 0090 S311: 将目标标签替换为更新标签, 并记录目标标签与更新标签的对应关系。 0091 S312: 在接收到翻译完成指令时, 在翻译完成文件中将更新标签替换为目标标签。 0092 下面, 示例两组通过本申请实施例实现转换的文本案例: 0093 案例。

43、一: (Robo(机器人)Help(帮助)源文件: 条件文本的起始或结束位置的处理指 令(Processing Instruction)标签) 0094 转换前为: 0095 Quiz for students&teachers 0096 Answer for teachers only 0097 或为: 0098 Quiz for students&teachers 0099 Answer for teachers only 0100 转换后为: 0101 Quiz for students&teachers 0102 Answer for teachers only 0103 (代码作用解。

44、释: 当外部给定student条件时, 仅显示student条件所控制的文本, 即:“Quiz for students” ; 当外部给定teacher条件时, 显示teacher条件所控制的范围, 即:“Quiz for students&teachers” 和 “Answer for teachers only” )。 0104 上述代码中,“rb-cbt_start” 和 “rb-cbt_end” 根据name(标签名)属性互相配对, 用于标记所控制的文本范围。 此外, 上述转换前的两段代码中,“namestudent teacher” 和 “nameteacher student” 描。

45、述的都是 “teacher” 和 “student” 两个对象, 因 此本质是一致的, 从而两段代码才可以转换为前述转换后的代码。 0105 需要注意的是, 对于前例代码中的 “namestudent teacher” 和 “name teacher student” , 其是标签中的配对组区分属性, 因此也可以转换为其余的形式。 比如, 可以设定采用二进制位转换规则, 设定student201, teacher212, 当两者同时出 说明书 8/11 页 11 CN 111967274 A 11 现时, 就进行相加, 得到组合的id: student teacher3。 0106 此时转换后。

46、的代码即为: Quiz for students&teachers 0107 Answer for teachers only 0108 案例二: (Open Xml Document bookmark的起始或结束位置的标签) 0109 w:bookmarkstart和w:bookmarkend根据w:id属性互相配对, 用于标记书签所控制 的文本范围。 0110 转换前为: 0111 方案 0112 转换后为: 0113 方案 0114 或为: 0115 方案 0116 上例中, 第一个转换后的代码, 配对组区分属性没有改变, 仍保持为id0, 而第 二个转换后的代码, 配对组区分属性重新进。

47、行了分配, id1。 两种方式都可以被计算机 辅助翻译工具所准确识别, 都是可行的。 0117 本申请实施例的方案, 通过对特殊独立标签的识别和替换处理, 在不影响原CAT处 理逻辑的前提下, 实现了对类开始/结束标签的配对标签化处理, 避免了误导译员, 从而提 高了翻译质量和效率。 同时, 因为不影响原CAT逻辑, 改造工作量少, 易于实施和推广。 0118 实施例三: 0119 基于同一发明构思, 本申请实施例中还提供了一种应用于电子设备上的标签转换 处理装置。 请参阅图4所示, 图4示出了与实施例一所示的方法对应的标签转换处理装置 100。 应理解, 标签转换处理装置100具体的功能可以。

48、参见上文中的描述, 为避免重复, 此处 适当省略详细描述。 标签转换处理装置100包括至少一个能以软件或固件的形式存储于存 储器中或固化在标签转换处理装置100的操作系统中的软件功能模块。 具体地: 0120 参见图4所示, 标签转换处理装置100包括: 识别模块101、 判断模块102、 确定模块 103和替换模块104。 其中: 0121 所述识别模块101, 用于识别待翻译文件中的目标标签, 所述目标标签为具有逻辑 成对标签特征的标签; 0122 所述判断模块102, 用于根据所述逻辑成对标签特征中的标签类型特征, 判断所述 目标标签的标签类型; 标签类型包括逻辑开始标签或逻辑结束标签;。

49、 0123 所述确定模块103, 用于根据所述目标标签的标签名, 确定所述目标标签的替换标 签名; 0124 所述替换模块104, 用于根据所述标签类型和所述替换标签名, 生成更新标签, 以 使所述更新标签能够被识别为形式上成对的标签; 将所述目标标签替换为所述更新标签。 说明书 9/11 页 12 CN 111967274 A 12 0125 在本申请实施例中, 识别模块101具体用于, 获取所述待翻译文件中标签的标签 名, 并识别该标签名中是否包含所述逻辑成对标签特征; 若该标签名中包含所述逻辑成对 标签特征, 确定该标签为所述目标标签。 0126 在本申请实施例中, 确定模块103具体用。

50、于, 根据预设对应关系, 确定所述目标标 签的标签名对应的预设替换标签名作为所述替换标签名。 0127 在本申请实施例的一种可行实施方式中, 替换模块104具体用于, 若所述标签类型 为逻辑开始标签, 则获取所述目标标签, 将所述目标标签的标签名替换为所述替换标签名, 以得到所述更新标签; 若所述标签类型为逻辑结束标签, 则获取所述目标标签, 将所述目标 标签的标签名替换为所述替换标签名, 在所述替换标签名之前添加结束标签标识, 以得到 所述更新标签。 0128 在本申请实施例中, 确定模块103还用于, 确定所述待翻译文件的文件类型; 根据 所述文件类型确定用于识别所述目标标签的逻辑成对标签。

展开阅读全文
内容关键字: 标签 转换 处理 方法 装置 电子设备 可读 存储 介质
关于本文
本文标题:标签转换处理方法、装置、电子设备及可读存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10024906.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1