基于五笔输入法构建的智能汉字结构评价方法及系统.pdf

上传人：齐** 文档编号：10658165 上传时间：2021-08-06 格式：PDF 页数：6 大小：430.03KB

收藏版权申诉举报下载

第1页 / 共6页

第2页 / 共6页

第3页 / 共6页

下载文档到电脑，查找使用更方便

30 金币

下载文档

文档描述：

《基于五笔输入法构建的智能汉字结构评价方法及系统.pdf》由会员分享，可在线阅读，更多相关《基于五笔输入法构建的智能汉字结构评价方法及系统.pdf（6页完成版）》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911190076.4 (22)申请日 2019.11.28 (71)申请人天津瑟威兰斯科技有限公司地址 300000 天津市滨海新区华苑产业区 (环外)海泰创新六路2号16号楼-2- 301-4 (72)发明人王光夫 (74)专利代理机构天津展誉专利代理有限公司 12221 代理人刘红春 (51)Int.Cl. G06K 9/00(2006.01) G06F 3/023(2006.01) (54)发明名称基于五笔输入法构建的智能汉字结构评价方法及系统 (57。

2、)摘要本发明涉及一种基于五笔输入法构建的智能汉字结构评价方法及系统，包括如下步骤：提取标准打印字体；通过五笔字型获得标准打印字体的字根编码；通过mask-rcnn预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域；提取标准打印字体各字根图像区域的特征信息；提取并识别手写汉字；通过五笔字型获得手写汉字的字根编码；通过mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域；提取手写汉字各字根图像区域的特征信息；根据特征信息对手写汉字结构进行评价，本发明采用五笔字型的字根表作为中间模块单元，将汉字结构有效的拆分，通过。

3、对特征信息分析对比，得到针对书写文字的客观评价结果。权利要求书1页说明书3页附图1页 CN 111126160 A 2020.05.08 CN 111126160 A 1.一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，包括如下步骤： a. 提取标准打印字体； b.通过五笔字型对应编码获得所述标准打印字体对应的字根编码； c. 载入所述字根编码，通过mask-rcnn预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域； d.提取标准打印字体各所述字根图像区域的特征信息； e.提取并识别手写汉字； f.通过五笔字型对应编码获得所述手写汉字对应的字根编码；。

4、 g.载入所述字根编码，通过mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域； h.提取手写汉字各所述字根图像区域的特征信息； i.根据所述特征信息对手写汉字结构进行评价。 2.根据权利要求1所述一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，步骤a或步骤e包括：通过OCR识别获得标准打印字体的汉字。 3.根据权利要求2所述一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，所述字根图像区域包括四个五笔编码区域。 4.根据权利要求3所述一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，所述字根图像区域还包括一个剩余区域。

5、，重复步骤b步骤c或步骤e步骤g，将所述剩余区域进行二级分拆。 5.根据权利要求4所述一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，步骤d或步骤h包括：提取各所述字根图像区域的重心、面积、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。 6.一种基于五笔输入法构建的智能汉字结构评价系统，其特征在于，包括：标准打印字体提取单元，用于提取标准打印字体，通过五笔字型对应编码获得标准打印字体对应的字根编码；标准打印字体分割单元，用于载入字根编码，通过mask-rcnn预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域。

6、，提取标准打印字体各字根图像区域的特征信息；手写汉字提取单元，用于提取并识别手写汉字，通过五笔字型对应编码获得手写汉字对应的字根编码；手写汉字分割单元，用于载入字根编码，通过mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域，提取手写汉字各字根图像区域的特征信息；评价单元，用于根据特征信息对手写汉字结构进行评价。 7.根据权利要求6所述一种基于五笔输入法构建的智能汉字结构评价系统，其特征在于，所述标准打印字体提取单元或手写汉字提取单元包括识别模块，所述识别模块用于通过OCR识别获得标准打印字体的汉字。 8.根据权利要求7所述一种基于。

7、五笔输入法构建的智能汉字结构评价系统，其特征在于，所述标准打印字体分割单元或手写汉字分割单元包括分析模块，所述分析模块用于提取各字根图像区域的重心、面积、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。权利要求书 1/1 页 2 CN 111126160 A 2 基于五笔输入法构建的智能汉字结构评价方法及系统技术领域 0001 本发明涉及智能化汉字书写评价技术领域，尤其涉及一种基于五笔输入法构建的智能汉字结构评价方法及系统。背景技术 0002 中国汉字的书写已成为一门艺术，文字的书写遵循一定规律的书写标准，其书写的美观和本身汉字的结构有直。

8、接关系。目前，大多以人为主观判断的方式对汉字书写质量进行评价，由于其依据主观判断进行评价，缺乏统一的标准，降低了文字评价的可靠度，无法公正、准确地评价手写汉字书写质量，因此，如何对汉字书写结构进行科学评价是目前汉字书写问题的一个痛点。综上所述，如何将这样复杂的变化通过一个通用的规则，将书写的汉字结构和例字进行有效的数字化评价，进而根据评价打分是本领域技术人员亟待解决的问题。发明内容 0003 本发明所要解决的技术问题是克服现有技术中存在的不足，提供一种基于五笔输入法构建的智能汉字结构评价方法及系统。 0004 本发明是通过以下技术方案予以实现： 000。

9、5 一种基于五笔输入法构建的智能汉字结构评价方法，其特征在于，包括如下步骤： a.提取标准打印字体； b.通过五笔字型对应编码获得所述标准打印字体对应的字根编码； c.载入所述字根编码，通过mask-rcnn预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域； d.提取标准打印字体各所述字根图像区域的特征信息； e.提取并识别手写汉字； f.通过五笔字型对应编码获得所述手写汉字对应的字根编码； g.载入所述字根编码，通过mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域； h.提取手写汉字各所述字根图像区域的特征信息； i.根据所述特征信息。

10、对手写汉字结构进行评价。 0006 根据上述技术方案，优选地，步骤a或步骤e包括：通过OCR识别获得标准打印字体的汉字。 0007 根据上述技术方案，优选地，所述字根图像区域包括四个五笔编码区域。 0008 根据上述技术方案，优选地，所述字根图像区域还包括一个剩余区域，重复步骤b 步骤c或步骤e步骤g，将所述剩余区域进行二级分拆。 0009 根据上述技术方案，优选地，步骤d或步骤h包括：提取各所述字根图像区域的重心、面积、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。 0010 本发明还公开了一种基于五笔输入法构建的智能汉字结构评价系。

11、统，其特征在于，包括：标准打印字体提取单元，用于提取标准打印字体，通过五笔字型对应编码获得标准打印字体对应的字根编码；标准打印字体分割单元，用于载入字根编码，通过mask-rcnn 预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域，提取标准打印字体说明书 1/3 页 3 CN 111126160 A 3 各字根图像区域的特征信息；手写汉字提取单元，用于提取并识别手写汉字，通过五笔字型对应编码获得手写汉字对应的字根编码；手写汉字分割单元，用于载入字根编码，通过 mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域，提取。

12、手写汉字各字根图像区域的特征信息；评价单元，用于根据特征信息对手写汉字结构进行评价。 0011 根据上述技术方案，优选地，所述标准打印字体提取单元或手写汉字提取单元包括识别模块，所述识别模块用于通过OCR识别获得标准打印字体的汉字。 0012 根据上述技术方案，优选地，所述标准打印字体分割单元或手写汉字分割单元包括分析模块，所述分析模块用于提取各字根图像区域的重心、面积、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。 0013 本发明的有益效果是： 0014 本发明采用五笔字型的字根表作为中间模块单元，通过计算机对于不同字根的训练，完。

13、成在不同汉字上将汉字结构有效的拆分成对应的字根区域，通过对标准打印字体和手写汉字各字根区域的特征信息分析对比，得到针对书写文字的客观评价结果，解决了目前仅依据评价者主观判断的方式对汉字书写进行评价的问题，从而提高汉字评价的准确性和可靠度。附图说明 0015 图1是本发明的连接示意图。具体实施方式 0016 为了使本技术领域的技术人员更好地理解本发明的技术方案，下面结合附图和最佳实施例对本发明作进一步的详细说明。 0017 如图所示，本发明包括如下步骤： a.提取标准打印字体； b.通过五笔字型对应编码获得所述标准打印字体对应的字根编码； c.载入所述字根编码，通过m。

14、ask-rcnn预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域； d.提取标准打印字体各所述字根图像区域的特征信息； e.提取并识别手写汉字； f.通过五笔字型对应编码获得所述手写汉字对应的字根编码； g.载入所述字根编码，通过mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域； h.提取手写汉字各所述字根图像区域的特征信息； i. 根据所述特征信息对手写汉字结构进行评价。在实际应用过程中，本发明还可应用于对不同字体的提取字体特征，通过对字体切割出对应的字根图像区域，对各字根图像区域进行分析评价，对该字体的书写特征做规范，用于。

15、区分其他字体。本发明采用五笔字型的字根表作为中间模块单元，通过计算机对于不同字根的训练，完成在不同汉字上将汉字结构有效的拆分成对应的字根区域，通过对标准打印字体和手写汉字各字根区域的特征信息分析对比，得到针对书写文字的客观评价结果，解决了目前仅依据评价者主观判断的方式对汉字书写进行评价的问题，从而提高汉字评价的准确性和可靠度。 0018 根据上述实施例，优选地，步骤a或步骤e包括：通过OCR识别获得标准打印字体的汉字。 0019 根据上述实施例，优选地，所述字根图像区域包括四个五笔编码区域。例如，“副” 字拆分成 “一” 图、 ” 口” 图、 ” 田” 图、。

16、 ”刂” 图，即获得的字根编码为GKLJ，输入字根编码，通过预说明书 2/3 页 4 CN 111126160 A 4 训练的字根检测模型将文字结构进行拆分。在实际应用过程中，若获得的各字根图像区域全部相同，则为独体字，此情况下可以对独体字整体进行判断后直接给出评价分数，而不需要进行对字根分割的步骤。 0020 根据上述实施例，优选地，所述字根图像区域还包括一个剩余区域，重复步骤b 步骤c或步骤e步骤g，将所述剩余区域进行二级分拆。针对于相对复杂的字体，会分割出剩余区域，当剩余区域不为空时，返回重复步骤b步骤c或步骤e步骤g，继续通过文字识别对剩余区。

17、域进行二级分拆。 0021 根据上述实施例，优选地，步骤d或步骤h包括：提取各所述字根图像区域的重心、面积、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。向量特征把提取的特征信息映射到一个统一的坐标系中，位置用x,y表示，斜率和方向用ky/x 表示，映射到统一坐标系中，用以确定各字根图像区域之间的位置关系，以及各特征信息对比分析，然后通过手写汉字向量特征和标准打印字体向量特征求距离(相似度)，根据距离的远近(相似度)来归一化成评分标准。 0022 本发明还公开了一种基于五笔输入法构建的智能汉字结构评价系统，其特征在于，包括：标准。

18、打印字体提取单元，用于提取标准打印字体，通过五笔字型对应编码获得标准打印字体对应的字根编码；标准打印字体分割单元，用于载入字根编码，通过mask-rcnn 预训练的字根检测模型，将标准打印字体切割出对应的字根图像区域，提取标准打印字体各字根图像区域的特征信息；手写汉字提取单元，用于提取并识别手写汉字，通过五笔字型对应编码获得手写汉字对应的字根编码；手写汉字分割单元，用于载入字根编码，通过 mask-rcnn预训练的字根检测模型，将手写汉字切割出对应的字根图像区域，提取手写汉字各字根图像区域的特征信息；评价单元，用于根据特征信息对手写汉字结构进行评价。。

19、评价过程中设置各特征信息之间的权重关系，计算特征向量之间距离，并归一化，并根据预设的比例加权，再将加权后的值归一映射到0-100分内，得到针对书写文字的客观评价结果，整个过程减少人为的参与，形成一套切实可用的计算机对汉字结构书写规范的评价体系，提高书写质量评价的准确性。 0023 根据上述实施例，优选地，所述标准打印字体提取单元或手写汉字提取单元包括识别模块，所述识别模块用于通过OCR识别获得标准打印字体的汉字。 0024 根据上述实施例，优选地，所述标准打印字体分割单元或手写汉字分割单元包括分析模块，所述分析模块用于提取各字根图像区域的重心、面积、。

20、各重心之间距离以及重心相对于原始书写框中心的角度和距离，获得特征向量。 0025 本发明采用五笔字型的字根表作为中间模块单元，通过计算机对于不同字根的训练，完成在不同汉字上将汉字结构有效的拆分成对应的字根区域，通过对标准打印字体和手写汉字各字根区域的特征信息分析对比，得到针对书写文字的客观评价结果，解决了目前仅依据评价者主观判断的方式对汉字书写进行评价的问题，从而提高汉字评价的准确性和可靠度。 0026 以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。说明书 3/3 页 5 CN 111126160 A 5 图1 说明书附图 1/1 页 6 CN 111126160 A 6 。

展开阅读全文

内容关键字: 基于输入法构建智能汉字结构评价方法系统