基于五笔输入法构建的智能汉字结构评价方法及系统.pdf

上传人:齐** 文档编号:10658165 上传时间:2021-08-06 格式:PDF 页数:6 大小:430.03KB
收藏 版权申诉 举报 下载
基于五笔输入法构建的智能汉字结构评价方法及系统.pdf_第1页
第1页 / 共6页
基于五笔输入法构建的智能汉字结构评价方法及系统.pdf_第2页
第2页 / 共6页
基于五笔输入法构建的智能汉字结构评价方法及系统.pdf_第3页
第3页 / 共6页
文档描述:

《基于五笔输入法构建的智能汉字结构评价方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于五笔输入法构建的智能汉字结构评价方法及系统.pdf(6页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911190076.4 (22)申请日 2019.11.28 (71)申请人 天津瑟威兰斯科技有限公司 地址 300000 天津市滨海新区华苑产业区 (环外)海泰创新六路2号16号楼-2- 301-4 (72)发明人 王光夫 (74)专利代理机构 天津展誉专利代理有限公司 12221 代理人 刘红春 (51)Int.Cl. G06K 9/00(2006.01) G06F 3/023(2006.01) (54)发明名称 基于五笔输入法构建的智能汉字结构评价 方法及系统 (57。

2、)摘要 本发明涉及一种基于五笔输入法构建的智 能汉字结构评价方法及系统, 包括如下步骤: 提 取标准打印字体; 通过五笔字型获得标准打印字 体的字根编码; 通过mask-rcnn预训练的字根检 测模型, 将标准打印字体切割出对应的字根图像 区域; 提取标准打印字体各字根图像区域的特征 信息; 提取并识别手写汉字; 通过五笔字型获得 手写汉字的字根编码; 通过mask-rcnn预训练的 字根检测模型, 将手写汉字切割出对应的字根图 像区域; 提取手写汉字各字根图像区域的特征信 息; 根据特征信息对手写汉字结构进行评价, 本 发明采用五笔字型的字根表作为中间模块单元, 将汉字结构有效的拆分, 通过。

3、对特征信息分析对 比, 得到针对书写文字的客观评价结果。 权利要求书1页 说明书3页 附图1页 CN 111126160 A 2020.05.08 CN 111126160 A 1.一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在于, 包括如下步骤: a. 提取标准打印字体; b.通过五笔字型对应编码获得所述标准打印字体对应的字根编码; c. 载入所述字根编码, 通过mask-rcnn预训练的字根检测模型, 将标准打印字体切割出对应的 字根图像区域; d.提取标准打印字体各所述字根图像区域的特征信息; e.提取并识别手写 汉字; f.通过五笔字型对应编码获得所述手写汉字对应的字根编码;。

4、 g.载入所述字根编码, 通过mask-rcnn预训练的字根检测模型, 将手写汉字切割出对应的字根图像区域; h.提取手 写汉字各所述字根图像区域的特征信息; i.根据所述特征信息对手写汉字结构进行评价。 2.根据权利要求1所述一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在 于, 步骤a或步骤e包括: 通过OCR识别获得标准打印字体的汉字。 3.根据权利要求2所述一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在 于, 所述字根图像区域包括四个五笔编码区域。 4.根据权利要求3所述一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在 于, 所述字根图像区域还包括一个剩余区域。

5、, 重复步骤b步骤c或步骤e步骤g, 将所述剩 余区域进行二级分拆。 5.根据权利要求4所述一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在 于, 步骤d或步骤h包括: 提取各所述字根图像区域的重心、 面积、 各重心之间距离以及重心 相对于原始书写框中心的角度和距离, 获得特征向量。 6.一种基于五笔输入法构建的智能汉字结构评价系统, 其特征在于, 包括: 标准打印字体提取单元, 用于提取标准打印字体, 通过五笔字型对应编码获得标准打 印字体对应的字根编码; 标准打印字体分割单元, 用于载入字根编码, 通过mask-rcnn预训练的字根检测模型, 将标准打印字体切割出对应的字根图像区域。

6、, 提取标准打印字体各字根图像区域的特征信 息; 手写汉字提取单元, 用于提取并识别手写汉字, 通过五笔字型对应编码获得手写汉字 对应的字根编码; 手写汉字分割单元, 用于载入字根编码, 通过mask-rcnn预训练的字根检测模型, 将手 写汉字切割出对应的字根图像区域, 提取手写汉字各字根图像区域的特征信息; 评价单元, 用于根据特征信息对手写汉字结构进行评价。 7.根据权利要求6所述一种基于五笔输入法构建的智能汉字结构评价系统, 其特征在 于, 所述标准打印字体提取单元或手写汉字提取单元包括识别模块, 所述识别模块用于通 过OCR识别获得标准打印字体的汉字。 8.根据权利要求7所述一种基于。

7、五笔输入法构建的智能汉字结构评价系统, 其特征在 于, 所述标准打印字体分割单元或手写汉字分割单元包括分析模块, 所述分析模块用于提 取各字根图像区域的重心、 面积、 各重心之间距离以及重心相对于原始书写框中心的角度 和距离, 获得特征向量。 权利要求书 1/1 页 2 CN 111126160 A 2 基于五笔输入法构建的智能汉字结构评价方法及系统 技术领域 0001 本发明涉及智能化汉字书写评价技术领域, 尤其涉及一种基于五笔输入法构建的 智能汉字结构评价方法及系统。 背景技术 0002 中国汉字的书写已成为一门艺术, 文字的书写遵循一定规律的书写标准, 其书写 的美观和本身汉字的结构有直。

8、接关系。 目前, 大多以人为主观判断的方式对汉字书写质量 进行评价, 由于其依据主观判断进行评价, 缺乏统一的标准, 降低了文字评价的可靠度, 无 法公正、 准确地评价手写汉字书写质量, 因此, 如何对汉字书写结构进行科学评价是目前汉 字书写问题的一个痛点。 综上所述, 如何将这样复杂的变化通过一个通用的规则, 将书写的 汉字结构和例字进行有效的数字化评价, 进而根据评价打分是本领域技术人员亟待解决的 问题。 发明内容 0003 本发明所要解决的技术问题是克服现有技术中存在的不足, 提供一种基于五笔输 入法构建的智能汉字结构评价方法及系统。 0004 本发明是通过以下技术方案予以实现: 000。

9、5 一种基于五笔输入法构建的智能汉字结构评价方法, 其特征在于, 包括如下步骤: a.提取标准打印字体; b.通过五笔字型对应编码获得所述标准打印字体对应的字根编码; c.载入所述字根编码, 通过mask-rcnn预训练的字根检测模型, 将标准打印字体切割出对应 的字根图像区域; d.提取标准打印字体各所述字根图像区域的特征信息; e.提取并识别手 写汉字; f.通过五笔字型对应编码获得所述手写汉字对应的字根编码; g.载入所述字根编 码, 通过mask-rcnn预训练的字根检测模型, 将手写汉字切割出对应的字根图像区域; h.提 取手写汉字各所述字根图像区域的特征信息; i.根据所述特征信息。

10、对手写汉字结构进行评 价。 0006 根据上述技术方案, 优选地, 步骤a或步骤e包括: 通过OCR识别获得标准打印字体 的汉字。 0007 根据上述技术方案, 优选地, 所述字根图像区域包括四个五笔编码区域。 0008 根据上述技术方案, 优选地, 所述字根图像区域还包括一个剩余区域, 重复步骤b 步骤c或步骤e步骤g, 将所述剩余区域进行二级分拆。 0009 根据上述技术方案, 优选地, 步骤d或步骤h包括: 提取各所述字根图像区域的重 心、 面积、 各重心之间距离以及重心相对于原始书写框中心的角度和距离, 获得特征向量。 0010 本发明还公开了一种基于五笔输入法构建的智能汉字结构评价系。

11、统, 其特征在 于, 包括: 标准打印字体提取单元, 用于提取标准打印字体, 通过五笔字型对应编码获得标 准打印字体对应的字根编码; 标准打印字体分割单元, 用于载入字根编码, 通过mask-rcnn 预训练的字根检测模型, 将标准打印字体切割出对应的字根图像区域, 提取标准打印字体 说明书 1/3 页 3 CN 111126160 A 3 各字根图像区域的特征信息; 手写汉字提取单元, 用于提取并识别手写汉字, 通过五笔字型 对应编码获得手写汉字对应的字根编码; 手写汉字分割单元, 用于载入字根编码, 通过 mask-rcnn预训练的字根检测模型, 将手写汉字切割出对应的字根图像区域, 提取。

12、手写汉字 各字根图像区域的特征信息; 评价单元, 用于根据特征信息对手写汉字结构进行评价。 0011 根据上述技术方案, 优选地, 所述标准打印字体提取单元或手写汉字提取单元包 括识别模块, 所述识别模块用于通过OCR识别获得标准打印字体的汉字。 0012 根据上述技术方案, 优选地, 所述标准打印字体分割单元或手写汉字分割单元包 括分析模块, 所述分析模块用于提取各字根图像区域的重心、 面积、 各重心之间距离以及重 心相对于原始书写框中心的角度和距离, 获得特征向量。 0013 本发明的有益效果是: 0014 本发明采用五笔字型的字根表作为中间模块单元, 通过计算机对于不同字根的训 练, 完。

13、成在不同汉字上将汉字结构有效的拆分成对应的字根区域, 通过对标准打印字体和 手写汉字各字根区域的特征信息分析对比, 得到针对书写文字的客观评价结果, 解决了目 前仅依据评价者主观判断的方式对汉字书写进行评价的问题, 从而提高汉字评价的准确性 和可靠度。 附图说明 0015 图1是本发明的连接示意图。 具体实施方式 0016 为了使本技术领域的技术人员更好地理解本发明的技术方案, 下面结合附图和最 佳实施例对本发明作进一步的详细说明。 0017 如图所示, 本发明包括如下步骤: a.提取标准打印字体; b.通过五笔字型对应编码 获得所述标准打印字体对应的字根编码; c.载入所述字根编码, 通过m。

14、ask-rcnn预训练的字 根检测模型, 将标准打印字体切割出对应的字根图像区域; d.提取标准打印字体各所述字 根图像区域的特征信息; e.提取并识别手写汉字; f.通过五笔字型对应编码获得所述手写 汉字对应的字根编码; g.载入所述字根编码, 通过mask-rcnn预训练的字根检测模型, 将手 写汉字切割出对应的字根图像区域; h.提取手写汉字各所述字根图像区域的特征信息; i. 根据所述特征信息对手写汉字结构进行评价。 在实际应用过程中, 本发明还可应用于对不 同字体的提取字体特征, 通过对字体切割出对应的字根图像区域, 对各字根图像区域进行 分析评价, 对该字体的书写特征做规范, 用于。

15、区分其他字体。 本发明采用五笔字型的字根表 作为中间模块单元, 通过计算机对于不同字根的训练, 完成在不同汉字上将汉字结构有效 的拆分成对应的字根区域, 通过对标准打印字体和手写汉字各字根区域的特征信息分析对 比, 得到针对书写文字的客观评价结果, 解决了目前仅依据评价者主观判断的方式对汉字 书写进行评价的问题, 从而提高汉字评价的准确性和可靠度。 0018 根据上述实施例, 优选地, 步骤a或步骤e包括: 通过OCR识别获得标准打印字体的 汉字。 0019 根据上述实施例, 优选地, 所述字根图像区域包括四个五笔编码区域。 例如,“副” 字拆分成 “一” 图、 ” 口” 图、 ” 田” 图、。

16、 ”刂” 图, 即获得的字根编码为GKLJ, 输入字根编码, 通过预 说明书 2/3 页 4 CN 111126160 A 4 训练的字根检测模型将文字结构进行拆分。 在实际应用过程中, 若获得的各字根图像区域 全部相同, 则为独体字, 此情况下可以对独体字整体进行判断后直接给出评价分数, 而不需 要进行对字根分割的步骤。 0020 根据上述实施例, 优选地, 所述字根图像区域还包括一个剩余区域, 重复步骤b 步骤c或步骤e步骤g, 将所述剩余区域进行二级分拆。 针对于相对复杂的字体, 会分割出 剩余区域, 当剩余区域不为空时, 返回重复步骤b步骤c或步骤e步骤g, 继续通过文字识 别对剩余区。

17、域进行二级分拆。 0021 根据上述实施例, 优选地, 步骤d或步骤h包括: 提取各所述字根图像区域的重心、 面积、 各重心之间距离以及重心相对于原始书写框中心的角度和距离, 获得特征向量。 向量 特征把提取的特征信息映射到一个统一的坐标系中, 位置用x,y表示, 斜率和方向用ky/x 表示, 映射到统一坐标系中, 用以确定各字根图像区域之间的位置关系, 以及各特征信息对 比分析, 然后通过手写汉字向量特征和标准打印字体向量特征求距离(相似度), 根据距离 的远近(相似度)来归一化成评分标准。 0022 本发明还公开了一种基于五笔输入法构建的智能汉字结构评价系统, 其特征在 于, 包括: 标准。

18、打印字体提取单元, 用于提取标准打印字体, 通过五笔字型对应编码获得标 准打印字体对应的字根编码; 标准打印字体分割单元, 用于载入字根编码, 通过mask-rcnn 预训练的字根检测模型, 将标准打印字体切割出对应的字根图像区域, 提取标准打印字体 各字根图像区域的特征信息; 手写汉字提取单元, 用于提取并识别手写汉字, 通过五笔字型 对应编码获得手写汉字对应的字根编码; 手写汉字分割单元, 用于载入字根编码, 通过 mask-rcnn预训练的字根检测模型, 将手写汉字切割出对应的字根图像区域, 提取手写汉字 各字根图像区域的特征信息; 评价单元, 用于根据特征信息对手写汉字结构进行评价。 。

19、评价 过程中设置各特征信息之间的权重关系, 计算特征向量之间距离, 并归一化, 并根据预设的 比例加权, 再将加权后的值归一映射到0-100分内, 得到针对书写文字的客观评价结果, 整 个过程减少人为的参与, 形成一套切实可用的计算机对汉字结构书写规范的评价体系, 提 高书写质量评价的准确性。 0023 根据上述实施例, 优选地, 所述标准打印字体提取单元或手写汉字提取单元包括 识别模块, 所述识别模块用于通过OCR识别获得标准打印字体的汉字。 0024 根据上述实施例, 优选地, 所述标准打印字体分割单元或手写汉字分割单元包括 分析模块, 所述分析模块用于提取各字根图像区域的重心、 面积、 。

20、各重心之间距离以及重心 相对于原始书写框中心的角度和距离, 获得特征向量。 0025 本发明采用五笔字型的字根表作为中间模块单元, 通过计算机对于不同字根的训 练, 完成在不同汉字上将汉字结构有效的拆分成对应的字根区域, 通过对标准打印字体和 手写汉字各字根区域的特征信息分析对比, 得到针对书写文字的客观评价结果, 解决了目 前仅依据评价者主观判断的方式对汉字书写进行评价的问题, 从而提高汉字评价的准确性 和可靠度。 0026 以上所述仅是本发明的优选实施方式, 应当指出, 对于本技术领域的普通技术人 员来说, 在不脱离本发明原理的前提下, 还可以做出若干改进和润饰, 这些改进和润饰也应 视为本发明的保护范围。 说明书 3/3 页 5 CN 111126160 A 5 图1 说明书附图 1/1 页 6 CN 111126160 A 6 。

展开阅读全文
内容关键字: 基于 输入法 构建 智能 汉字 结构 评价 方法 系统
关于本文
本文标题:基于五笔输入法构建的智能汉字结构评价方法及系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10658165.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1