《一种证书证件文字识别方法.pdf》由会员分享,可在线阅读,更多相关《一种证书证件文字识别方法.pdf(5页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102236782 A (43)申请公布日 2011.11.09 CN 102236782 A *CN102236782A* (21)申请号 201010160255.6 (22)申请日 2010.04.30 G06K 9/00(2006.01) G06K 9/68(2006.01) (71)申请人 陈斌 地址 610000 四川省双流县华阳天府大道南 段 325 号 16 栋 1 单元 10 号 (72)发明人 陶懿 陈斌 (54) 发明名称 一种证书证件文字识别方法 (57) 摘要 本发明涉及一种证书证件文字识别方法, 其 特征在于 : 首先定义图像的特定区域, 。
2、其次, 调用 者打开中间件, 对需要识别的图像进行识别, 查找 图像样式文件, 找到图像样式文件, 从其图像对应 图像样式文件中读取其需要识别的特定区域, 然 后按其特定的需要识别与处理的区域进行识别, 并将结果返回给调用者即可, 找不到图像样式文 件, 又不定义图像样式文件时, 则视为全文识别, 然后按其特定的需要识别与处理的区域进行识 别, 并将结果返回给调用者即可, 调用者打开中间 件, 对需要识别的图像进行识别, 找不到图像样式 文件, 定义图像样式文件时, 调用者定义需要识别 的区域, 存储需要识别的区域到图像样式文件中, 定义图像样式文件, 并命名, 达成到设计目的。 (51)In。
3、t.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 1 页 说明书 2 页 附图 1 页 CN 102236786 A1/1 页 2 1. 一种证书证件文字识别方法, 其特征在于 : 首先定义图像的特定区域, 图像的特定区域是通过调用者在实际使用过程中, 对该种 类的图像建立特定的图像样式文件, 并将其需要识别的特定区域按相应的分析与处理模式 存储在在其图像样式文件中, 一个图像样式文件中可以存储该类图像的多个识别区域, 多 个识别区域包括 : 起止位置、 文字的属性 ( 类型 数字、 日期、 字符等 、 字体、 字号、 字型、 格 式、 长度、 校验码 ) 等。
4、。其次, 调用者打开中间件, 对需要识别的图像进行识别, 查找图像样 式文件, 找到对应的图像样式文件, 从其图像对应图像样式文件中读取其需要识别的特定 区域, 然后按其特定的需要识别与处理的区域进行识别, 并将结果返回给调用者。 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 又不定义图像 样式文件时, 则视为全文识别, 然后按其特定的需要识别与处理的区域进行识别, 并将结果 返回给调用者即可。 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 定义图像样式 文件时, 调用者定义需要识别的区域, 存储需要识别的区域到图像样式文件中, 定义图像样 式文。
5、件, 并命名。 权 利 要 求 书 CN 102236782 A CN 102236786 A1/2 页 3 一种证书证件文字识别方法 技术领域 0001 本发明涉及一种证书证件文字识别方法。 背景技术 0002 随着计算机信息技术的发展, 光学字符识别技术得到了广泛的应用, 光学字符识 别简称 OCR, 是 Optical Character Recognition 的简称, 尤其是对各类证件文字的识别, 得到了很好的应用, 但是目前对现有的特定类别的证书证件的特定区域的识别处理技术必 须事先经过学习并特定地加以规范而提出的预定义才能进行识别, 因此, 目前市面上的都 是对特定的证书证件的 。
6、OCR 识别软件与模块, 例如对一代身份证件的图像经过扫描后进行 OCR 识别, 对驾驶证的扫描图像的 OCR 识别等, 但是这些特定的识别均存在一个问题, 那就 是他们无法应用于别的证书证件的识别, 同时对于未来未知的证书证件的识别更是无法适 应。 发明内容 0003 本发明的目的是为研制一种解决上述问题, 采用在实际应用过程中对新增的证书 证件的样式通过预定义的方式, 并存上其需要识别的区域与格式, 然后在实际的应用时, 只 需将合符要求的证书证件的扫描或者照拍图像告之系统, 系统即可通过预先定义的样式, 对特定的区域进行 OCR 识别, 并将结果以规定的格式返回给调用者的证书证件文字识别。
7、方 法。 0004 本发明通过以下技术方案实现 : 0005 本发明是以中间件的方式提供给调用者, 供调用者调用。 0006 本发明是一种基于图像的 OCR 识别与处理方法。 0007 首先定义图像的特定区域, 图像的特定区域是通过调用者在实际使用过程中, 对 该种类的的图像建议特定的图像样式文件, 并将其需要识别的特定区域按相应的分析与处 理模式存储在在其图像样式文件中, 一个图像样式文件中可以存储该类图像的多个识别区 域, 多个识别区域包括 : 起止位置、 文字的属性 ( 类型 数字、 日期、 字符等 、 字体、 字号、 字 型、 格式、 长度、 校验码 ) 等。 0008 其次, 调用者。
8、打开中间件, 对需要识别的图像进行识别, 查找图像样式文件, 找到 图像样式文件, 从其图像对应图像样式文件中读取其需要识别的特定区域, 然后按其特定 的需要识别与处理的区域进行识别, 并将结果返回给调用者即可。 0009 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 又不定义 图像样式文件时, 则视为全文识别, 然后按其特定的需要识别与处理的区域进行识别, 并将 结果返回给调用者即可。 0010 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 定义图像 样式文件时, 调用者定义需要识别的区域, 存储需要识别的区域到图像样式文件中, 定义图 像样式。
9、文件, 并命名, 达到设计目的。 说 明 书 CN 102236782 A CN 102236786 A2/2 页 4 0011 经由本发明的实施, 适用于各类证书证件文字识别。 附图说明 0012 图 1 是本发明的方法步骤示意图。 具体实施方式 0013 下面结合附图对本发明进一步的介绍, 但不作为本发明的限定。 0014 首先定义图像的特定区域, 图像的特定区域是通过调用者在实际使用过程中, 对 该种类的的图像建议特定的图像样式文件, 并将其需要识别的特定区域按相应的分析与处 理模式存储在在其图像样式文件中, 一个图像样式文件中可以存储该类图像的多个识别区 域, 多个识别区域包括 : 起。
10、止位置、 文字的属性 ( 类型 数字、 日期、 字符等 、 字体、 字号、 字 型、 格式、 长度、 校验码 ) 等。 0015 其次, 调用者打开中间件, 对需要识别的图像进行识别, 查找图像样式文件, 找到 图像样式文件, 从其图像对应图像样式文件中读取其需要识别的特定区域, 然后按其特定 的需要识别与处理的区域进行识别, 并将结果返回给调用者即可。 0016 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 又不定义 图像样式文件时, 则视为全文识别, 然后按其特定的需要识别与处理的区域进行识别, 并将 结果返回给调用者即可。 0017 调用者打开中间件, 对需要识别的图像进行识别, 找不到图像样式文件, 定义图像 样式文件时, 调用者定义需要识别的区域, 存储需要识别的区域到图像样式文件中, 定义图 像样式文件, 并命名, 达到设计目的。 0018 本发明是以中间件的方式提供给调用者, 供调用者调用, 适用于各类证书证件文 字识别。 说 明 书 CN 102236782 A CN 102236786 A1/1 页 5 图 1 说 明 书 附 图 CN 102236782 A 。