一种证书证件文字识别方法.pdf

上传人：li****8

文档编号：5872609

上传时间：2019-03-27

格式：PDF

页数：5

大小：329.36KB

《一种证书证件文字识别方法.pdf》由会员分享，可在线阅读，更多相关《一种证书证件文字识别方法.pdf（5页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102236782 A (43)申请公布日 2011.11.09 CN 102236782 A *CN102236782A* (21)申请号 201010160255.6 (22)申请日 2010.04.30 G06K 9/00(2006.01) G06K 9/68(2006.01) (71)申请人陈斌地址 610000 四川省双流县华阳天府大道南段 325 号 16 栋 1 单元 10 号 (72)发明人陶懿陈斌 (54) 发明名称一种证书证件文字识别方法 (57) 摘要本发明涉及一种证书证件文字识别方法，其特征在于：首先定义图像的特定区域，。

2、其次，调用者打开中间件，对需要识别的图像进行识别，查找图像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可，找不到图像样式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可，调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需要识别的区域到图像样式文件中，定义图像样式文件，并命名，达成到设计目的。 (51)In。

3、t.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 1 页说明书 2 页附图 1 页 CN 102236786 A1/1 页 2 1. 一种证书证件文字识别方法，其特征在于：首先定义图像的特定区域，图像的特定区域是通过调用者在实际使用过程中，对该种类的图像建立特定的图像样式文件，并将其需要识别的特定区域按相应的分析与处理模式存储在在其图像样式文件中，一个图像样式文件中可以存储该类图像的多个识别区域，多个识别区域包括：起止位置、文字的属性 ( 类型数字、日期、字符等、字体、字号、字型、格式、长度、校验码 ) 等。

4、。其次，调用者打开中间件，对需要识别的图像进行识别，查找图像样式文件，找到对应的图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者。调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可。调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需要识别的区域到图像样式文件中，定义图像样式文。

5、件，并命名。权利要求书 CN 102236782 A CN 102236786 A1/2 页 3 一种证书证件文字识别方法技术领域 0001 本发明涉及一种证书证件文字识别方法。背景技术 0002 随着计算机信息技术的发展，光学字符识别技术得到了广泛的应用，光学字符识别简称 OCR，是 Optical Character Recognition 的简称，尤其是对各类证件文字的识别，得到了很好的应用，但是目前对现有的特定类别的证书证件的特定区域的识别处理技术必须事先经过学习并特定地加以规范而提出的预定义才能进行识别，因此，目前市面上的都是对特定的证书证件的。

6、OCR 识别软件与模块，例如对一代身份证件的图像经过扫描后进行 OCR 识别，对驾驶证的扫描图像的 OCR 识别等，但是这些特定的识别均存在一个问题，那就是他们无法应用于别的证书证件的识别，同时对于未来未知的证书证件的识别更是无法适应。发明内容 0003 本发明的目的是为研制一种解决上述问题，采用在实际应用过程中对新增的证书证件的样式通过预定义的方式，并存上其需要识别的区域与格式，然后在实际的应用时，只需将合符要求的证书证件的扫描或者照拍图像告之系统，系统即可通过预先定义的样式，对特定的区域进行 OCR 识别，并将结果以规定的格式返回给调用者的证书证件文字识别。

7、方法。 0004 本发明通过以下技术方案实现： 0005 本发明是以中间件的方式提供给调用者，供调用者调用。 0006 本发明是一种基于图像的 OCR 识别与处理方法。 0007 首先定义图像的特定区域，图像的特定区域是通过调用者在实际使用过程中，对该种类的的图像建议特定的图像样式文件，并将其需要识别的特定区域按相应的分析与处理模式存储在在其图像样式文件中，一个图像样式文件中可以存储该类图像的多个识别区域，多个识别区域包括：起止位置、文字的属性 ( 类型数字、日期、字符等、字体、字号、字型、格式、长度、校验码 ) 等。 0008 其次，调用者。

8、打开中间件，对需要识别的图像进行识别，查找图像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可。 0009 调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可。 0010 调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需要识别的区域到图像样式文件中，定义图像样式。

9、文件，并命名，达到设计目的。说明书 CN 102236782 A CN 102236786 A2/2 页 4 0011 经由本发明的实施，适用于各类证书证件文字识别。附图说明 0012 图 1 是本发明的方法步骤示意图。具体实施方式 0013 下面结合附图对本发明进一步的介绍，但不作为本发明的限定。 0014 首先定义图像的特定区域，图像的特定区域是通过调用者在实际使用过程中，对该种类的的图像建议特定的图像样式文件，并将其需要识别的特定区域按相应的分析与处理模式存储在在其图像样式文件中，一个图像样式文件中可以存储该类图像的多个识别区域，多个识别区域包括：起。

10、止位置、文字的属性 ( 类型数字、日期、字符等、字体、字号、字型、格式、长度、校验码 ) 等。 0015 其次，调用者打开中间件，对需要识别的图像进行识别，查找图像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可。 0016 调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可。 0017 调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需要识别的区域到图像样式文件中，定义图像样式文件，并命名，达到设计目的。 0018 本发明是以中间件的方式提供给调用者，供调用者调用，适用于各类证书证件文字识别。说明书 CN 102236782 A CN 102236786 A1/1 页 5 图 1 说明书附图 CN 102236782 A 。

摘要
申请专利号：	CN201010160255.6	申请日：	2010.04.30
公开号：	CN102236782A	公开日：	2011.11.09
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):G06K 9/00申请公布日:20111109\|\|\|实质审查的生效IPC(主分类):G06K 9/00申请日:20100430\|\|\|公开
IPC分类号：	G06K9/00; G06K9/68	主分类号：	G06K9/00
申请人：	陈斌
发明人：	陶懿; 陈斌
地址：	610000 四川省双流县华阳天府大道南段325号16栋1单元10号
优先权：
专利代理机构：		代理人：
PDF完整版下载：	PDF下载

内容摘要

本发明涉及一种证书证件文字识别方法，其特征在于：首先定义图像的特定区域，其次，调用者打开中间件，对需要识别的图像进行识别，查找图像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可，找不到图像样式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定的需要识别与处理的区域进行识别，并将结果返回给调用者即可，调用者打开中间件，对需要识别的图像进行识别，找不到图像样式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需要识别的区域到图像样式文件中，定义图像样式文件，并命名，达成到设计目的。

权利要求书

1.一种证书证件文字识别方法，其特征在于：
首先定义图像的特定区域，图像的特定区域是通过调用者在实际
使用过程中，对该种类的图像建立特定的图像样式文件，并将其需要
识别的特定区域按相应的分析与处理模式存储在在其图像样式文件
中，一个图像样式文件中可以存储该类图像的多个识别区域，多个识
别区域包括：起止位置、文字的属性(类型{数字、日期、字符等}、
字体、字号、字型、格式、长度、校验码)等。其次，调用者打开中
间件，对需要识别的图像进行识别，查找图像样式文件，找到对应的
图像样式文件，从其图像对应图像样式文件中读取其需要识别的特定
区域，然后按其特定的需要识别与处理的区域进行识别，并将结果返
回给调用者。
调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定
的需要识别与处理的区域进行识别，并将结果返回给调用者即可。
调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需
要识别的区域到图像样式文件中，定义图像样式文件，并命名。

说明书

一种证书证件文字识别方法

技术领域

本发明涉及一种证书证件文字识别方法。

背景技术

随着计算机信息技术的发展，光学字符识别技术得到了广泛的
应用，光学字符识别简称OCR，是Optical Character Recognition
的简称，尤其是对各类证件文字的识别，得到了很好的应用，但是目
前对现有的特定类别的证书证件的特定区域的识别处理技术必须事
先经过学习并特定地加以规范而提出的预定义才能进行识别，因此，
目前市面上的都是对特定的证书证件的OCR识别软件与模块，例如对
一代身份证件的图像经过扫描后进行OCR识别，对驾驶证的扫描图像
的OCR识别等，但是这些特定的识别均存在一个问题，那就是他们无
法应用于别的证书证件的识别，同时对于未来未知的证书证件的识别
更是无法适应。

发明内容

本发明的目的是为研制一种解决上述问题，采用在实际应用过
程中对新增的证书证件的样式通过预定义的方式，并存上其需要识别
的区域与格式，然后在实际的应用时，只需将合符要求的证书证件的
扫描或者照拍图像告之系统，系统即可通过预先定义的样式，对特定
的区域进行OCR识别，并将结果以规定的格式返回给调用者的证书证
件文字识别方法。

本发明通过以下技术方案实现：

本发明是以中间件的方式提供给调用者，供调用者调用。

本发明是一种基于图像的OCR识别与处理方法。

首先定义图像的特定区域，图像的特定区域是通过调用者在实际
使用过程中，对该种类的的图像建议特定的图像样式文件，并将其需
要识别的特定区域按相应的分析与处理模式存储在在其图像样式文
件中，一个图像样式文件中可以存储该类图像的多个识别区域，多个
识别区域包括：起止位置、文字的属性(类型{数字、日期、字符等}、
字体、字号、字型、格式、长度、校验码)等。

其次，调用者打开中间件，对需要识别的图像进行识别，查找图
像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取
其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行
识别，并将结果返回给调用者即可。

调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定
的需要识别与处理的区域进行识别，并将结果返回给调用者即可。

调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需
要识别的区域到图像样式文件中，定义图像样式文件，并命名，达到
设计目的。

经由本发明的实施，适用于各类证书证件文字识别。

附图说明

图1是本发明的方法步骤示意图。

具体实施方式

下面结合附图对本发明进一步的介绍，但不作为本发明的限定。

首先定义图像的特定区域，图像的特定区域是通过调用者在实际
使用过程中，对该种类的的图像建议特定的图像样式文件，并将其需
要识别的特定区域按相应的分析与处理模式存储在在其图像样式文
件中，一个图像样式文件中可以存储该类图像的多个识别区域，多个
识别区域包括：起止位置、文字的属性(类型{数字、日期、字符等}、
字体、字号、字型、格式、长度、校验码)等。

其次，调用者打开中间件，对需要识别的图像进行识别，查找图
像样式文件，找到图像样式文件，从其图像对应图像样式文件中读取
其需要识别的特定区域，然后按其特定的需要识别与处理的区域进行
识别，并将结果返回给调用者即可。

调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，又不定义图像样式文件时，则视为全文识别，然后按其特定
的需要识别与处理的区域进行识别，并将结果返回给调用者即可。

调用者打开中间件，对需要识别的图像进行识别，找不到图像样
式文件，定义图像样式文件时，调用者定义需要识别的区域，存储需
要识别的区域到图像样式文件中，定义图像样式文件，并命名，达到
设计目的。

本发明是以中间件的方式提供给调用者，供调用者调用，适用于
各类证书证件文字识别。