针对光字符识别的码率设置方法、设备及存储介质.pdf

上传人:没水****6 文档编号:9198357 上传时间:2021-05-10 格式:PDF 页数:15 大小:600.96KB
收藏 版权申诉 举报 下载
针对光字符识别的码率设置方法、设备及存储介质.pdf_第1页
第1页 / 共15页
针对光字符识别的码率设置方法、设备及存储介质.pdf_第2页
第2页 / 共15页
针对光字符识别的码率设置方法、设备及存储介质.pdf_第3页
第3页 / 共15页
文档描述:

《针对光字符识别的码率设置方法、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《针对光字符识别的码率设置方法、设备及存储介质.pdf(15页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010116219.3 (22)申请日 2020.02.25 (71)申请人 中南大学 地址 410000 湖南省长沙市岳麓区麓山南 路932号 (72)发明人 张昊傅枧根钟培雄 (74)专利代理机构 广州嘉权专利商标事务所有 限公司 44205 代理人 肖云 (51)Int.Cl. H04N 19/124(2014.01) H04N 19/132(2014.01) H04N 19/146(2014.01) H04N 19/426(2014.01) G06K 9/00(20。

2、06.01) (54)发明名称 一种针对光字符识别的码率设置方法、 设备 及存储介质 (57)摘要 本发明公开了一种针对光字符识别的码率 设置方法、 设备及存储介质, 本方法首先对图片 进行下采样, 其次对下采样图片进行多次编码求 取使得下采样图片能够被正确识别的最优QP/ Rate值(最低的码率值/量化系数值), 然后根据 置信度神经网络求取码率增加量M/量化系数增 加量N, 最后快速找到针对该原始图片的最优编 码值, 该最优编码值是使得原始图片的光字符识 别精度不受影响的最低码率值/最低量化系数 值。 相较于现有技术, 本发明不仅可以减少网络 传输带宽, 而且针对大量数以亿计的图片也可以 。

3、减少存储空间的占用而减少成本。 而且本发明涵 盖了主流的混合编码架构的应用场景, 可以采用 任意一种图像编码标准或者视频编码标准的帧 内编码方式, 应用广泛。 权利要求书2页 说明书8页 附图4页 CN 111314697 A 2020.06.19 CN 111314697 A 1.一种针对光字符识别的码率设置方法, 其特征在于, 包括以下步骤: 设置原始图片的Rate区间, 对所述原始图片进行下采样, 得到下采样图片; 在所述Rate区间内求取所述下采样图片的最优Rate值, 所述最优Rate值为所述Rate区 间内满足以下条件的最小值: 基于所述最优Rate值对所述下采样图片进行编码, 并。

4、在解码 后能被正确识别; 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到码率增加量M; 将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值, 所述 n的取值满足以下条件: 基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进 行编码, 并在解码后能被正确识别、 以及基于所述最优Rate值加上n+1个所述码率增加量M 对所述原始图片进行编码, 并在解码后不能被正确识别。 2.根据权利要求1所述的一种针对光字符识别的码率设置方法, 其特征在于, 基于二分 法求取所述下采样图片的最优Rate值。 3.根据权利要求2所述的一种针对光字符识别的码率设。

5、置方法, 其特征在于, 所述设置 原始图片的Rate区间, 包括: 根据待选用的编码标准设置所述原始图片的Rate区间, 或者根据所述原始图片的大小 或带宽设置所述原始图片的Rate区间。 4.根据权利要求1至3任一项所述的一种针对光字符识别的码率设置方法, 其特征在 于, 所述原始图片进行下采样的倍数为0.25倍。 5.一种针对光字符识别的码率设置方法, 其特征在于, 包括以下步骤: 设置原始图片的QP区间, 对所述原始图片进行下采样, 得到下采样图片; 在所述QP区间内求取所述下采样图片的最优QP值, 所述最优QP值为所述QP区间内所有 值中满足以下条件的最小值: 基于所述最优QP值对所述。

6、下采样图片进行编码, 并在解码后 能被正确识别; 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数增加 量N; 将所述最优QP值加上n个所述量化系数增加量N设置为所述原始图片的最优编码值, 所 述n的取值满足以下条件: 基于所述最优QP值加上n个所述量化系数增加量N对所述原始图 片进行编码, 并在解码后能被正确识别、 以及基于所述最优QP值加上n+1个所述量化系数增 加量N对所述原始图片进行编码, 并在解码后不能被正确识别。 6.根据权利要求5所述的一种针对光字符识别的码率设置方法, 其特征在于, 基于二分 法求取所述下采样图片的最优QP值。 7.根据权利要求5所述的。

7、一种针对光字符识别的码率设置方法, 其特征在于, 所述设置 原始图片的QP区间, 包括: 根据待选用的编码标准设置所述原始图片的QP区间, 或者根据所述原始图片的大小或 带宽设置所述原始图片的QP区间。 8.根据权利要求5至7任一项所述的一种针对光字符识别的码率设置方法, 其特征在 于, 所述原始图片进行下采样的倍数为0.25倍。 9.一种针对光字符识别的码率设置设备, 其特征在于, 包括: 至少一个控制处理器和用 于与所述至少一个控制处理器通信连接的存储器; 所述存储器存储有可被所述至少一个控 权利要求书 1/2 页 2 CN 111314697 A 2 制处理器执行的指令, 所述指令被所述。

8、至少一个控制处理器执行, 以使所述至少一个控制 处理器能够执行如权利要求1至4任一项所述的一种针对光字符识别的码率设置方法、 以及 权利要求5至8任一项所述的一种针对光字符识别的码率设置方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机可 执行指令, 所述计算机可执行指令用于使计算机执行如权利要求1至4任一项所述的一种针 对光字符识别的码率设置方法、 以及权利要求5至8任一项所述的一种针对光字符识别的码 率设置方法。 权利要求书 2/2 页 3 CN 111314697 A 3 一种针对光字符识别的码率设置方法、 设备及存储介质 技术领域 0001 本发明。

9、涉及视频编码技术和深度学习技术领域, 特别涉及一种针对光字符识别的 码率设置方法、 设备及存储介质。 背景技术 0002 随着人工智能技术的不断发展进步, 基于移动端采集数据并进行简单的处理, 然 后传达运动进行智能分析已经普及。 其中人脸识别、 光学字符识别已经得到广泛应用。 大量 图像的传输会耗费大量带宽, 为了节省数据网络带宽, 需要对图像数据进行码率(Rate)设 置, 图片的码率最小(从而消耗的带宽最少)且图片质量影响最小, 使得光字符识别(即OCR) 效果较好。 另外, 即使是不需要网络传输, 直接在云端或本地服务器进行OCR的应用场景中, 数以亿计的图片也会占用大量存储空间。 为。

10、了降低图片存储空间而减少成本, 也有必要通 过图片快速编码的方式对图片大小进行控制, 尽量采用小的码率(即图片的体积尽量小)使 得不影响光字符识别效果。 0003 传统常用的图像编码方法有JPEG, JPEG2000等。 近些年, 视频编码标准的帧内编码 方法也可用于图像编码, 取得了比JPEG等传统方法更好的编码效率。 其中, H.264、 HEVC、 VVC、 AVS2、 AVS3、 AV1等一系列标准采用了混合编码架构, 主要针对视频编码, 但是它们的帧 内编码也逐渐被应用在图像编码上。 目前, 在众多编码标准中如何保证光字符识别的准确 率的前提下, 尽量降低图片码率也是仍待解决的问题。。

11、 发明内容 0004 本发明的目的在于至少解决现有技术中存在的技术问题之一, 提供了一种针对光 字符识别的码率设置方法、 设备及存储介质。 0005 根据本发明的实施例, 提供了一种针对光字符识别的码率设置方法, 包括以下步 骤: 0006 设置原始图片的Rate区间, 对所述原始图片进行下采样, 得到下采样图片; 0007 在所述Rate区间内求取所述下采样图片的最优Rate值, 所述最优Rate值为所述 Rate区间内满足以下条件的最小值: 基于所述最优Rate值对所述下采样图片进行编码, 并 在解码后能被正确识别; 0008 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 。

12、得到码率增加 量M; 0009 将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值, 所述n的取值满足以下条件: 基于所述最优Rate值加上n个所述码率增加量M对所述原始图 片进行编码, 并在解码后能被正确识别、 以及基于所述最优Rate值加上n+1个所述码率增加 量M对所述原始图片进行编码, 并在解码后不能被正确识别。 0010 本发明实施例提供的一种针对光字符识别的码率设置方法, 至少具有以下有益效 果: 说明书 1/8 页 4 CN 111314697 A 4 0011 (1)本方法首先对图片进行下采样, 其次对下采样图片进行多次编码求取使得下 采样图片能够被正确。

13、识别的最优Rate值(最低的码率值), 然后根据置信度神经网络求取码 率增加量M, 最后根据最优Rate值和码率增加量M快速找到针对该原始图片的最优编码值, 该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值。 相较于现有技 术, 本方法降低了编码的时间消耗。 0012 (2)本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减 少存储空间的占用而减少成本。 0013 (3)本方法涵盖了主流的混合编码架构的应用场景, 可以采用任意一种图像编码 标准或者视频编码标准的帧内编码方式, 应用广泛。 0014 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 基于二。

14、分法求取 所述下采样图片的最优Rate值。 0015 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述设置原始图 片的Rate区间, 包括: 0016 根据待选用的编码标准设置所述原始图片的Rate区间, 或者根据所述原始图片的 大小或带宽设置所述原始图片的Rate区间。 0017 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述原始图片进 行下采样的倍数为0.25倍。 0018 根据本发明的实施例, 提供了一种针对光字符识别的码率设置方法, 包括以下步 骤: 0019 设置原始图片的QP区间, 对所述原始图片进行下采样, 得到下采样图片; 0020 在所述QP区间。

15、内求取所述下采样图片的最优QP值, 所述最优QP值为所述QP区间内 所有值中满足以下条件的最小值: 基于所述最优QP值对所述下采样图片进行编码, 并在解 码后能被正确识别; 0021 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数 增加量N; 0022 将所述最优QP值加上n个所述量化系数增加量N设置为所述原始图片的最优编码 值, 所述n的取值满足以下条件: 基于所述最优QP值加上n个所述量化系数增加量N对所述原 始图片进行编码, 并在解码后能被正确识别、 以及基于所述最优QP值加上n+1个所述量化系 数增加量N对所述原始图片进行编码, 并在解码后不能被正确识别。 。

16、0023 本发明实施例提供的一种针对光字符识别的码率设置方法, 至少具有以下有益效 果: 0024 (1)本方法首先对图片进行下采样, 其次对下采样图片进行多次编码求取使得下 采样图片能够被正确识别的最优QP值(最低的量化系数值), 然后根据置信度神经网络求取 量化系数增加量N, 最后根据最优QP值和量化系数增加量N快速找到针对该原始图片的最优 编码值, 该最优编码值是使得原始图片的光字符识别精度不受影响的最低量化系数值。 相 较于现有技术, 本方法降低了编码的时间消耗。 0025 (2)本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减 少存储空间的占用而减少成本。 002。

17、6 (3)本方法涵盖了主流的混合编码架构的应用场景, 可以采用任意一种图像编码 说明书 2/8 页 5 CN 111314697 A 5 标准或者视频编码标准的帧内编码方式, 应用广泛。 0027 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 基于二分法求取 所述下采样图片的最优QP值。 0028 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述设置原始图 片的QP区间, 包括: 0029 根据待选用的编码标准设置所述原始图片的QP区间, 或者根据所述原始图片的大 小或带宽设置所述原始图片的QP区间。 0030 根据本发明实施例所述的一种针对光字符识别的码率设置方法,。

18、 所述原始图片进 行下采样的倍数为0.25倍。 0031 根据本发明的实施例, 提供了一种针对光字符识别的码率设置设备, 包括: 至少一 个控制处理器和用于与所述至少一个控制处理器通信连接的存储器; 所述存储器存储有可 被所述至少一个控制处理器执行的指令, 所述指令被所述至少一个控制处理器执行, 以使 所述至少一个控制处理器能够执行如上述的一种针对光字符识别的码率设置方法。 0032 根据本发明的实施例, 提供了一种计算机可读存储介质, 所述计算机可读存储介 质存储有计算机可执行指令, 所述计算机可执行指令用于使计算机执行如上述的一种针对 光字符识别的码率设置方法。 附图说明 0033 下面结。

19、合附图和实施例对本发明进一步地说明; 0034 图1为本发明第一实施例提供的一种针对光字符识别的码率设置方法的流程示意 图; 0035 图2为图1中步骤S102的具体流程示意图; 0036 图3为本发明第二实施例提供的一种针对光字符识别的码率设置方法的流程示意 图; 0037 图4为图2中步骤S202的具体流程示意图; 0038 图5为本发明第五实施例提供的一种针对光字符识别的码率设置设备的结构示意 图。 具体实施方式 0039 下面将结合附图, 对本公开实施例的技术方案进行清楚、 完整地描述, 显然, 所描 述的实施例仅仅是本公开一部分实施例, 而不是全部的实施例。 基于本公开的实施例, 本。

20、领 域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本公开保 护的范围。 需要说明的是, 在不冲突的情况下, 本公开实施例及实施例中的特征可以相互组 合。 另外, 附图的作用在于用图形补充说明书文字部分的描述, 使人能够直观地、 形象地理 解本公开的每个技术特征和整体技术方案, 但其不能理解为对本公开保护范围的限制。 0040 参照图1和图2, 本发明的第一实施例, 提供了一种针对光字符识别的码率设置方 法, 包括以下步骤: 0041 S101、 设置原始图片的Rate(码率)区间, 对原始图片进行下采样, 得到下采样图 片; 说明书 3/8 页 6 CN 111314。

21、697 A 6 0042 作为一种可选的实施方式, 这里可根据待选用的编码标准设置原始图片的Rate区 间, 或者可根据原始图片的大小或带宽设置原始图片的Rate区间, 具体可根据实际情况进 行调整。 例如: 以H.264编码标准软件JM对图片进行编码, 则Rate区间范围设置为100, 5000之间。 0043 作为一种可选的实施方式, 原始图片进行下采样的倍数为0.25倍。 相较于0.1倍下 采样、 0.5倍下采样等, 采用0.25倍下采样, 在较大程度上缩小了图片的尺寸, 又能够避免图 片模糊, 因此优选0.25倍下采样。 0044 S102、 基于二分法求取下采样图片的最优Rate值,。

22、 最优Rate值为Rate区间内满足 以下条件的最小值: 基于最优Rate值对下采样图片进行编码, 并在解码后能被正确识别; 0045 需要说明的是, 这里也可以通过逐次编码的方式求取下采样图片的最优Rate值, 本实施例优选基于二分法求取该最优Rate值, 能够较为快速的求取最优Rate值, 特别是当 Rate区间较大时, 使用二分法的效率能够得到极大的提升。 0046 基于二分法求取下采样图片的最优Rate值的具体步骤如下: 0047 S1021、 将下采样图片基于Rate区间的中间值进行编码; 0048 S1022、 将编码后的下采样图片解码后进行光字符识别(在移动端可以基于光字符 识别。

23、模型进行识别); 0049 S1023、 若能取得正确的识别结果, 则将Rate区间的中间值作为更新的右端点, 更 新Rate区间; 若不能取得正确的识别结果, 则将Rate区间的中间值作为更新的左端点, 更新 Rate区间; 0050 S1024、 若更新后的Rate区间左右端点对应的Rate值之差大于1, 则跳转至步骤 S1021; 若更新后的Rate区间左右端点对应的Rate值之差小于或等于1, 则进入步骤S1025; 0051 S1025、 若Rate区间的右端点能取得正确的识别结果, 则采用右端点的Rate值作为 最优Rate值; 若Rate区间的右端点不能取得正确的识别结果, 则采。

24、用左端点的Rate值作为 最优Rate值; 0052 S103、 将下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到码率增加 量M; 0053 在本步骤中, 将下采样图片输入至深度学习的置信度神经网络中, 可以得到该下 采样图片能够正确识别的置信度值, 然后进行置信度预测, 得到一个码率增加量M。 需要说 明的是, 这里的置信度预测是通过一个函数计算公式, 置信度值为输入, 码率增加量M为输 出, 例如: 当置信度的值为90时, 根据函数计算公式求出M为5; 当置信度的值为80时, 根据函 数计算公式求出M为4; 可以理解的是, 这个函数计算公式可以根据实际情况进行设置。 0054。

25、 S104、 将最优Rate值加上n个码率增加量M设置为原始图片的最优编码值, n的取值 满足以下条件: 基于最优Rate值加上n个码率增加量M对原始图片进行编码, 并在解码后能 被正确识别、 以及基于最优Rate值加上n+1个码率增加量M对原始图片进行编码, 并在解码 后不能被正确识别。 0055 本实施例提供的方法, 首先对原图片进行图片下采样; 其次基于二分法对下采样 图片进行Rate值搜索, 快速得到最优Rate值; 然后通过得到的最优Rate值来继续搜索原图 片以得到的最优编码值, 该最优编码值是使得该原图片能够满足光字符识别的精确度的最 低码率值; 本方法不仅可以减少网络传输带宽,。

26、 而且针对大量数以亿计的图片也可以减少 说明书 4/8 页 7 CN 111314697 A 7 存储空间的占用而减少成本; 本方法还可以应用在目前任意一种图像编码标准或者视频编 码标准的帧内编码方式中, 应用广泛。 0056 参照图3和图4, 本发明的第二实施例, 提供了一种针对光字符识别的码率设置方 法, 包括以下步骤: 0057 S201、 设置原始图片的QP(量化系数)区间, 对原始图片进行下采样, 得到下采样图 片; 0058 作为一种可选的实施方式, 这里可根据待选用的编码标准设置原始图片的QP区 间, 或者可根据原始图片的大小或带宽设置原始图片的QP区间, 可根据实际情况进行调整。

27、。 例如: 以H.264编码标准软件JM对图片进行编码, 则QP区间范围设置为10, 40之间。 0059 作为一种可选的实施方式, 原始图片进行下采样的倍数为0.25倍。 相较于0.1倍下 采样、 0.5倍下采样等, 采用0.25倍下采样, 在较大程度上缩小了图片的尺寸, 又能够避免图 片模糊, 因此优选0.25倍下采样。 0060 S202、 基于二分法求取下采样图片的最优QP值, 最优QP值为QP区间内所有值中满 足以下条件的最小值: 基于最优QP值对下采样图片进行编码, 并在解码后能被正确识别; 0061 需要说明的是, 这里也可以通过逐次编码的方式求取下采样图片的最优QP值, 本 实。

28、施例优选基于二分法求取该最优QP值, 能够较为快速的求取最优QP值, 特别是当QP区间 较大时, 使用二分法的效率能够得到极大的提升。 0062 基于二分法求取下采样图片的最优QP值的具体步骤如下: 0063 S2021、 将下采样图片基于QP区间的中间值进行编码; 0064 S2022、 将编码后的下采样图片解码后进行光字符识别(在移动端可以基于光字符 识别模型进行识别); 0065 S2023、 若能取得正确的识别结果, 则将QP区间的中间值作为更新的右端点, 更新 QP区间; 若不能取得正确的识别结果, 则将QP区间的中间值作为更新的左端点, 更新QP区 间; 0066 S2024、 若。

29、更新后的QP区间左右端点对应的QP值之差大于1, 则跳转至步骤S2021; 若更新后的QP区间左右端点对应的QP值之差小于或等于1, 则进入步骤S2025; 0067 S2025、 若QP区间的右端点能取得正确的识别结果, 则采用右端点的QP值作为最优 QP值; 若QP区间的右端点不能取得正确的识别结果, 则采用左端点的QP值作为最优QP值; 0068 S203、 将下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数 增加量N; 0069 在本步骤中, 将下采样图片输入至深度学习的置信度神经网络中, 可以得到该下 采样图片能够正确识别的置信度值, 然后进行置信度预测, 得到一。

30、个量化系数增加量N。 需 要说明的是, 这里的置信度预测是通过一个函数计算公式, 该函数计算公式可以根据实际 情况进行设置, 设置的原理同第一实施例相同, 此处不再细述。 0070 S204、 将最优QP值加上n个量化系数增加量N设置为原始图片的最优编码值, n的取 值满足以下条件: 基于最优QP值加上n个量化系数增加量N对原始图片进行编码, 并在解码 后能被正确识别、 以及基于最优QP值加上n+1个量化系数增加量N对原始图片进行编码, 并 在解码后不能被正确识别。 0071 本实施例提供的方法, 首先对原图片进行图片下采样; 其次基于二分法对下采样 说明书 5/8 页 8 CN 111314。

31、697 A 8 图片进行QP值搜索, 快速得到最优QP值; 然后通过得到的最优QP值来继续搜索原图片以得 到的最优编码值, 该最优编码值是使得该原图片能够满足光字符识别的精确度的最低量化 系数值; 本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减少存 储空间的占用而减少成本; 本方法还可以应用在目前任意一种图像编码标准或者视频编码 标准的帧内编码方式中, 应用广泛。 0072 需要说明的是, 由于在本领域中, QP值与Rate值是可以相互转换的, 因此, 第二实 施例与第一实施例是基于相同的发明构思。 0073 本发明的第三实施例, 提供了一种针对光字符识别的码率设置方法,。

32、 采用H.264编 码标准软件JM对图片进行编码进行举例说明, 具体步骤如下: 0074 (1)根据需求自动设置图片编码Rate的区间, 例如: 要求Rate大于100且小于5000 等, 也可以根据图片大小或带宽等条件设置区间; 0075 (2)将原图片进行1/4倍的下采样; 0076 (3)基于被下采样图片码率区间的中间值进行编码; 0077 (4)下采样图片解码后进行光字符识别(在移动端可以基于光字符识别模型进行 识别); 0078 (5)如果在Rate中间值的情况下还能取得正确的识别结果, 则将其作为更新的右 端点, 重新计算中间值为新区间的中间值; 否则, 将其作为更新的左端点; 0。

33、079 (6)重复第(3), (4), (5)步, 直到不再可分(左右端点对应的Rate值之差小于等于 1), 结束搜索过程; 如果右端点的Rate可以取得正确的识别结果, 则采用右端点的Rate编 码; 否则采用左端点的Rate进行编码; 0080 (7)将下采样图片后输入深度学习的置信度神经网络, 得到该图片能够正确识别 的置信度值, 根据置信度的值的大小得到一个码率增加量M; 0081 (8)将第(6)步最终得到下采样图片的Rate值, 作为原始图片的初始Rate值; 0082 (9)原始图片的初始Rate值继续加码率增加量M, 作为新的Rate值; 0083 (10)原始图片按照新的R。

34、ate值进行编码, 解码后进行光字符识别(在移动端可以 基于光字符识别模型进行识别)。 0084 (11)如果原始图片在当前Rate值的情况下还能取得正确的识别结果, 则重复(9), (10)步; 否则Rate值不变, 结束Rate值更新; 0085 (12)采用此时的Rate值减去固定值, 作为Rate值对原始图片编码。 0086 本实施例提供的方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片 也可以减少存储空间的占用而减少成本。 需要说明的是, 本实施例采用H.264编码标准进行 举例, 但本发明可适用于任意编码标准和方法。 0087 本发明的第四实施例, 提供了一种针对光字符识。

35、别的码率设置方法, 采用H.264编 码标准软件JM对图片进行编码进行举例说明, 具体步骤如下: 0088 (1)根据需求自动设置图片编码的QP区间; 例如: 要求QP大于10且小于40等, 也可 以根据图片大小或带宽等条件设置区间。 0089 (2)将原图片进行1/4倍的下采样。 0090 (3)基于被下采样图片QP区间的中间值进行编码。 0091 (4)下采样图片解码后进行光字符识别(在移动端可以基于光字符识别模型进行 说明书 6/8 页 9 CN 111314697 A 9 识别)。 0092 (5)如果在QP中间值的情况下还能取得正确的识别结果, 则将其作为更新的右端 点, 重新计算中。

36、间值为新区间的中间值; 否则, 将其作为更新的左端点。 0093 (6)重复第(3), (4), (5)步, 直到不再可分(左右端点对应的QP值之差小于等于1), 结束搜索过程; 如果右端点的QP/Rate可以取得正确的识别结果, 则采用右端点的QP/Rate 编码; 否则采用左端点的QP/Rate进行编码。 0094 (7)将下采样图片后输入深度学习的置信度神经网络, 得到该图片能够正确识别 的置信度值。 根据置信度的值的大小得到一个量化系数增加量N。 0095 (8)将第(6)步最终得到下采样图片QP值, 作为原始图片新的初始QP值。 0096 (9)原始图片QP值继续加量化系数增加量N,。

37、 作为新的QP值。 0097 (10)原始图片按照新的QP值进行编码, 解码后进行光字符识别(在移动端可以基 于光字符识别模型进行识别)。 0098 (11)如果原始图片在当前QP值的情况下还能取得正确的识别结果, 则重复(9), (10)步; 否则QP值不变, 结束QP值更新。 0099 (12)采用此时的QP值减去固定值, 作为QP值对原始图片编码。 0100 本实施例提供的方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片 也可以减少存储空间的占用而减少成本。 需要说明的是, 本实施例采用H.264编码标准进行 举例, 但本发明可适用于任意编码标准和方法。 0101 参照图5, 。

38、本发明的第五实施例, 还提供了一种针对光字符识别的码率设置设备, 该针对光字符识别的码率设置设备可以是任意类型的智能终端, 例如手机、 平板电脑、 个人 计算机等。 0102 具体地, 该针对光字符识别的码率设置设备包括: 一个或多个控制处理器和存储 器, 图5中以一个控制处理器为例。 控制处理器和存储器可以通过总线或者其他方式连接, 图5中以通过总线连接为例。 0103 存储器作为一种非暂态计算机可读存储介质, 可用于存储非暂态软件程序、 非暂 态性计算机可执行程序以及模块, 如本发明实施例中的针对光字符识别的码率设置设备对 应的程序指令/模块, 控制处理器通过运行存储在存储器中的非暂态软件。

39、程序、 指令以及模 块, 从而实现上述实施例所述的一种针对光字符识别的码率设置方法。 0104 存储器可以包括存储程序区和存储数据区, 其中, 存储程序区可存储操作系统、 至 少一个功能所需要的应用程序; 存储数据区可存储产生的数据。 此外, 存储器可以包括高速 随机存取存储器, 还可以包括非暂态存储器, 例如至少一个磁盘存储器件、 闪存器件、 或其 他非暂态固态存储器件。 在一些实施方式中, 存储器可选包括相对于控制处理器远程设置 的存储器, 这些远程存储器可以通过网络连接至该针对光字符识别的码率设置设备。 上述 网络的实例包括但不限于互联网、 企业内部网、 局域网、 移动通信网及其组合。 。

40、0105 所述一个或者多个模块存储在所述存储器中, 当被所述一个或者多个控制处理器 执行时, 执行上述方法实施例中的一种针对光字符识别的码率设置方法, 例如, 执行以上描 述的图1中的方法步骤S101至S104, 或者图3中的方法步骤S201至S204。 0106 本发明实施例还提供了一种计算机可读存储介质, 所述计算机可读存储介质存储 有计算机可执行指令, 该计算机可执行指令被一个或多个控制处理器执行, 例如, 被图5中 说明书 7/8 页 10 CN 111314697 A 10 的一个控制处理器执行, 可使得上述一个或多个控制处理器执行上述方法实施例中的针对 光字符识别的码率设置方法, 。

41、例如, 执行以上描述的图1中的方法步骤S101至S104, 或者图3 中的方法步骤S201至S204。 0107 以上所描述的装置实施例仅仅是示意性的, 其中所述作为分离部件说明的单元可 以是或者也可以不是物理上分开的, 即可以位于一个地方, 或者也可以分布到多个网络单 元上。 可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。 0108 通过以上的实施方式的描述, 本领域技术人员可以清楚地了解到各实施方式可借 助软件加通用硬件平台的方式来实现。 本领域技术人员可以理解实现上述实施例方法中的 全部或部分流程是可以通过计算机程序来指令相关的硬件来完成, 所述的程序可存储于一 。

42、计算机可读取存储介质中, 该程序在执行时, 可包括如上述方法的实施例的流程。 其中, 所 述的存储介质可为磁碟、 光盘、 只读存储记忆体(ReadOnly Memory, ROM)或随机存储记忆体 (Random Access Memory, RAM)等。 0109 上面结合附图对本发明实施例作了详细说明, 但是本发明不限于上述实施例, 在 所述技术领域普通技术人员所具备的知识范围内, 还可以在不脱离本发明宗旨的前提下作 出各种变化。 说明书 8/8 页 11 CN 111314697 A 11 图1 说明书附图 1/4 页 12 CN 111314697 A 12 图2 说明书附图 2/4 页 13 CN 111314697 A 13 图3 说明书附图 3/4 页 14 CN 111314697 A 14 图4 图5 说明书附图 4/4 页 15 CN 111314697 A 15 。

展开阅读全文
内容关键字: 针对 字符 识别 设置 方法 设备 存储 介质
关于本文
本文标题:针对光字符识别的码率设置方法、设备及存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9198357.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1