针对光字符识别的码率设置方法、设备及存储介质.pdf
《针对光字符识别的码率设置方法、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《针对光字符识别的码率设置方法、设备及存储介质.pdf(15页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010116219.3 (22)申请日 2020.02.25 (71)申请人 中南大学 地址 410000 湖南省长沙市岳麓区麓山南 路932号 (72)发明人 张昊傅枧根钟培雄 (74)专利代理机构 广州嘉权专利商标事务所有 限公司 44205 代理人 肖云 (51)Int.Cl. H04N 19/124(2014.01) H04N 19/132(2014.01) H04N 19/146(2014.01) H04N 19/426(2014.01) G06K 9/00(20。
2、06.01) (54)发明名称 一种针对光字符识别的码率设置方法、 设备 及存储介质 (57)摘要 本发明公开了一种针对光字符识别的码率 设置方法、 设备及存储介质, 本方法首先对图片 进行下采样, 其次对下采样图片进行多次编码求 取使得下采样图片能够被正确识别的最优QP/ Rate值(最低的码率值/量化系数值), 然后根据 置信度神经网络求取码率增加量M/量化系数增 加量N, 最后快速找到针对该原始图片的最优编 码值, 该最优编码值是使得原始图片的光字符识 别精度不受影响的最低码率值/最低量化系数 值。 相较于现有技术, 本发明不仅可以减少网络 传输带宽, 而且针对大量数以亿计的图片也可以 。
3、减少存储空间的占用而减少成本。 而且本发明涵 盖了主流的混合编码架构的应用场景, 可以采用 任意一种图像编码标准或者视频编码标准的帧 内编码方式, 应用广泛。 权利要求书2页 说明书8页 附图4页 CN 111314697 A 2020.06.19 CN 111314697 A 1.一种针对光字符识别的码率设置方法, 其特征在于, 包括以下步骤: 设置原始图片的Rate区间, 对所述原始图片进行下采样, 得到下采样图片; 在所述Rate区间内求取所述下采样图片的最优Rate值, 所述最优Rate值为所述Rate区 间内满足以下条件的最小值: 基于所述最优Rate值对所述下采样图片进行编码, 并。
4、在解码 后能被正确识别; 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到码率增加量M; 将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值, 所述 n的取值满足以下条件: 基于所述最优Rate值加上n个所述码率增加量M对所述原始图片进 行编码, 并在解码后能被正确识别、 以及基于所述最优Rate值加上n+1个所述码率增加量M 对所述原始图片进行编码, 并在解码后不能被正确识别。 2.根据权利要求1所述的一种针对光字符识别的码率设置方法, 其特征在于, 基于二分 法求取所述下采样图片的最优Rate值。 3.根据权利要求2所述的一种针对光字符识别的码率设。
5、置方法, 其特征在于, 所述设置 原始图片的Rate区间, 包括: 根据待选用的编码标准设置所述原始图片的Rate区间, 或者根据所述原始图片的大小 或带宽设置所述原始图片的Rate区间。 4.根据权利要求1至3任一项所述的一种针对光字符识别的码率设置方法, 其特征在 于, 所述原始图片进行下采样的倍数为0.25倍。 5.一种针对光字符识别的码率设置方法, 其特征在于, 包括以下步骤: 设置原始图片的QP区间, 对所述原始图片进行下采样, 得到下采样图片; 在所述QP区间内求取所述下采样图片的最优QP值, 所述最优QP值为所述QP区间内所有 值中满足以下条件的最小值: 基于所述最优QP值对所述。
6、下采样图片进行编码, 并在解码后 能被正确识别; 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数增加 量N; 将所述最优QP值加上n个所述量化系数增加量N设置为所述原始图片的最优编码值, 所 述n的取值满足以下条件: 基于所述最优QP值加上n个所述量化系数增加量N对所述原始图 片进行编码, 并在解码后能被正确识别、 以及基于所述最优QP值加上n+1个所述量化系数增 加量N对所述原始图片进行编码, 并在解码后不能被正确识别。 6.根据权利要求5所述的一种针对光字符识别的码率设置方法, 其特征在于, 基于二分 法求取所述下采样图片的最优QP值。 7.根据权利要求5所述的。
7、一种针对光字符识别的码率设置方法, 其特征在于, 所述设置 原始图片的QP区间, 包括: 根据待选用的编码标准设置所述原始图片的QP区间, 或者根据所述原始图片的大小或 带宽设置所述原始图片的QP区间。 8.根据权利要求5至7任一项所述的一种针对光字符识别的码率设置方法, 其特征在 于, 所述原始图片进行下采样的倍数为0.25倍。 9.一种针对光字符识别的码率设置设备, 其特征在于, 包括: 至少一个控制处理器和用 于与所述至少一个控制处理器通信连接的存储器; 所述存储器存储有可被所述至少一个控 权利要求书 1/2 页 2 CN 111314697 A 2 制处理器执行的指令, 所述指令被所述。
8、至少一个控制处理器执行, 以使所述至少一个控制 处理器能够执行如权利要求1至4任一项所述的一种针对光字符识别的码率设置方法、 以及 权利要求5至8任一项所述的一种针对光字符识别的码率设置方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机可 执行指令, 所述计算机可执行指令用于使计算机执行如权利要求1至4任一项所述的一种针 对光字符识别的码率设置方法、 以及权利要求5至8任一项所述的一种针对光字符识别的码 率设置方法。 权利要求书 2/2 页 3 CN 111314697 A 3 一种针对光字符识别的码率设置方法、 设备及存储介质 技术领域 0001 本发明。
9、涉及视频编码技术和深度学习技术领域, 特别涉及一种针对光字符识别的 码率设置方法、 设备及存储介质。 背景技术 0002 随着人工智能技术的不断发展进步, 基于移动端采集数据并进行简单的处理, 然 后传达运动进行智能分析已经普及。 其中人脸识别、 光学字符识别已经得到广泛应用。 大量 图像的传输会耗费大量带宽, 为了节省数据网络带宽, 需要对图像数据进行码率(Rate)设 置, 图片的码率最小(从而消耗的带宽最少)且图片质量影响最小, 使得光字符识别(即OCR) 效果较好。 另外, 即使是不需要网络传输, 直接在云端或本地服务器进行OCR的应用场景中, 数以亿计的图片也会占用大量存储空间。 为。
10、了降低图片存储空间而减少成本, 也有必要通 过图片快速编码的方式对图片大小进行控制, 尽量采用小的码率(即图片的体积尽量小)使 得不影响光字符识别效果。 0003 传统常用的图像编码方法有JPEG, JPEG2000等。 近些年, 视频编码标准的帧内编码 方法也可用于图像编码, 取得了比JPEG等传统方法更好的编码效率。 其中, H.264、 HEVC、 VVC、 AVS2、 AVS3、 AV1等一系列标准采用了混合编码架构, 主要针对视频编码, 但是它们的帧 内编码也逐渐被应用在图像编码上。 目前, 在众多编码标准中如何保证光字符识别的准确 率的前提下, 尽量降低图片码率也是仍待解决的问题。。
11、 发明内容 0004 本发明的目的在于至少解决现有技术中存在的技术问题之一, 提供了一种针对光 字符识别的码率设置方法、 设备及存储介质。 0005 根据本发明的实施例, 提供了一种针对光字符识别的码率设置方法, 包括以下步 骤: 0006 设置原始图片的Rate区间, 对所述原始图片进行下采样, 得到下采样图片; 0007 在所述Rate区间内求取所述下采样图片的最优Rate值, 所述最优Rate值为所述 Rate区间内满足以下条件的最小值: 基于所述最优Rate值对所述下采样图片进行编码, 并 在解码后能被正确识别; 0008 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 。
12、得到码率增加 量M; 0009 将所述最优Rate值加上n个所述码率增加量M设置为所述原始图片的最优编码值, 所述n的取值满足以下条件: 基于所述最优Rate值加上n个所述码率增加量M对所述原始图 片进行编码, 并在解码后能被正确识别、 以及基于所述最优Rate值加上n+1个所述码率增加 量M对所述原始图片进行编码, 并在解码后不能被正确识别。 0010 本发明实施例提供的一种针对光字符识别的码率设置方法, 至少具有以下有益效 果: 说明书 1/8 页 4 CN 111314697 A 4 0011 (1)本方法首先对图片进行下采样, 其次对下采样图片进行多次编码求取使得下 采样图片能够被正确。
13、识别的最优Rate值(最低的码率值), 然后根据置信度神经网络求取码 率增加量M, 最后根据最优Rate值和码率增加量M快速找到针对该原始图片的最优编码值, 该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值。 相较于现有技 术, 本方法降低了编码的时间消耗。 0012 (2)本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减 少存储空间的占用而减少成本。 0013 (3)本方法涵盖了主流的混合编码架构的应用场景, 可以采用任意一种图像编码 标准或者视频编码标准的帧内编码方式, 应用广泛。 0014 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 基于二。
14、分法求取 所述下采样图片的最优Rate值。 0015 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述设置原始图 片的Rate区间, 包括: 0016 根据待选用的编码标准设置所述原始图片的Rate区间, 或者根据所述原始图片的 大小或带宽设置所述原始图片的Rate区间。 0017 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述原始图片进 行下采样的倍数为0.25倍。 0018 根据本发明的实施例, 提供了一种针对光字符识别的码率设置方法, 包括以下步 骤: 0019 设置原始图片的QP区间, 对所述原始图片进行下采样, 得到下采样图片; 0020 在所述QP区间。
15、内求取所述下采样图片的最优QP值, 所述最优QP值为所述QP区间内 所有值中满足以下条件的最小值: 基于所述最优QP值对所述下采样图片进行编码, 并在解 码后能被正确识别; 0021 将所述下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数 增加量N; 0022 将所述最优QP值加上n个所述量化系数增加量N设置为所述原始图片的最优编码 值, 所述n的取值满足以下条件: 基于所述最优QP值加上n个所述量化系数增加量N对所述原 始图片进行编码, 并在解码后能被正确识别、 以及基于所述最优QP值加上n+1个所述量化系 数增加量N对所述原始图片进行编码, 并在解码后不能被正确识别。 。
16、0023 本发明实施例提供的一种针对光字符识别的码率设置方法, 至少具有以下有益效 果: 0024 (1)本方法首先对图片进行下采样, 其次对下采样图片进行多次编码求取使得下 采样图片能够被正确识别的最优QP值(最低的量化系数值), 然后根据置信度神经网络求取 量化系数增加量N, 最后根据最优QP值和量化系数增加量N快速找到针对该原始图片的最优 编码值, 该最优编码值是使得原始图片的光字符识别精度不受影响的最低量化系数值。 相 较于现有技术, 本方法降低了编码的时间消耗。 0025 (2)本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减 少存储空间的占用而减少成本。 002。
17、6 (3)本方法涵盖了主流的混合编码架构的应用场景, 可以采用任意一种图像编码 说明书 2/8 页 5 CN 111314697 A 5 标准或者视频编码标准的帧内编码方式, 应用广泛。 0027 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 基于二分法求取 所述下采样图片的最优QP值。 0028 根据本发明实施例所述的一种针对光字符识别的码率设置方法, 所述设置原始图 片的QP区间, 包括: 0029 根据待选用的编码标准设置所述原始图片的QP区间, 或者根据所述原始图片的大 小或带宽设置所述原始图片的QP区间。 0030 根据本发明实施例所述的一种针对光字符识别的码率设置方法,。
18、 所述原始图片进 行下采样的倍数为0.25倍。 0031 根据本发明的实施例, 提供了一种针对光字符识别的码率设置设备, 包括: 至少一 个控制处理器和用于与所述至少一个控制处理器通信连接的存储器; 所述存储器存储有可 被所述至少一个控制处理器执行的指令, 所述指令被所述至少一个控制处理器执行, 以使 所述至少一个控制处理器能够执行如上述的一种针对光字符识别的码率设置方法。 0032 根据本发明的实施例, 提供了一种计算机可读存储介质, 所述计算机可读存储介 质存储有计算机可执行指令, 所述计算机可执行指令用于使计算机执行如上述的一种针对 光字符识别的码率设置方法。 附图说明 0033 下面结。
19、合附图和实施例对本发明进一步地说明; 0034 图1为本发明第一实施例提供的一种针对光字符识别的码率设置方法的流程示意 图; 0035 图2为图1中步骤S102的具体流程示意图; 0036 图3为本发明第二实施例提供的一种针对光字符识别的码率设置方法的流程示意 图; 0037 图4为图2中步骤S202的具体流程示意图; 0038 图5为本发明第五实施例提供的一种针对光字符识别的码率设置设备的结构示意 图。 具体实施方式 0039 下面将结合附图, 对本公开实施例的技术方案进行清楚、 完整地描述, 显然, 所描 述的实施例仅仅是本公开一部分实施例, 而不是全部的实施例。 基于本公开的实施例, 本。
20、领 域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本公开保 护的范围。 需要说明的是, 在不冲突的情况下, 本公开实施例及实施例中的特征可以相互组 合。 另外, 附图的作用在于用图形补充说明书文字部分的描述, 使人能够直观地、 形象地理 解本公开的每个技术特征和整体技术方案, 但其不能理解为对本公开保护范围的限制。 0040 参照图1和图2, 本发明的第一实施例, 提供了一种针对光字符识别的码率设置方 法, 包括以下步骤: 0041 S101、 设置原始图片的Rate(码率)区间, 对原始图片进行下采样, 得到下采样图 片; 说明书 3/8 页 6 CN 111314。
21、697 A 6 0042 作为一种可选的实施方式, 这里可根据待选用的编码标准设置原始图片的Rate区 间, 或者可根据原始图片的大小或带宽设置原始图片的Rate区间, 具体可根据实际情况进 行调整。 例如: 以H.264编码标准软件JM对图片进行编码, 则Rate区间范围设置为100, 5000之间。 0043 作为一种可选的实施方式, 原始图片进行下采样的倍数为0.25倍。 相较于0.1倍下 采样、 0.5倍下采样等, 采用0.25倍下采样, 在较大程度上缩小了图片的尺寸, 又能够避免图 片模糊, 因此优选0.25倍下采样。 0044 S102、 基于二分法求取下采样图片的最优Rate值,。
22、 最优Rate值为Rate区间内满足 以下条件的最小值: 基于最优Rate值对下采样图片进行编码, 并在解码后能被正确识别; 0045 需要说明的是, 这里也可以通过逐次编码的方式求取下采样图片的最优Rate值, 本实施例优选基于二分法求取该最优Rate值, 能够较为快速的求取最优Rate值, 特别是当 Rate区间较大时, 使用二分法的效率能够得到极大的提升。 0046 基于二分法求取下采样图片的最优Rate值的具体步骤如下: 0047 S1021、 将下采样图片基于Rate区间的中间值进行编码; 0048 S1022、 将编码后的下采样图片解码后进行光字符识别(在移动端可以基于光字符 识别。
23、模型进行识别); 0049 S1023、 若能取得正确的识别结果, 则将Rate区间的中间值作为更新的右端点, 更 新Rate区间; 若不能取得正确的识别结果, 则将Rate区间的中间值作为更新的左端点, 更新 Rate区间; 0050 S1024、 若更新后的Rate区间左右端点对应的Rate值之差大于1, 则跳转至步骤 S1021; 若更新后的Rate区间左右端点对应的Rate值之差小于或等于1, 则进入步骤S1025; 0051 S1025、 若Rate区间的右端点能取得正确的识别结果, 则采用右端点的Rate值作为 最优Rate值; 若Rate区间的右端点不能取得正确的识别结果, 则采。
24、用左端点的Rate值作为 最优Rate值; 0052 S103、 将下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到码率增加 量M; 0053 在本步骤中, 将下采样图片输入至深度学习的置信度神经网络中, 可以得到该下 采样图片能够正确识别的置信度值, 然后进行置信度预测, 得到一个码率增加量M。 需要说 明的是, 这里的置信度预测是通过一个函数计算公式, 置信度值为输入, 码率增加量M为输 出, 例如: 当置信度的值为90时, 根据函数计算公式求出M为5; 当置信度的值为80时, 根据函 数计算公式求出M为4; 可以理解的是, 这个函数计算公式可以根据实际情况进行设置。 0054。
25、 S104、 将最优Rate值加上n个码率增加量M设置为原始图片的最优编码值, n的取值 满足以下条件: 基于最优Rate值加上n个码率增加量M对原始图片进行编码, 并在解码后能 被正确识别、 以及基于最优Rate值加上n+1个码率增加量M对原始图片进行编码, 并在解码 后不能被正确识别。 0055 本实施例提供的方法, 首先对原图片进行图片下采样; 其次基于二分法对下采样 图片进行Rate值搜索, 快速得到最优Rate值; 然后通过得到的最优Rate值来继续搜索原图 片以得到的最优编码值, 该最优编码值是使得该原图片能够满足光字符识别的精确度的最 低码率值; 本方法不仅可以减少网络传输带宽,。
26、 而且针对大量数以亿计的图片也可以减少 说明书 4/8 页 7 CN 111314697 A 7 存储空间的占用而减少成本; 本方法还可以应用在目前任意一种图像编码标准或者视频编 码标准的帧内编码方式中, 应用广泛。 0056 参照图3和图4, 本发明的第二实施例, 提供了一种针对光字符识别的码率设置方 法, 包括以下步骤: 0057 S201、 设置原始图片的QP(量化系数)区间, 对原始图片进行下采样, 得到下采样图 片; 0058 作为一种可选的实施方式, 这里可根据待选用的编码标准设置原始图片的QP区 间, 或者可根据原始图片的大小或带宽设置原始图片的QP区间, 可根据实际情况进行调整。
27、。 例如: 以H.264编码标准软件JM对图片进行编码, 则QP区间范围设置为10, 40之间。 0059 作为一种可选的实施方式, 原始图片进行下采样的倍数为0.25倍。 相较于0.1倍下 采样、 0.5倍下采样等, 采用0.25倍下采样, 在较大程度上缩小了图片的尺寸, 又能够避免图 片模糊, 因此优选0.25倍下采样。 0060 S202、 基于二分法求取下采样图片的最优QP值, 最优QP值为QP区间内所有值中满 足以下条件的最小值: 基于最优QP值对下采样图片进行编码, 并在解码后能被正确识别; 0061 需要说明的是, 这里也可以通过逐次编码的方式求取下采样图片的最优QP值, 本 实。
28、施例优选基于二分法求取该最优QP值, 能够较为快速的求取最优QP值, 特别是当QP区间 较大时, 使用二分法的效率能够得到极大的提升。 0062 基于二分法求取下采样图片的最优QP值的具体步骤如下: 0063 S2021、 将下采样图片基于QP区间的中间值进行编码; 0064 S2022、 将编码后的下采样图片解码后进行光字符识别(在移动端可以基于光字符 识别模型进行识别); 0065 S2023、 若能取得正确的识别结果, 则将QP区间的中间值作为更新的右端点, 更新 QP区间; 若不能取得正确的识别结果, 则将QP区间的中间值作为更新的左端点, 更新QP区 间; 0066 S2024、 若。
29、更新后的QP区间左右端点对应的QP值之差大于1, 则跳转至步骤S2021; 若更新后的QP区间左右端点对应的QP值之差小于或等于1, 则进入步骤S2025; 0067 S2025、 若QP区间的右端点能取得正确的识别结果, 则采用右端点的QP值作为最优 QP值; 若QP区间的右端点不能取得正确的识别结果, 则采用左端点的QP值作为最优QP值; 0068 S203、 将下采样图片输入至置信度神经网络中, 并进行置信度预测, 得到量化系数 增加量N; 0069 在本步骤中, 将下采样图片输入至深度学习的置信度神经网络中, 可以得到该下 采样图片能够正确识别的置信度值, 然后进行置信度预测, 得到一。
30、个量化系数增加量N。 需 要说明的是, 这里的置信度预测是通过一个函数计算公式, 该函数计算公式可以根据实际 情况进行设置, 设置的原理同第一实施例相同, 此处不再细述。 0070 S204、 将最优QP值加上n个量化系数增加量N设置为原始图片的最优编码值, n的取 值满足以下条件: 基于最优QP值加上n个量化系数增加量N对原始图片进行编码, 并在解码 后能被正确识别、 以及基于最优QP值加上n+1个量化系数增加量N对原始图片进行编码, 并 在解码后不能被正确识别。 0071 本实施例提供的方法, 首先对原图片进行图片下采样; 其次基于二分法对下采样 说明书 5/8 页 8 CN 111314。
31、697 A 8 图片进行QP值搜索, 快速得到最优QP值; 然后通过得到的最优QP值来继续搜索原图片以得 到的最优编码值, 该最优编码值是使得该原图片能够满足光字符识别的精确度的最低量化 系数值; 本方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片也可以减少存 储空间的占用而减少成本; 本方法还可以应用在目前任意一种图像编码标准或者视频编码 标准的帧内编码方式中, 应用广泛。 0072 需要说明的是, 由于在本领域中, QP值与Rate值是可以相互转换的, 因此, 第二实 施例与第一实施例是基于相同的发明构思。 0073 本发明的第三实施例, 提供了一种针对光字符识别的码率设置方法,。
32、 采用H.264编 码标准软件JM对图片进行编码进行举例说明, 具体步骤如下: 0074 (1)根据需求自动设置图片编码Rate的区间, 例如: 要求Rate大于100且小于5000 等, 也可以根据图片大小或带宽等条件设置区间; 0075 (2)将原图片进行1/4倍的下采样; 0076 (3)基于被下采样图片码率区间的中间值进行编码; 0077 (4)下采样图片解码后进行光字符识别(在移动端可以基于光字符识别模型进行 识别); 0078 (5)如果在Rate中间值的情况下还能取得正确的识别结果, 则将其作为更新的右 端点, 重新计算中间值为新区间的中间值; 否则, 将其作为更新的左端点; 0。
33、079 (6)重复第(3), (4), (5)步, 直到不再可分(左右端点对应的Rate值之差小于等于 1), 结束搜索过程; 如果右端点的Rate可以取得正确的识别结果, 则采用右端点的Rate编 码; 否则采用左端点的Rate进行编码; 0080 (7)将下采样图片后输入深度学习的置信度神经网络, 得到该图片能够正确识别 的置信度值, 根据置信度的值的大小得到一个码率增加量M; 0081 (8)将第(6)步最终得到下采样图片的Rate值, 作为原始图片的初始Rate值; 0082 (9)原始图片的初始Rate值继续加码率增加量M, 作为新的Rate值; 0083 (10)原始图片按照新的R。
34、ate值进行编码, 解码后进行光字符识别(在移动端可以 基于光字符识别模型进行识别)。 0084 (11)如果原始图片在当前Rate值的情况下还能取得正确的识别结果, 则重复(9), (10)步; 否则Rate值不变, 结束Rate值更新; 0085 (12)采用此时的Rate值减去固定值, 作为Rate值对原始图片编码。 0086 本实施例提供的方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片 也可以减少存储空间的占用而减少成本。 需要说明的是, 本实施例采用H.264编码标准进行 举例, 但本发明可适用于任意编码标准和方法。 0087 本发明的第四实施例, 提供了一种针对光字符识。
35、别的码率设置方法, 采用H.264编 码标准软件JM对图片进行编码进行举例说明, 具体步骤如下: 0088 (1)根据需求自动设置图片编码的QP区间; 例如: 要求QP大于10且小于40等, 也可 以根据图片大小或带宽等条件设置区间。 0089 (2)将原图片进行1/4倍的下采样。 0090 (3)基于被下采样图片QP区间的中间值进行编码。 0091 (4)下采样图片解码后进行光字符识别(在移动端可以基于光字符识别模型进行 说明书 6/8 页 9 CN 111314697 A 9 识别)。 0092 (5)如果在QP中间值的情况下还能取得正确的识别结果, 则将其作为更新的右端 点, 重新计算中。
36、间值为新区间的中间值; 否则, 将其作为更新的左端点。 0093 (6)重复第(3), (4), (5)步, 直到不再可分(左右端点对应的QP值之差小于等于1), 结束搜索过程; 如果右端点的QP/Rate可以取得正确的识别结果, 则采用右端点的QP/Rate 编码; 否则采用左端点的QP/Rate进行编码。 0094 (7)将下采样图片后输入深度学习的置信度神经网络, 得到该图片能够正确识别 的置信度值。 根据置信度的值的大小得到一个量化系数增加量N。 0095 (8)将第(6)步最终得到下采样图片QP值, 作为原始图片新的初始QP值。 0096 (9)原始图片QP值继续加量化系数增加量N,。
37、 作为新的QP值。 0097 (10)原始图片按照新的QP值进行编码, 解码后进行光字符识别(在移动端可以基 于光字符识别模型进行识别)。 0098 (11)如果原始图片在当前QP值的情况下还能取得正确的识别结果, 则重复(9), (10)步; 否则QP值不变, 结束QP值更新。 0099 (12)采用此时的QP值减去固定值, 作为QP值对原始图片编码。 0100 本实施例提供的方法不仅可以减少网络传输带宽, 而且针对大量数以亿计的图片 也可以减少存储空间的占用而减少成本。 需要说明的是, 本实施例采用H.264编码标准进行 举例, 但本发明可适用于任意编码标准和方法。 0101 参照图5, 。
38、本发明的第五实施例, 还提供了一种针对光字符识别的码率设置设备, 该针对光字符识别的码率设置设备可以是任意类型的智能终端, 例如手机、 平板电脑、 个人 计算机等。 0102 具体地, 该针对光字符识别的码率设置设备包括: 一个或多个控制处理器和存储 器, 图5中以一个控制处理器为例。 控制处理器和存储器可以通过总线或者其他方式连接, 图5中以通过总线连接为例。 0103 存储器作为一种非暂态计算机可读存储介质, 可用于存储非暂态软件程序、 非暂 态性计算机可执行程序以及模块, 如本发明实施例中的针对光字符识别的码率设置设备对 应的程序指令/模块, 控制处理器通过运行存储在存储器中的非暂态软件。
39、程序、 指令以及模 块, 从而实现上述实施例所述的一种针对光字符识别的码率设置方法。 0104 存储器可以包括存储程序区和存储数据区, 其中, 存储程序区可存储操作系统、 至 少一个功能所需要的应用程序; 存储数据区可存储产生的数据。 此外, 存储器可以包括高速 随机存取存储器, 还可以包括非暂态存储器, 例如至少一个磁盘存储器件、 闪存器件、 或其 他非暂态固态存储器件。 在一些实施方式中, 存储器可选包括相对于控制处理器远程设置 的存储器, 这些远程存储器可以通过网络连接至该针对光字符识别的码率设置设备。 上述 网络的实例包括但不限于互联网、 企业内部网、 局域网、 移动通信网及其组合。 。
40、0105 所述一个或者多个模块存储在所述存储器中, 当被所述一个或者多个控制处理器 执行时, 执行上述方法实施例中的一种针对光字符识别的码率设置方法, 例如, 执行以上描 述的图1中的方法步骤S101至S104, 或者图3中的方法步骤S201至S204。 0106 本发明实施例还提供了一种计算机可读存储介质, 所述计算机可读存储介质存储 有计算机可执行指令, 该计算机可执行指令被一个或多个控制处理器执行, 例如, 被图5中 说明书 7/8 页 10 CN 111314697 A 10 的一个控制处理器执行, 可使得上述一个或多个控制处理器执行上述方法实施例中的针对 光字符识别的码率设置方法, 。
41、例如, 执行以上描述的图1中的方法步骤S101至S104, 或者图3 中的方法步骤S201至S204。 0107 以上所描述的装置实施例仅仅是示意性的, 其中所述作为分离部件说明的单元可 以是或者也可以不是物理上分开的, 即可以位于一个地方, 或者也可以分布到多个网络单 元上。 可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。 0108 通过以上的实施方式的描述, 本领域技术人员可以清楚地了解到各实施方式可借 助软件加通用硬件平台的方式来实现。 本领域技术人员可以理解实现上述实施例方法中的 全部或部分流程是可以通过计算机程序来指令相关的硬件来完成, 所述的程序可存储于一 。
42、计算机可读取存储介质中, 该程序在执行时, 可包括如上述方法的实施例的流程。 其中, 所 述的存储介质可为磁碟、 光盘、 只读存储记忆体(ReadOnly Memory, ROM)或随机存储记忆体 (Random Access Memory, RAM)等。 0109 上面结合附图对本发明实施例作了详细说明, 但是本发明不限于上述实施例, 在 所述技术领域普通技术人员所具备的知识范围内, 还可以在不脱离本发明宗旨的前提下作 出各种变化。 说明书 8/8 页 11 CN 111314697 A 11 图1 说明书附图 1/4 页 12 CN 111314697 A 12 图2 说明书附图 2/4 页 13 CN 111314697 A 13 图3 说明书附图 3/4 页 14 CN 111314697 A 14 图4 图5 说明书附图 4/4 页 15 CN 111314697 A 15 。
- 内容关键字: 针对 字符 识别 设置 方法 设备 存储 介质
腰椎牵引床.pdf
纸质文档扫描装置.pdf
具有节能功能的燃气流量控制装置.pdf
新型切料刀具.pdf
高压二极管加工转换组件.pdf
节能防水绝缘分支电缆.pdf
箱包坯体修边机.pdf
绿色节能建筑墙体.pdf
三联体结构金属型模具.pdf
水库坝体除险加固装置.pdf
管柱筒双向镗孔加工工装.pdf
悬挂式振动放矿机.pdf
光伏支架用焊接定位装置.pdf
建筑施工用墙体钻孔装置.pdf
建筑机电安装用电缆架设装置.pdf
建筑构件拆除设备.pdf
自动排气过滤器.pdf
药用空心胶囊生产线输送装置.pdf
用于管道内壁涂层的预处理磨平装置.pdf
图像的处理方法、装置及设备.pdf
矿井水的膜过滤装置.pdf
用于除尘设备的通风调节机构.pdf
混凝土管片抗裂性能试验装置及测试方法.pdf
受电弓滑板及其制作方法.pdf
井口取样放空截止装置及其使用方法.pdf
用于智能网联汽车的测试系统.pdf
通过低温钎焊制作氮化物陶瓷覆铜板的方法.pdf
基于EMPC模式的智能建造方法及系统.pdf
钢铁表面缺陷分割方法、装置、电子设备及存储介质.pdf
自限温电伴热带.pdf
基于WebGL的自动驾驶可视化方法.pdf
生物膜载体及生物膜反应器.pdf
一种升降式旋转室外消火栓.pdf
框架结构T型连接柱.pdf
防静电地板吸板器.pdf
一种建筑用箱体或井口预留孔洞活动模具.pdf
速成拉建房屋.pdf
预制桥面板精轧螺纹钢筋弧形连接构造.pdf
一种内固定式伸缩门滑行导轨及伸缩门.pdf
多用途封井器.pdf
一种新型圆弧建筑模板紧固件.pdf
一种超实木防水组合踢脚线.pdf
电气柜前门板门锁装置.pdf
双人正杆器.pdf
一种纳米铝塑复合板.pdf
强磁打捞器.pdf
一种基于无刷直流电机的环卫车电动扫盘系统.pdf
一种可调节型门铰链.pdf
一种用于基桩竖向抗压静载试验的船筏式试验装置.pdf
免贴墙砖.pdf
一种聚氨酯仿石材防火保温装饰复合板.pdf