基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf

上传人:刘** 文档编号:12175033 上传时间:2021-11-29 格式:PDF 页数:23 大小:1.51MB
收藏 版权申诉 举报 下载
基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf_第1页
第1页 / 共23页
基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf_第2页
第2页 / 共23页
基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf_第3页
第3页 / 共23页
文档描述:

《基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf》由会员分享,可在线阅读,更多相关《基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf(23页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910034979.7 (22)申请日 2019.01.15 (71)申请人 宁波大学科学技术学院 地址 315212 浙江省宁波市镇海区庄市街 道毓秀路505号 (72)发明人 骆挺许辰蒋刚毅徐海勇 姜求平钟才明 (74)专利代理机构 宁波奥圣专利代理事务所 (普通合伙) 33226 代理人 周珏 (51)Int.Cl. G06T 7/00(2017.01) G06K 9/62(2006.01) (54)发明名称 一种基于稀疏表示的自然图像恰可察觉失 真阈值估计方法 (5。

2、7)摘要 本发明公开了一种基于稀疏表示的自然图 像恰可察觉失真阈值估计方法, 其对训练集中的 高清自然图像进行分不重叠的图像块处理, 通过 计算图像块中的所有像素点的像素值的平均方 差, 选择部分图像块构成训练矩阵, 将训练矩阵 代入K-VSD算法中进行字典训练得到过完备字 典; 对待处理的自然图像进行分重叠的图像块处 理, 将所有图像块和过完备字典代入OMP算法中 得到稀疏系数矩阵, 根据稀疏系数矩阵获取结构 层图像和非结构层图像, 利用不同的计算方式获 取结构层图像和非结构层图像各自的恰可察觉 失真阈值图, 进而融合得到待处理的自然图像的 恰可察觉失真阈值图; 优点是其能估计得到准确 的恰。

3、可察觉失真阈值图, 与人眼主观视觉感知具 有更好的一致性。 权利要求书3页 说明书9页 附图10页 CN 109872302 A 2019.06.11 CN 109872302 A 1.一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法, 其特征在于包括以下步 骤: 步骤一: 将待处理的自然图像记为Ses; 然后以尺寸大小为88像素的滑动窗口, 以滑动 步长为1像素在Ses中滑动, 将Ses划分成多个尺寸大小为88像素的重叠的图像块; 其中, Ses 的宽度为W且高度为H; 步骤二: 训练一个过完备字典, 记为D; 其中, D的维数为64256; 步骤三: 将Ses中的所有图像块和D代入OMP。

4、算法中, 得到Ses的稀疏系数矩阵, 记为X; 其 中, X的维数为WH; 步骤四: 获取Ses的结构层图像和非结构层图像, 对应记为Ses-si和Ses-nosi, 将Ses-si中坐标 位置为(u,v)的像素点的像素值记为Ses-si(u,v), Ses-si(u,v)X(u,v); 将Ses-nosi中坐标位置 为(u,v)的像素点的像素值记为Ses-nosi(u,v), Ses-nosi(u,v)Ses(u,v)-Ses-si(u,v); 其中, 1 uW,1vH, X(u,v)表示X中下标为(u,v)的系数, Ses(u,v)表示Ses中坐标位置为(u,v)的 像素点的像素值; 步骤。

5、五: 利用亮度适应性方程和对比度掩模方程计算得到Ses-si的恰可察觉失真阈值 图, 记为JNDsi; 并利用结构不确定度和亮度适应性方程计算得到Ses-nosi的恰可察觉失真阈 值图, 记为JNDnosi; 再利用NAMM融合模型将JNDsi和JNDnosi相互融合, 得到Ses的恰可察觉失真 阈值图。 2.根据权利要求1所述的一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法, 其特征在于所述的步骤二中D的获取过程为: a1、 随机选取Num1幅不同内容的高清自然图像构成训练集; 其中, Num150; a2、 将训练集中的每幅高清自然图像划分成个尺寸大小为88像素的互不 重叠的图像块; 。

6、然后计算训练集中的每幅高清自然图像中的每个图像块中的所有像素点的 像素值的平均方差, 将训练集中的第n1幅高清自然图像中的第i个图像块中的所有像素点 的像素值的平均方差记为接着对训练集中的每幅高清自然图像中的所有图像块对 应的平均方差按从大到小的顺序进行排列, 并从训练集中的每幅高清自然图像中选取出前 Num2个平均方差对应的图像块; 再将从训练集中的所有高清自然图像中选取出的Num1 Num2个图像块构成训练矩阵, 记为Z,其中, 符号为向下取整运 算符号, n1和i均为正整数, 且初始值均为1, 1n1Num1,Num21000, 符 号 “ ” 为向量或矩阵表示符号, Z1表示从训练集中。

7、的第1幅高清自然图像中选取出的Num2 个图像块构成的维数为8Num28的矩阵, Z2表示从训练集中的第2幅高清自然图像中选取出 的Num2个图像块构成的维数为8Num28的矩阵,表示从训练集中的第Num1幅高清自然 图像中选取出的Num2个图像块构成的维数为8Num28的矩阵, Z的维数为8Num28Num1; a3、 将Z代入K-VSD算法中进行字典训练, 得到过完备字典D。 3.根据权利要求1或2所述的一种基于稀疏表示的自然图像恰可察觉失真阈值估计方 法, 其特征在于所述的步骤五中的JNDnosi的获取过程为: 权利要求书 1/3 页 2 CN 109872302 A 2 b1、 将Se。

8、s-nosi中当前待处理的像素点定义为当前像素点; b2、 设当前像素点在Ses-nosi中的坐标位置为(u,v); b3、 计算当前像素点的灰度值, 记为g(u,v); 并计算当前像素点的33像素邻域内的每 个邻域像素点的灰度值, 将当前像素点的33像素邻域内的第p个邻域像素点的灰度值记 为g(u,v,p); 其中, p为正整数, p的初始值为1, 1pP, P表示当前像素点的33像素邻域 内的邻域像素点的总个数, P2,5,8; b4、 采 用亮度适应性方程 , 计算当前像素点的亮度适应性值 , 记为LA( u ,v ), 然后计算当前像素点的空域分布特性, 记为LBP(u,v),再计算L。

9、BP(u,v)的概率分布特性, 记 为(u,v); 其中, B(u,v)表示当前像素点的33像素邻域的背景亮度, g(u,v,p)表示当前像素 点的33像素邻域内的第p个邻域像素点的灰度值, J()表示符号状态函数, 符号 “” 为取绝对值符号, g(u,v,p-1)表示当前像素点的33像素邻域内的第p-1个邻 域像素点的灰度值; b5、 将Ses-nosi中下一个待处理的像素点作为当前像素点, 然后返回步骤b2继续执行, 直 至Ses-nosi中的所有像素点处理完毕, 得到Ses-nosi中的每个像素点的空域分布特性的概率分 布特性; b6、 根据Ses-nosi中的每个像素点的33像素邻域。

10、内的各个邻域像素点的空域分布特性 的概率分布特性, 并利用香浓信息熵, 计算Ses-nosi中的每个像素点的结构不确定度, 将 Se s - n o s i中 坐 标 位 置 为 ( u ,v ) 的 像 素 点 的 结 构 不 确 定 度 记 为 H( u , v ), 然后对Ses-nosi中的每个像素点的结构不确定度进行非线性 转换, 得到Ses-nosi中的每个像素点的结构不确定度的非线性转换值, 将H(u,v)的非线性转换 值记为H(u,v); 其中, (u,v,p)表示Ses-nosi中坐标位置为(u,v)的像素点的33像素邻域内的 第p个邻域像素点的空域分布特性的概率分布特性; 。

11、b7、 计算Ses-nosi中的每个像素点的亮度对比度, 将Ses-nosi中坐标位置为(u,v)的像素点 权利要求书 2/3 页 3 CN 109872302 A 3 的亮度对比度记为f(u ,v),其中, 和 均为常数, 均取正整数, E(u,v)表示Ses-nosi中坐标位置为(u,v)的像素点的边缘亮度高度, E(u,v)max(Gradk(Ses-nosi (u,v), max()为取最大值函数, Gradk()表示第k个方向的滤波器, k1,2,3,4, 第1个方 向为水平方向, 第2个方向为垂直方向, 第3个方向为主对角线方向, 第4个方向为副对角线 方向; b8、 根据Ses-。

12、nosi中的每个像素点的结构不确定度的非线性转换值和亮度对比度, 计算 Ses-nosi中的每个像素点的恰可察觉失真阈值, 将Ses-nosi中坐标位置为(u,v)的像素点的恰可 察 觉 失 真 阈 值 记 为 J N Dn o s i( u ,v ) , J N Dn o s i( u ,v ) f( u , v )( u , v ), 再根据Ses-nosi中的所有像素点的恰可察觉失真阈 值, 得到JNDnosi; 其中, (u,v)表示f(u,v)与H(u,v)的交互值, k为比例参数, exp()表示以自然 基数e为底的指数函数, 为f(u,v)与H(u,v)的交互衰减系数。 权利要求。

13、书 3/3 页 4 CN 109872302 A 4 一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法 技术领域 0001 本发明涉及一种图像信号处理方法, 尤其是涉及一种基于稀疏表示的自然图像恰 可察觉失真阈值估计方法。 背景技术 0002 人类视觉系统作为中枢神经系统的重要组成部分, 其能够对外界输入的视觉信息 进行高效地感知与处理。 现有的研究表明, 人眼对于不同自然图像内容具有不同的分辨能 力。 主观实验研究表明, 人眼仅能察觉到处于一定阈值以上的图像内容变化, 该临界值(即 阈值)通常被称为恰可察觉失真(JND)阈值。 图像的JND阈值度量对图像的压缩编码、 质量评 价以及超分辨率。

14、重建等诸多图像处理应用具有重要的指导意义。 0003 经典的像素域JND模型由亮度适应性方程和对比度掩模方程两部分组成, 然而, 由 于该模型主要作用于图像边缘区域, 因此导致高估了图像边缘区域的JND阈值。 0004 脑科学和神经科学家们研究提出了自由能量理论, 该研究表明作为一个高度智能 的视觉信息处理系统, 人类视觉系统在理解和感知自然图像时能够积极预测和推导自然图 像中蕴含的确定信息(大体结构)而忽略剩余的不确定信息(杂乱细节)。 也就是说, 给定输 入图像, 大脑并非对输入的视觉信息进行完全处理, 而是具备一种内在推导机制使之能够 对图像的大体结构等确定信息进行主动预测, 同时忽略残。

15、余的杂乱细节等不确定信息, 从 而实现对图像的理解和感知。 由自由能量理论启发, 对于自然图像中特征不同的区域, JND 阈值差异很大, 因此如何可以更加精准地划分图像区域, 如何度量不同区域的JND阈值, 都 是对于恰可察觉失真预测模型需要研究解决的问题。 发明内容 0005 本发明所要解决的技术问题是提供一种基于稀疏表示的自然图像恰可察觉失真 阈值估计方法, 其能够估计得到准确的恰可察觉失真阈值图, 与人眼主观视觉感知具有更 好的一致性。 0006 本发明解决上述技术问题所采用的技术方案为: 一种基于稀疏表示的自然图像恰 可察觉失真阈值估计方法, 其特征在于包括以下步骤: 0007 步骤一。

16、: 将待处理的自然图像记为Ses; 然后以尺寸大小为88像素的滑动窗口, 以 滑动步长为1像素在Ses中滑动, 将Ses划分成多个尺寸大小为88像素的重叠的图像块; 其 中, Ses的宽度为W且高度为H; 0008 步骤二: 训练一个过完备字典, 记为D; 其中, D的维数为64256; 0009 步骤三: 将Ses中的所有图像块和D代入OMP算法中, 得到Ses的稀疏系数矩阵, 记为 X; 其中, X的维数为WH; 0010 步骤四: 获取Ses的结构层图像和非结构层图像, 对应记为Ses-si和Ses-nosi, 将Ses-si 中坐标位置为(u,v)的像素点的像素值记为Ses-si(u,。

17、v), Ses-si(u,v)X(u,v); 将Ses-nosi中坐 标位置为(u,v)的像素点的像素值记为Ses-nosi(u,v), Ses-nosi(u,v)Ses(u,v)-Ses-si(u,v); 说明书 1/9 页 5 CN 109872302 A 5 其中, 1uW,1vH, X(u,v)表示X中下标为(u,v)的系数, Ses(u,v)表示Ses中坐标位置为 (u,v)的像素点的像素值; 0011 步骤五: 利用亮度适应性方程和对比度掩模方程计算得到Ses-si的恰可察觉失真阈 值图, 记为JNDsi; 并利用结构不确定度和亮度适应性方程计算得到Ses-nosi的恰可察觉失真 。

18、阈值图, 记为JNDnosi; 再利用NAMM融合模型将JNDsi和JNDnosi相互融合, 得到Ses的恰可察觉失 真阈值图。 0012 所述的步骤二中D的获取过程为: 0013 a1、 随机选取Num1幅不同内容的高清自然图像构成训练集; 其中, Num150; 0014a2、 将训练集中的每幅高清自然图像划分成个尺寸大小为88像素的 互不重叠的图像块; 然后计算训练集中的每幅高清自然图像中的每个图像块中的所有像素 点的像素值的平均方差, 将训练集中的第n1幅高清自然图像中的第i个图像块中的所有像 素点的像素值的平均方差记为vern1,i; 接着对训练集中的每幅高清自然图像中的所有图像 块。

19、对应的平均方差按从大到小的顺序进行排列, 并从训练集中的每幅高清自然图像中选取 出前Num2个平均方差对应的图像块; 再将从训练集中的所有高清自然图像中选取出的Num1 Num2个图像块构成训练矩阵, 记为Z,其中, 符号为向下取整 运算符号, n1和i均为正整数, 且初始值均为1, 1n1Num1,Num21000, 符号为向量或矩阵表示符号, Z1表示从训练集中的第1幅高清自然图像中选取出的 Num2个图像块构成的维数为8Num28的矩阵, Z2表示从训练集中的第2幅高清自然图像中选 取出的Num2个图像块构成的维数为8Num28的矩阵,表示从训练集中的第Num1幅高清 自然图像中选取出的。

20、Num2个图像块构成的维数为8Num28的矩阵, Z的维数为8Num2 8Num1; 0015 a3、 将Z代入K-VSD算法中进行字典训练, 得到过完备字典D。 0016 所述的步骤五中的JNDnosi的获取过程为: 0017 b1、 将Ses-nosi中当前待处理的像素点定义为当前像素点; 0018 b2、 设当前像素点在Ses-nosi中的坐标位置为(u,v); 0019 b3、 计算当前像素点的灰度值, 记为g(u,v); 并计算当前像素点的33像素邻域内 的每个邻域像素点的灰度值, 将当前像素点的33像素邻域内的第p个邻域像素点的灰度 值记为g(u,v,p); 其中, p为正整数, 。

21、p的初始值为1, 1pP, P表示当前像素点的33像素 邻域内的邻域像素点的总个数, P2,5,8; 0020 b4、 采用亮度适应性方程, 计算当前像素点的亮度适应性值, 记为LA(u,v), 然后计算当前像素点的空域分布特性, 说明书 2/9 页 6 CN 109872302 A 6 记为LBP(u,v),再计算LBP(u,v)的概率分布特性, 记 为(u,v); 其中, B(u,v)表示当前像素点的33像素邻域的背景亮度, g(u,v,p)表示当前像素 点的33像素邻域内的第p个邻域像素点的灰度值, J()表示符号状态函数, 0021 0022 符号 “|” 为取绝对值符号, g(u,v。

22、,p-1)表示当前像素点的33像素邻域内的第p- 1个邻域像素点的灰度值; 0023 b5、 将Ses-nosi中下一个待处理的像素点作为当前像素点, 然后返回步骤b2继续执 行, 直至Ses-nosi中的所有像素点处理完毕, 得到Ses-nosi中的每个像素点的空域分布特性的概 率分布特性; 0024 b6、 根据Ses-nosi中的每个像素点的33像素邻域内的各个邻域像素点的空域分布 特性的概率分布特性, 并利用香浓信息熵, 计算Ses-nosi中的每个像素点的结构不确定度, 将 Se s - n o s i中 坐 标 位 置 为 ( u ,v ) 的 像 素 点 的 结 构 不 确 定 。

23、度 记 为 H( u , v ), 然后对Ses-nosi中的每个像素点的结构不确定度进行非线性 转换, 得到Ses-nosi中的每个像素点的结构不确定度的非线性转换值, 将H(u,v)的非线性转换 值记为H(u,v); 其中, (u,v,p)表示Ses-nosi中坐标位置为(u,v)的像素点的33像素邻域内的 第p个邻域像素点的空域分布特性的概率分布特性; 0025 b7、 计算Ses-nosi中的每个像素点的亮度对比度, 将Ses-nosi中坐标位置为(u,v)的像 素点的亮度对比度记为f(u,v),其中, 和 均为常数, 均取正整 数, E(u,v)表示Ses-nosi中坐标位置为(u,。

24、v)的像素点的边缘亮度高度, E(u,v)max(Gradk (Ses-nosi(u,v), max()为取最大值函数, Gradk()表示第k个方向的滤波器, k1,2,3,4, 第 1个方向为水平方向, 第2个方向为垂直方向, 第3个方向为主对角线方向, 第4个方向为副对 角线方向; 0026 b8、 根据Ses-nosi中的每个像素点的结构不确定度的非线性转换值和亮度对比度, 计算Ses-nosi中的每个像素点的恰可察觉失真阈值, 将Ses-nosi中坐标位置为(u,v)的像素点的 恰 可 察 觉 失 真 阈 值 记 为 J N Dn o s i(u ,v) , J N Dn o s i。

25、(u ,v) f( u , v )( u , v ), 再根据Ses-nosi中的所有像素点的恰可察觉失真阈 说明书 3/9 页 7 CN 109872302 A 7 值, 得到JNDnosi; 其中, (u,v)表示f(u,v)与H(u,v)的交互值, k为比例参数, exp()表示以自然 基数e为底的指数函数, 为f(u,v)与H(u,v)的交互衰减系数。 0027 与现有技术相比, 本发明的优点在于: 0028 本发明方法利用过完备字典对自然图像进行稀疏表示即获取自然图像的稀疏系 数矩阵, 进而得到自然图像的结构层图像和非结构层图像, 针对结构层图像, 利用现有的亮 度适应性方程和现有的。

26、对比度掩模方程来计算结构层图像的恰可察觉失真阈值图; 而针对 非结构层图像, 则利用结构不确定度和现有的亮度适应性方程来计算非结构层图像的恰可 察觉失真阈值图, 最终利用现有的NAMM融合模型融合两幅恰可察觉失真阈值图得到自然图 像的恰可察觉失真阈值图, 通过实验表明本发明方法获得的自然图像的恰可察觉失真阈值 图与人眼主观视觉感知具有更好的一致性。 附图说明 0029 图1为本发明方法的总体实现框图; 0030 图2a为一幅自然图像; 0031 图2b为图2a所示的自然图像的结构层图像; 0032 图2c为图2a所示的自然图像的非结构层图像; 0033 图3a为图2b所示的结构层图像的恰可察觉。

27、失真阈值图; 0034 图3b为图2c所示的非结构层图像的恰可察觉失真阈值图; 0035 图3c为融合图3a所示的恰可察觉失真阈值图和图3b所示的恰可察觉失真阈值图 得到的恰可察觉失真阈值图; 0036 图4为Indian图像; 0037 图5a为图4中区域A的放大图; 0038 图5b为噪声通过Liu2010JND计算模型注入图5a后得到的JND噪声污染图; 0039 图5c为噪声通过Wu2013JND计算模型注入图5a后得到的JND噪声污染图; 0040 图5d为噪声通过Wu2017JND计算模型注入图5a后得到的JND噪声污染图; 0041 图5e为噪声通过利用本发明方法对图5a进行处理。

28、后得到的恰可察觉失真阈值图 注入图5a后得到的JND噪声污染图; 0042 图6a为图4中区域B的放大图; 0043 图6b为噪声通过Liu2010JND计算模型注入图6a后得到的JND噪声污染图; 0044 图6c为噪声通过Wu2013JND计算模型注入图6a后得到的JND噪声污染图; 0045 图6d为噪声通过Wu2017JND计算模型注入图6a后得到的JND噪声污染图; 0046 图6e为噪声通过利用本发明方法对图6a进行处理后得到的恰可察觉失真阈值图 注入图6a后得到的JND噪声污染图; 0047 图7a为图4中区域C的放大图; 0048 图7b为噪声通过Liu2010JND计算模型注。

29、入图7a后得到的JND噪声污染图; 0049 图7c为噪声通过Wu2013JND计算模型注入图7a后得到的JND噪声污染图; 0050 图7d为噪声通过Wu2017JND计算模型注入图7a后得到的JND噪声污染图; 0051 图7e为噪声通过利用本发明方法对图7a进行处理后得到的恰可察觉失真阈值图 注入图7a后得到的JND噪声污染图; 说明书 4/9 页 8 CN 109872302 A 8 0052 图8为Lena图像; 0053 图9a为图8中区域A的放大图; 0054 图9b为噪声通过Liu2010JND计算模型注入图9a后得到的JND噪声污染图; 0055 图9c为噪声通过Wu2013。

30、JND计算模型注入图9a后得到的JND噪声污染图; 0056 图9d为噪声通过Wu2017JND计算模型注入图9a后得到的JND噪声污染图; 0057 图9e为噪声通过利用本发明方法对图9a进行处理后得到的恰可察觉失真阈值图 注入图9a后得到的JND噪声污染图; 0058 图10a为图8中区域B的放大图; 0059 图10b为噪声通过Liu2010JND计算模型注入图10a后得到的JND噪声污染图; 0060 图10c为噪声通过Wu2013JND计算模型注入图10a后得到的JND噪声污染图; 0061 图10d为噪声通过Wu2017JND计算模型对图10a进行处理后得到的JND噪声污染图; 0。

31、062 图10e为噪声通过利用本发明方法对图10a进行处理后得到的恰可察觉失真阈值 图注入图10a后得到的JND噪声污染图; 0063 图11a为图8中区域C的放大图; 0064 图11b为噪声通过Liu2010JND计算模型注入图11a后得到的JND噪声污染图; 0065 图11c为噪声通过Wu2013JND计算模型注入图11a后得到的JND噪声污染图; 0066 图11d为噪声通过Wu2017JND计算模型注入图11a后得到的JND噪声污染图; 0067 图11e为噪声通过利用本发明方法对图11a进行处理后得到的恰可察觉失真阈值 图注入图11a后得到的JND噪声污染图。 具体实施方式 00。

32、68 以下结合附图实施例对本发明作进一步详细描述。 0069 本发明提出的一种基于稀疏表示的自然图像恰可察觉失真阈值估计方法, 其总体 实现框图如图1所示, 其包括以下步骤: 0070 步骤一: 将待处理的自然图像记为Ses; 然后以尺寸大小为88像素的滑动窗口, 以 滑动步长为1像素在Ses中滑动, 将Ses划分成多个尺寸大小为88像素的重叠的图像块; 其 中, Ses的宽度为W且高度为H。 0071 步骤二: 训练一个过完备字典, 记为D; 其中, D的维数为64256。 0072 在此具体实施例中, 步骤二中D的获取过程为: 0073 a1、 随机选取Num1幅不同内容的高清自然图像构成。

33、训练集; 其中, Num150; 实验过 程中, 为了保证训练的过完备字典更具有普适性, 随机选取90(Num190)幅不同内容的高 清自然图像构成训练集, 可以直接从图像数据库中选取, 高清自然图像要求清晰度在720p 以上。 0074a2、 将训练集中的每幅高清自然图像划分成个尺寸大小为88像素的 互不重叠的图像块; 然后计算训练集中的每幅高清自然图像中的每个图像块中的所有像素 点的像素值的平均方差, 将训练集中的第n1幅高清自然图像中的第i个图像块中的所有像 素点的像素值的平均方差记为vern1,i; 接着对训练集中的每幅高清自然图像中的所有图像 块对应的平均方差按从大到小的顺序进行排列。

34、, 并从训练集中的每幅高清自然图像中选取 说明书 5/9 页 9 CN 109872302 A 9 出前Num2个平均方差对应的图像块; 再将从训练集中的所有高清自然图像中选取出的Num1 Num2个图像块构成训练矩阵, 记为Z,其中, 符号为向下取整 运算符号, n1和i均为正整数, 且初始值均为1, 1n1Num1,Num21000, 符号 “ ” 为向量或矩阵表示符号, Z1表示从训练集中的第1幅高清自然图像中选取出的 Num2个图像块构成的维数为8Num28的矩阵, 即为从训练集中的第1幅高清自然图像中选取 出的Num2个图像块在列向上排列构成, Z2表示从训练集中的第2幅高清自然图像。

35、中选取出的 Num2个图像块构成的维数为8Num28的矩阵, 即为从训练集中的第2幅高清自然图像中选取 出的Num2个图像块在列向上排列构成,表示从训练集中的第Num1幅高清自然图像中选 取出的Num2个图像块构成的维数为8Num28的矩阵, 即为从训练集中的第Num1幅高清自然 图像中选取出的Num2个图像块在列向上排列构成, Z的维数为8Num28Num1。 0075 a3、 将Z代入现有的K-VSD算法中进行字典训练, 得到过完备字典D。 0076 步骤三: 将Ses中的所有图像块和D代入现有的OMP(正交匹配追踪)算法中, 得到Ses 的稀疏系数矩阵, 记为X; 其中, X的维数为WH。

36、。 0077 步骤四: 获取Ses的结构层图像和非结构层图像, 对应记为Ses-si和Ses-nosi, 将Ses-si 中坐标位置为(u,v)的像素点的像素值记为Ses-si(u,v), Ses-si(u,v)X(u,v); 将Ses-nosi中坐 标位置为(u,v)的像素点的像素值记为Ses-nosi(u,v), Ses-nosi(u,v)Ses(u,v)-Ses-si(u,v); 其中, 1uW,1vH, X(u,v)表示X中下标为(u,v)的系数, Ses(u,v)表示Ses中坐标位置为 (u,v)的像素点的像素值。 0078 图2a给出了一幅自然图像, 图2b给出了图2a所示的自然图。

37、像的结构层图像, 图2c 给出了图2a所示的自然图像的非结构层图像。 0079 步骤五: 利用现有的亮度适应性方程和现有的对比度掩模方程计算得到Ses-si的恰 可察觉失真阈值图, 记为JNDsi; 并利用结构不确定度和现有的亮度适应性方程计算得到 Ses-nosi的恰可察觉失真阈值图, 记为JNDnosi; 再利用现有的NAMM融合模型将JNDsi和JNDnosi相 互融合, 得到Ses的恰可察觉失真阈值图。 0080 在此具体实施例中, 步骤五中的JNDnosi的获取过程为: 0081 b1、 将Ses-nosi中当前待处理的像素点定义为当前像素点。 0082 b2、 设当前像素点在Ses。

38、-nosi中的坐标位置为(u,v)。 0083 b3、 计算当前像素点的灰度值, 记为g(u,v); 并计算当前像素点的33像素邻域内 的每个邻域像素点的灰度值, 将当前像素点的33像素邻域内的第p个邻域像素点的灰度 值记为g(u,v,p); 其中, p为正整数, p的初始值为1, 1pP, P表示当前像素点的33像素 邻域内的邻域像素点的总个数, P2,5,8。 0084 b4、 采用亮度适应性方程, 计算当前像素点的亮度适应性值, 记为LA(u ,v), 然后计算当前像素点的空域分布特性, 说明书 6/9 页 10 CN 109872302 A 10 记为LBP(u,v),再计算LBP(u。

39、,v)的概率分布特性, 记 为(u,v); 其中, B(u,v)表示当前像素点的33像素邻域的背景亮度, g(u,v,p)表示当前像素 点的33像素邻域内的第p个邻域像素点的灰度值, J()表示符号状态函数, 0085 0086 符号 “|” 为取绝对值符号, g(u,v,p-1)表示当前像素点的33像素邻域内的第p- 1个邻域像素点的灰度值。 0087 b5、 将Ses-nosi中下一个待处理的像素点作为当前像素点, 然后返回步骤b2继续执 行, 直至Ses-nosi中的所有像素点处理完毕, 得到Ses-nosi中的每个像素点的空域分布特性的概 率分布特性。 0088 b6、 根据Ses-n。

40、osi中的每个像素点的33像素邻域内的各个邻域像素点的空域分布 特性的概率分布特性, 并利用香浓信息熵, 计算Ses-nosi中的每个像素点的结构不确定度, 将 Se s - n o s i中 坐 标 位 置 为 ( u ,v ) 的 像 素 点 的 结 构 不 确 定 度 记 为 H( u , v ), 然后对Ses-nosi中的每个像素点的结构不确定度进行非线性 转换, 得到Ses-nosi中的每个像素点的结构不确定度的非线性转换值, 将H(u,v)的非线性转换 值记为H(u,v),其中, (u,v,p)表示Ses-nosi中坐标位置为 (u,v)的像素点的33像素邻域内的第p个邻域像素点。

41、的空域分布特性的概率分布特性, k1、 k2、 k3均为用于决定非线性转换函数N()形状的三个固定参数, 取k12.67、 k23.22、 k3 1.19。 0089 b7、 计算Ses-nosi中的每个像素点的亮度对比度, 将Ses-nosi中坐标位置为(u,v)的像 素点的亮度对比度记为f(u,v),其中, 和 均为常数, 均取正整 数, 在本实施例中取 16、 26, E(u,v)表示Ses-nosi中坐标位置为(u,v)的像素点的边缘亮 度高度, E(u,v)max(Gradk(Ses-nosi(u,v), max()为取最大值函数, Gradk()表示第k个方向 的滤波器, k1,2。

42、,3,4, 第1个方向为水平方向, 第2个方向为垂直方向, 第3个方向为主对角 线方向, 第4个方向为副对角线方向。 0090 b8、 根据Ses-nosi中的每个像素点的结构不确定度的非线性转换值和亮度对比度, 说明书 7/9 页 11 CN 109872302 A 11 计算Ses-nosi中的每个像素点的恰可察觉失真阈值, 将Ses-nosi中坐标位置为(u,v)的像素点的 恰 可 察 觉 失 真 阈 值 记 为 J N Dn o s i(u ,v) , J N Dn o s i(u ,v) f( u , v )( u , v ), 再根据Ses-nosi中的所有像素点的恰可察觉失真阈 。

43、值, 得到JNDnosi; 其中, (u,v)表示f(u,v)与H(u,v)的交互值, k为比例参数, 在本实施例中取k 2.03, exp()表示以自然基数e为底的指数函数, 为f(u,v)与H(u,v)的交互衰减系数, 在本 实施例中取 0.19。 0091 图3a给出了图2b所示的结构层图像的恰可察觉失真阈值图, 图3b给出了图2c所示 的非结构层图像的恰可察觉失真阈值图, 图3c给出了融合图3a所示的恰可察觉失真阈值图 和图3b所示的恰可察觉失真阈值图得到的恰可察觉失真阈值图。 0092 为进一步说明本发明方法的有效性和可行性, 对本发明方法进行试验。 0093 以下就本发明方法对宁波。

44、大学建立的数据图像库中随机抽取的两幅自然图像 (Indian图像、 Lena图像)进行验证, 同时选取三个不同年份的JND计算模型(Liu2010、 Wu2013和Wu2017)与本发明方法进行对比。 0094 为了进一步验证本发明方法的性能, 从每一副自然图像中分别截取三个具有代表 性的局部区域进行更加清晰的实验对比。 0095 图4给出了Indian图像及在该图像中圈出的三个比较明显、 容易辨别的区域A、 B、 C, 分别通过四个不同的JND计算模型向Indian图像中注入等量的噪声。 图5a给出了图4中区 域A的放大图, 图5b给出了噪声通过Liu2010JND计算模型注入图5a后得到的。

45、JND噪声污染 图, 图5c给出了噪声通过Wu2013JND计算模型注入图5a后得到的JND噪声污染图, 图5d给出 了噪声通过Wu2017JND计算模型注入图5a后得到的JND噪声污染图, 图5e给出了噪声通过利 用本发明方法对图5a进行处理后得到的恰可察觉失真阈值图注入图5a后得到的JND噪声污 染图。 图6a给出了图4中区域B的放大图, 图6b给出了噪声通过Liu2010JND计算模型注入图 6a后得到的JND噪声污染图, 图6c给出了噪声通过Wu2013JND计算模型注入图6a后得到的 JND噪声污染图, 图6d给出了噪声通过Wu2017JND计算模型注入图6a后得到的JND噪声污染 。

46、图, 图6e给出了噪声通过利用本发明方法对图6a进行处理后得到的恰可察觉失真阈值图注 入图6a后得到的JND噪声污染图。 图7a给出了图4中区域C的放大图, 图7b给出了噪声通过 Liu2010JND计算模型注入图7a后得到的JND噪声污染图, 图7c给出了噪声通过Wu2013JND计 算模型注入图7a后得到的JND噪声污染图, 图7d给出了噪声通过Wu2017JND计算模型注入图 7a后得到的JND噪声污染图, 图7e给出了噪声通过利用本发明方法对图7a进行处理后得到 的恰可察觉失真阈值图注入图7a后得到的JND噪声污染图。 0096 图8给出了Lena图像及在该图像中圈出的三个比较明显、 。

47、容易辨别的区域A、 B、 C。 图9a给出了图8中区域A的放大图, 图9b给出了噪声通过Liu2010JND计算模型注入图9a后得 到的JND噪声污染图, 图9c给出了噪声通过Wu2013JND计算模型注入图9a后得到的JND噪声 污染图, 图9d给出了噪声通过Wu2017JND计算模型注入图9a后得到的JND噪声污染图, 图9e 给出了噪声通过利用本发明方法对图9a进行处理后得到的恰可察觉失真阈值图注入图9a 后得到的JND噪声污染图。 图10a给出了图8中区域B的放大图, 图10b给出了噪声通过 Liu2010JND计算模型注入图10a后得到的JND噪声污染图, 图10c给出了噪声通过Wu。

48、2013JND 说明书 8/9 页 12 CN 109872302 A 12 计算模型注入图10a后得到的JND噪声污染图, 图10d给出了利用Wu2017JND计算模型对图 10a进行处理后得到的JND噪声污染图, 图10e给出了噪声通过利用本发明方法对图10a进行 处理后得到的恰可察觉失真阈值图注入图10a后得到的JND噪声污染图。 图11a给出了图8中 区域C的放大图, 图11b给出了噪声通过Liu2010JND计算模型注入图11a后得到的JND噪声污 染图, 图11c给出了噪声通过Wu2013JND计算模型注入图11a后得到的JND噪声污染图, 图11d 给出了噪声通过Wu2017JN。

49、D计算模型注入图11a后得到的JND噪声污染图, 图11e给出了噪声 通过利用本发明方法对图11a进行处理后得到的恰可察觉失真阈值图注入图11a后得到的 JND噪声污染图。 0097 观察图5a至图5e, 可以发现图5b、 图5c、 图5d较原图即图5a, 皆已出现了较严重的 可视失真。 图5a所示的区域A为图4的边缘区域, 人类视觉对其较为敏感, 失真很容易察觉, 因此利用本发明方法时在此处没有注入过量噪声, 如图5e所示, 没有造成明显的失真效果。 故利用本发明方法比其他三个模型的噪声分配更为合理。 0098 观察图6a至图6e, 可以发现图6e的失真较不明显, 而其他三个模型在该区域注入。

50、 的噪声稍有过量, 如图6b、 图6c、 图6d所示皆有轻微失真。 观察图7a至图7e, 发现也是如此。 0099 从图9a至图9e、 图10a至图10e、 图11a至图11e中也可以看出, 利用本发明方法后得 到的JND噪声污染图因为考虑到了结构层和非结构层的JND阈值差异, 因此能够更好的分配 噪声, 使JND噪声污染图的失真难以发现。 0100 综上所述, 利用本发明方法可在平滑的边缘区域分配少量的噪声, 在结构规则的 纹理区域分配适量的噪声, 在结构不规则的纹理区域分配较多的噪声, 从而达到了噪声的 合理分配。 说明书 9/9 页 13 CN 109872302 A 13 图1 图2a。

展开阅读全文
内容关键字: 基于 稀疏 表示 自然 图像 可察觉 失真 阈值 估计 方法
关于本文
本文标题:基于稀疏表示的自然图像恰可察觉失真阈值估计方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/12175033.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1