一种基于地物类别分类冗余字典的成像光谱图像稀疏表示方法技术领域
本发明涉及一种成像光谱图像稀疏表示方法,特别涉及一种基于地物类别分类冗余
字典的成像光谱图像稀疏表示方法。
背景技术
成像光谱技术是20世纪80年代迅速发展起来的一种新的遥感技术,它以纳米级的
超高光谱分辨率在几十甚至上百个波段同时获取地物辐射信息,因而能够在获取地物目
标空间信息的同时,对其内部物理特征和构成进行探测。成像光谱技术在资源勘探、地
质勘查、灾害救援等领域都有广泛的应用。
相似的地表区域,反射值也相似,则光谱曲线也就相似。成像光谱图像可以看作三
维数据立方体,其第三维是光谱维,二维空间上的每一个象元均可沿光谱维提取出一条
光滑连续的光谱反射曲线,该条光谱曲线反映了该像素点所包含地物在不同波段的反射
值。由于地表反射和大气吸收都是依赖于波长的,同时地表发射的强度依赖于地面类型,
因此表示相似地面类型的像元拥有相似形状的光谱曲线。
成像光谱图像的主要有以下几个特点:空间分辨率低于全色影像;光谱分辨率高,
谱段多,数据量大;谱间相关性强,空间相关性相对较弱;相似地物具有相似光谱曲线。
针对这些特点,人们希望找到一种新的成像光谱图像表示方法取代传统的信号表示方法,
用稀疏逼近取代原始数据,实现信号的稀疏表示,可从实质上降低信号处理的成本,提
高压缩效率。目前成像光谱图像稀疏表示方法主要有以下几种:
匹配追踪算法(matchingpursuit,MP):作为对信号进行稀疏分解的方法之一,将成像
光谱图像信号在完备字典库上进行分解。从字典矩阵选择与像素光谱曲线最匹配的原子,
构建一个稀疏逼近,并求出信号残差,然后继续选择与信号残差最匹配的原子,反复迭
代。但如果残差在已选择的原子进行垂直投影是非正交性的,则使得每次迭代的结果只
是次优的。
基追踪算法(basispursuit,BP):采用表示系数的范数作为信号表示稀疏性的度量,通
过最小化1范数将信号稀疏表示问题定义为一类有约束的极值问题,进而转化为线性规
划问题进行求解。基追踪算法由于要在所有的字典向量中极小化一个全局目标函数,因
此算法复杂度极高。
现有技术对成像光谱图像的稀疏表示方法未充分考虑对成像光谱图像中光谱维信息
的保持能力,造成通过稀疏表示信号所重建的高分辨率图像存在一定的光谱失真。另外,
高光谱图像波段众多,对所有波段分别进行稀疏分解,其巨大的运算量也往往是难以承
受的。通过本发明方法,分类训练冗余字典,充分利用成像光谱图像相似地物具有相似
光谱曲线的特点,可以得到更准确的稀疏表示结果。
发明内容
针对现有技术中存在的上述问题,本发明提供一种基于地物类别分类冗余字典的成
像光谱图像稀疏表示方法,实现更准确的成像光谱图像稀疏表示。
为实现上述目的,本发明采用如下技术手段:
由成像光谱仪完成成像光谱数据的采集,并将待处理图像的光学信号转化为数字图
像信号,存储于采集设备存储器中;通过USB、红外接口读入图像,在处理器中进行基
于地物类别分类冗余字典的成像光谱图像稀疏表示。其特征在于:使用K-means将成像
光谱图像的信息按地物类别分类训练冗余字典,通过分类冗余字典实现成像光谱图像的
全波段稀疏表示。
1.K-means聚类
K均值聚类算法(K-means)是很典型的基于距离的聚类算法,采用距离作为相似性
的评价指标,即认为两个对象的距离越近,其相似度就越大。K-means算法快速简单,对
成像光谱图像典型的高维信号有较高的效率并且是可伸缩性的,时间复杂度近于线性。
算法中的簇是由光谱曲线距离靠近的像素组成的,因此把得到紧凑且独立的簇作为最终
目标。本发明中K-means聚类的目的就是将训练数据根据地物类别信息分类形成独立的
簇,使得可以对某类地物信息独立训练冗余字典,达到改善所有波段稀疏表示准确度的
效果,一定程度上避免不相关地物信息引入的光谱失真现象。
2.成像光谱图像的全波段稀疏表示及重建
K-means聚类后的训练数据,划分成了独立的地物信息簇,包含了关于训练数据成像
光谱图像的各个波段信息。分别训练各类冗余字典,对需处理的成像光谱图像使用相应
类别与混合类别字典进行稀疏分解,实现成像光谱图像全波段的稀疏表示。实验结果表
明,本发明提出的稀疏表示方法,能够使重建成像光谱图像的复原效果得到显著提升,
保持原有图像的光谱特征不发生失真。
一种基于地物类别分类冗余字典的成像光谱图像稀疏表示方法,包括下述步骤:
步骤1,计算机从存储设备读入成像光谱图像作为训练数据,整个图像用一个三维数
组X的形式进行表示;
步骤2,对训练数据进行K-means聚类,将成像光谱图像数据按地物信息添加分类标
签;
步骤2.1,读入成像光谱图像训练数据X;
步骤2.2,从X中随机选择k个元素作为初始聚类中心光谱曲线,记为c1,c2…,ck,k
为聚类类别号;
步骤2.3,迭代求任意一个像素光谱曲线到k个中心的距离,将该像素样本归类到距
离最短的中心所在的类,k为聚类类别号;
步骤2.4,利用均值法更新该类的中心值;
步骤2.5,对于所有的聚类中心,若利用迭代法更新后,值保持不变,则迭代结束,
否则继续迭代,即使对象到其簇质心的距离的平方和最小化;
步骤3,使用训练成像光谱图像数据训练冗余字典;
步骤3.1,由成像光谱图像数据地物信息分类标签信息划分单一地物区域与混合地物
区域;
(1)选取像素,计算光谱曲线x与每一类聚类中心ck光谱曲线的距离Vk,k为聚类
类别号
V k = 1 N Σ n = 0 N ( x n - c k n ) 2 - - - ( 1 ) ]]>
其中N为成像光谱图像波段数,n为具体波段号,xn为光谱曲线上波段号为n的像
素值,ckn为第k类聚类中心光谱曲线上波段号为n的像素值;
(2)将像素曲线到每一类聚类中心的距离Vk按从小到大的顺序重新排序,k为聚类
类别号,则排序后V1,V2为最小与其次的距离;
(3)由地物类别差异大小设定阈值T=1000,划分单一地物区域与混合地物区域,
若V1≤T,其中V1为像素到最相关类距离即最小距离,则划分为单一地物区域,添加该类
标签;否则划分为混合地物区域,添加标签;
步骤3.2,使用单一地物区域图像分类训练冗余字典;
(1)循环读入成像光谱图像各单一地物类别训练数据;
(2)随机生成各类字典D=(d1,d2,…,dk),k为聚类类别号;
(3)随机选取训练数据中的任意像元光谱曲线x,采用对稀疏分解系数am求导方式
求稀疏系数矩阵,其中作为计算结果的稀疏表示系数am在后续步骤循环迭代逐步求精后
即为训练数据图像信号对应当前调整过程中的字典的稀疏表示结果;
{ a m } = arg m i n a m | | x - Σ i = 1 M a i × d k i | | 2 2 + γ Σ j = 1 M | a j | - - - ( 2 ) ]]>
其中M为每类字典原子数目,dki为第k类字典中第i个原子,k为聚类类别号,字
典原子与稀疏系数根据编号为一一对应关系,式中i,j为字典原子编号与系数编号,同一
符号表示编号相同的相对应的字典原子与稀疏系数;γ为平衡因子,根据精确度与稀疏性
的均衡设γ=0.01,表示其二范数;
(4)在8bit高光谱图像环境下,设定迭代次数为200,使字典调整能够在计算次数
最低的条件下达到收敛效果;计算第r轮迭代更新步长其中tm,r为
第r轮迭代字典第m个原子更新步长,r为当前迭代次数,M为每类字典原子数目,字典
原子与稀疏系数根据编号为一一对应关系,式中m,l为字典原子编号与系数编号,同一符
号表示编号相同的相对应的字典原子与稀疏系数;am为像元光谱曲线x稀疏分解后第m
个系数,al为第l个系数,dkl为第k类字典第l个原子,k为聚类类别号;
(5)更新字典步长;
(6)循环迭代步骤(3)~(5)直到字典D收敛时输出各单一地物类别字典d1,d2,…,dk,
其中k为聚类类别号;
步骤4,对需处理的成像光谱图像进行稀疏分解;
步骤4.1,对需处理的成像光谱图像进行KNN,将处理数据分类,添加分类标签;
(1)读入成像光谱图像数据X;
(2)选取像素,计算光谱曲线x与训练数据每个元素的距离S;
(3)对S排序,综合计算速率与精确性,统计距离最小1000k个训练数据元素各地
物类别标号数量,记最大数量为S1,其次数量为S2。由地物类别差异大小设定阈值
H=700k、H1=400k、H2=300k,划分单一地物区域与混合地物区域,若S1≥H,则划
分为单一地物区域,添加该类标签;若S1≥H1∧S2>H2,则划分为混合地物区域,添加
该双类标签;否则添加全类标签;
步骤4.2,根据分类标签对单一地物区域与混合地物区域对图像分别处理,分别使用
单类字典与双字典稀疏分解;
(1)顺序选取X中像元读取标签,若为单一地物区域,选取相应类别标号字典dk;
若为混合地物区域,选取两类类别标号字典组合;否则选取混合冗余字典;由公式(2)
采用对稀疏分解系数am求导方式求稀疏系数矩阵,其中作为计算结果的稀疏表示系数am
在后续步骤循环迭代逐步求精后即为图像信号的稀疏表示结果;
(2)输出系数矩阵{am};
步骤5,成像光谱图像稀疏系数输出到缓存器,用于后续的分析和应用;
步骤6,以上操作结束后,关闭成像光谱图像文件。
与现有技术相比,本发明具有以下优点:
本发明通过K-means聚类,将训练数据按地物信息分类并单独训练冗余字典,充分
利用了成像光谱图像的光谱信息,又避免了错误信息的引入,保证了重建图像的质量;
划分单一地物区域与混合地物区域对图像分别处理,进一步优化提高了重建图像的还原
质量;同时,沿光谱维的聚类、训练字典、稀疏分解过程,有效避免了各波段独立进行
产生的光谱失真问题,并降低了运算量。实验结果表明,采用本发明方法获得的成像光
谱图像稀疏表示,在重建后全波段PNSR值相比传统不分类稀疏分解算法提高约2dB。
从主观质量上看,图像的光谱保持能力得到了显著的提升,图像复原真实度显著优于对
比算法。
附图说明
图1为基于地物类别分类冗余字典的成像光谱图像稀疏表示方法结构框图;
图2为本发明算法与对比算法稀疏系数重建图像的第100波段主观质量对比:(a)为
原始高光谱图像,(b)为未分类字典稀疏表示重建图像,(c)为本发明所述方法的实验结果。
图3为本发明算法与对比算法稀疏系数重建图像的第125波段主观质量对比:(a)为
原始高光谱图像,(b)为未分类字典稀疏表示重建图像,(c)为本发明所述方法的实验结果。
具体实施方式
以下结合说明书附图,对本发明的实施例加以详细说明。
首先由成像光谱仪完成成像光谱数据的采集,将目标图像的光学信号转化为数字图
像信号,存储在采集设备存储器中;计算机通过现有的USB、红外等接口读入图像,在
处理器中进行基于地物类别分类冗余字典的成像光谱图像稀疏分解,所得结果直接存储
在本地硬盘,用于对成像光谱图像稀疏系数的进一步分析和处理。
本发明的总体结构框图见图1,主要包括下述步骤:
步骤1,计算机从存储设备读入成像光谱图像,整个图像用一个三维数组X表示;
步骤2,对训练数据进行K-means聚类,方法如下:
步骤2.1,读入成像光谱图像训练数据X;
步骤2.2,从X中随机选择k个元素作为初始聚类中心光谱曲线,记为c1,c2…,cK,k
为聚类类别号;
步骤2.3,使用公式(1)计算每个像素光谱曲线到初始聚类中心ck的距离Vk,其中ck
为第k类聚类中心光谱曲线,k为聚类类别号。当Vk最小时将该像素样本归类到该类;
步骤2.4,利用均值法更新该类的聚类中心,
c k n = 1 N Σ n = 0 N ( x k n - c k n ) 2 - - - ( 3 ) ]]>
其中N为成像光谱图像波段数,n为具体波段号,xkn为第k类像素光谱曲线上波段
号为n的像素值,ckn为第k类聚类中心光谱曲线上波段号为n的像素值,k为聚类类别号;
步骤2.5,对于所有的聚类中心,若利用迭代法更新后,中心值保持不变,则迭代结
束,否则继续迭代,即使像素到其簇质心的距离的平方和最小化
L = Σ n = 0 N ( c p n - c q n ) 2 ≤ T - - - ( 4 ) ]]>
N为成像光谱图像波段数,n为具体波段号,cpn为前一次迭代聚类中心曲线上波段
号为n的像素值,cqn为本次迭代结果。为减少迭代次数防止运算量过大,设定阈值T=1.0
使其仅影响收敛速度且不影响效果,当中心值变动L小于等于阈值时则视为中心已收敛;
步骤3,使用训练成像光谱图像数据训练冗余字典,方法如下:
步骤3.1,由成像光谱图像数据地物信息分类标签信息划分单一地物区域与混合地物
区域:
(1)选取像素,使用公式(1)计算光谱曲线x与每一类聚类中心曲线ck的距离Vk;
(2)距离Vk按从小到大的顺序排序;
(3)由地物类别差异大小设定阈值T=1000,划分单一地物区域与混合地物区域,
若V1≤T,其中V1为像素到最相关类距离即最小距离,则划分为单一地物区域,添加该类
标签;否则划分为混合地物区域,添加标签;
步骤3.2,使用单一地物区域图像分类训练冗余字典:
(1)循环读入成像光谱图像含单一地物类别标签的各类训练数据;
(2)随机生成各类字典D=(d1,d2,…,dk),k为聚类类别号;
(3)随机选取X中的任意像元,由公式(2)采用对系数am求导方式求稀疏系数矩
阵,其中作为计算结果的稀疏表示系数am在后续步骤循环迭代逐步求精后即为训练数据
图像信号对应当前调整过程中的字典的稀疏表示结果;
(4)在8bit高光谱图像环境下,设定迭代次数为200,使字典调整能够在计算次数
最低的条件下达到收敛效果;计算第r轮迭代更新步长其中tm,r为
第r轮迭代字典第m个原子更新步长,r为当前迭代次数,M为每类字典原子数目,字典
原子与稀疏系数根据编号为一一对应关系,式中m,l为字典原子编号与系数编号,同一符
号表示编号相同的相对应的字典原子与稀疏系数;am为像元光谱曲线x稀疏分解后第m
个系数,al为第l个系数,dkl为第k类字典第l个原子,k为聚类类别号;
(5)更新字典步长dkm=dkm+tm,式中dkm为k类字典第m个原子;
(6)循环迭代步骤(3)~(5)直到字典D收敛时输出各单一地物类别字典d1,d2,…,dk,
其中k为聚类类别号;
步骤3.3,使用成像光谱图像训练数据全图训练混合冗余字典,具体方法同步骤3.2;
步骤4,对需处理的成像光谱图像进行稀疏分解,方法如下:
步骤4.1,对需处理的成像光谱图像进行KNN,将处理数据分类,添加分类标签:
(1)读入需处理的成像光谱图像数据X;
(2)选取像素,计算光谱曲线x与训练数据每个元素的距离S
S = 1 N Σ i = 0 N ( x i - X i ) 2 - - - ( 5 ) ]]>
其中N为成像光谱图像波段数,xi为光谱曲线上一点,Xi为成像光谱图像数据中一
个像素光谱曲线上一点;
(3)距离S按从小到大的顺序排序;
(4)对S排序,综合计算速率与精确性,统计距离最小1000k个训练数据元素各地
物类别标号数量,记最大数量为S1,其次数量为S2。由地物类别差异大小设定阈值
H=700k、H1=400k、H2=300k,划分单一地物区域与混合地物区域,若S1≥H,则划
分为单一地物区域,添加该类标签;若S1≥H1∧S2>H2,则划分为混合地物区域,添加
该双类标签;否则添加全类标签;
步骤4.2,根据分类标签对单一地物区域与混合地物区域对图像分别处理,分别使用
单类字典与双字典稀疏分解;
(1)顺序选取X中像元读取标签,若为单一地物区域,选取相应类别标号字典dk;
若为混合地物区域,选取两类类别标号字典组合,扩大字典元素数为两倍;否则选取混
合冗余字典;同采用公式(2)对稀疏分解系数am求导方式求稀疏系数矩阵,其中作为计
算结果的稀疏表示系数am在后续步骤循环迭代逐步求精后即为图像信号的稀疏表示结
果;
(2)输出系数矩阵{am};
步骤5,将成像光谱图像稀疏系数压缩码流输出到缓存器,直接存储在本地硬盘,用
于后续的分析和应用;
步骤6,以上操作结束后,关闭成像光谱图像文件,关闭分类稀疏分解程序。
下面给出本发明的一个应用实例。
测试高光谱图像是由实用型模块成像光谱仪系统(OMIS)所获取,每幅均由128个波
段组成,且标准单元图像大小为512×512像素,本文将截取其中子图像用于测试。计算
机处理主要是通过现有的USB接口或网络存储设备读入采集到的图像,存入到硬盘,高
光谱图像的分类稀疏分解通过软件实现。
为验证算法稀疏系数的客观重建效果,实验中使用对比算法和本发明所述方法分别
对同一高光谱图像进行稀疏分解处理,并通过重建图像的峰值信噪比PSNR值作为衡量
算法性能的客观指标。
表1给出了采用本发明所述方法和未分类稀疏分解方法对上述测试图像进行测试的
结果,展示了PSNR值的客观对比。实验结果表明,本发明方法重建图像的PSNR值要
明显高于对比算法重建图像的PSNR值,说明本发明重建的高光谱图像与分解前的原始
图像更为相近,具有更好的稀疏表示性能,能够更好地重建原始的高光谱图像。
表1不同算法PSNR(dB)值比较
图2给出了主观实验结果,其中图2(a)为第100波段原始高光谱图像,图2(b)为第
100波段未分类字典稀疏表示重建图像,图2(c)为本发明所述方法第100波段的实验结果。
图3(a)为第125波段原始高光谱图像,图3(b)为第125波段未分类字典稀疏表示重建图
像,图3(c)为本发明所述方法第125波段的实验结果。从图中可以清楚地看出,未分类
字典稀疏表示重建图像相比原图有较为明显的光谱失真现象,图像整体灰度与原图产生
误差,重建效果不理想;而图中所示的本发明方法得到的结果,不仅有效还原了图像的
细节信息,而且很好地保留了原始图像的光谱特性,灰度未发生明显改变。