一种基于稀疏编码提取子的图像分类方法及系统
技术领域
本申请涉及图像识别技术领域,特别是涉及一种基于稀疏编码提 取子的图像分类方法及系统。
背景技术
随着计算机技术和智能化的不断发展,图像分类技术已经发展成 为计算机视觉与模式识别中非常重要的一个研究课题。图像分类技术 通过计算机将图像电子化,然后分析图像数据,获取图像数据的特征, 在很多领域有着重大的意义,一旦研究成功并投入应用,将产生巨大 的社会和经济效益。但是抽取图像特征的过程具有一定难度,其中的 主要难点是快速获取具有高效表征能力的稀疏编码。目前的大部分研 究工作都集中在处理图像特征提取问题,且也已取得一定的成果。但 是真实世界中图像通常包含破坏、丢失数据,因此如何快速获得具有 高效表征能力的稀疏编码用来提取图像的特征是需要深入探讨的问 题。
近年来,K-SVD和D-KSVD(Discriminative K-SVD)等经典的字典 学习算法可通过学习一个重构的字典,训练得到数据集的稀疏编码来 表征数据的特征,并计算得到线性分类器,可对数据进行分类。但当 选取的训练数据样本较少时,数据的特征未能精确的表征,所以分类 的精度很低。为了克服此缺点,它们的推广LC-KSVD(Label Consistent K-SVD)被提出。已知全部数据样本的标签,LC-KSVD在学习判别 的可重构字典时,有效的保持字典各项与数据标签的内在联系,使得 即使训练样本较少,通过学到的字典训练得到的稀疏编码也能最大程 度的表征数据的特征,从而通过计算得到的线性分类器精确的对图像 数据进行分类。LC-KSVD目标是引用额外的稀疏重构过程,分类过 程较慢且不能最大程度地表征用于测试的图像的特征,达到精确分类 的目的。
因此,提供一种直接从测试图像样本获得其稀疏编码的方法及系 统而无需引用额外的稀疏重构过程,实现快速提高图像分类的准确度, 是本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本申请提供了一种基于稀疏编码提取子的图像分类方 法及系统,以克服现有技术中需引入额外稀疏重构过程,而不能快速 的直接从测试数据获得稀疏编码提取测试数据的特征以最大化分类精 度的问题。
为解决上述技术问题,本申请提供一种基于稀疏编码提取子的图 像分类方法,包括:
对原始训练集X中训练样本进行标签一致的字典与嵌入学习,得 到稀疏编码提取子P;利用所述稀疏编码提取子P,优化得到线性多 类分类器W;
利用所述稀疏编码提取子P,对测试样本xnew的显著特征进行提 取,表征所述测试样本xnew的稀疏编码snew,为下一步分类测试做好 准备;
将所述测试样本xnew的数据特征输入到所述线性多类分类器W进 行分类,输出所述测试样本xnew的类别归属概率,选取归属概率最大 值对应的类别为所述测试样本xnew的类别,以得到最准确的分类。
优选的,利用以下训练模型对原始训练集X中训练样本进行标签 一致的字典与嵌入学习,得到稀疏编码提取子P;利用所述稀疏编码 提取子P,优化得到线性多类分类器W:
< D , S , P , W , A , G > = arg min D , S , P , W , A , G | | GX - DS | | F 2 + α | | Q - AS | | F 2 + γ | | PX - S | | F 2 + β | | H - WPX | | F 2 ]]>
其中,是学习得到的重构字典,K是重构字典D 的维度,是原始训练集的稀疏编码,和 是投影矩阵,表示稀疏重构错误,表 示判别稀疏编码错误,α是该项的权衡参数,表示特征描述错 误,γ是该项的权衡参数,为分类错误,β是该项的权衡参 数。
优选的,通过公式snew=Pxnew计算得到所述测试样本xnew的稀疏 编码snew。
本申请还提供了一种基于稀疏编码提取子的图像分类系统,包 括:
训练模块,用于对原始训练集X中训练样本进行标签一致的字典 与嵌入学习,得到稀疏编码提取子P;利用所述稀疏编码提取子P, 优化得到线性多类分类器W;
测试预处理模块,用于利用所述稀疏编码提取子P,对测试样本 xnew的显著特征进行提取,表征所述测试样本xnew的稀疏编码snew, 为下一步分类测试做好准备;
测试模块,用于将所述测试样本xnew的数据特征输入到所述线性 多类分类器W进行分类,输出所述测试样本xnew的类别归属概率,选 取归属概率最大值对应的类别为所述测试样本xnew的类别,以得到最 准确的分类。
以上本申请提供的一种基于稀疏编码提取子的图像分类方法及 系统中,通过将图像数据的特征描述正则化项集成到现有的判别型标 签一致字典学习框架,提出一个统一的“编码+描述+分类”模型框架: 对图像数据利用该模型进行训练,得到一个线性的稀疏编码提取子和 线性多类分类器;利用稀疏编码提取子,对测试样本的显著特征进行 提取,表征测试样本的稀疏编码,为下一步分类测试做好准备;进而 利用测试样本的数据特征使用得到的线性多类分类器进行分类,输出 测试样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得 到最准确的分类。通过提出稀疏编码提取子,克服现有技术中引入额 外的稀疏重构过程,不能直接从测试数据获得稀疏编码提取测试数据 的特征以最大化分类精度的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面 将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而 易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通 技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附 图获得其他的附图。
图1为本申请一种基于稀疏编码提取子的图像分类方法实施例1 的流程图;
图2为本申请一种基于稀疏编码提取子的图像分类方法实施例1 的样本外图像类别预测及分类示意图;
图3为本申请一种基于稀疏编码提取子的图像分类系统实施例1 的结构框图示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方 案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部 分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普 通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本申请保护的范围。
本申请的核心是提供一种基于稀疏编码提取子的图像分类方法 及系统,以克服现有技术中需引入额外稀疏重构过程,而不能快速的 直接从测试数据获得稀疏编码提取测试数据的特征以最大化分类精度 的问题。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图 和具体实施方式对本申请作进一步的详细说明。
本发明公开了一种基于稀疏编码提取子的图像分类方法及系统, 通过对图像数据使用所述方法,得到一个线性的稀疏编码提取子和线 性的多类图像分类器;利用所述稀疏编码提取子,对测试图像样本的 显著特征进行提取,表征测试图像样本的稀疏编码,为下一步分类测 试做好准备;进而利用测试图像样本的特征使用得到的线性多类图像 分类器进行分类,输出测试样本的类别归属概率,取概率最大值,用 于图像类别的鉴定,得到最准确的分类。通过提出稀疏编码提取子, 对于输入的测试图像样本,可快速实现样本外数据的分类,不需要引 入额外的稀疏重构过程,有效提高了图像分类的精准度。
本发明在2个图像数据的数据库进行了测试:Isolet spoken letter recognition和AR face images。此两个数据集的描述如下:
本发明选取Isolet spoken letter recognition数据库中Isolet2和 Isolet5进行测试。这些数据库从多方面收集,因而测试结果具有普遍 说明性。
参考图1,示出了本申请一种基于稀疏编码提取子的图像分类方 法实施例1的流程图,该方法具体可以包括如下步骤:
步骤S100、对原始训练集X中训练样本进行标签一致的字典与 嵌入学习,得到稀疏编码提取子P;利用所述稀疏编码提取子P,优 化得到线性多类分类器W;
通过将原始训练集中图像数据进行标签一致的字典与嵌入学习, 计算得到一个线性的稀疏编码提取子P,可用于图像样本特征的提取, 进而表征训练样本的稀疏编码;利用所述稀疏编码提取子P,优化得 到一个线性的多类图像分类器W,用于样本内和样本外图像数据的处 理。
步骤S101、利用所述稀疏编码提取子P,对测试样本xnew的显著 特征进行提取,表征所述测试样本xnew的稀疏编码snew,为下一步分 类测试做好准备;其中,
本申请中,将所述测试图像样本xnew嵌入到所述稀疏编码提取子 P,通过公式snew=Pxnew计算得到所述测试样本xnew的稀疏编码snew。
步骤S102、将所述测试样本xnew的数据特征输入到所述线性多类 分类器W进行分类,输出所述测试样本xnew的类别归属概率,选取归 属概率最大值对应的类别为所述测试样本xnew的类别,以得到最准确 的分类。
具体地,利用稀疏编码提取子P和多类线性分类器W,对于测试 样本xnew,利用Pxnew将xnew嵌入稀疏编码提取子P来获得xnew的稀 疏系数snew,xnew的软标签可被归类为:
其中,snew=Pxnew
其中向量fnew中最大元素的位置就是xnew的类别。
为了便于本领域技术人员直观地理解本申请的技术方案,参考图 2,示出了本申请一种基于稀疏编码提取子的图像分类方法实施例1 的样本外图像类别预测及分类示意图。
本发明公开了一种基于稀疏编码提取子的图像分类方法及系统, 通过将一个特征描述正则化项集成到现有的判别型标签一致字典学习 框架,提出一个统一的“编码+描述+分类”模型框架。模型通过最小 化稀疏重构错误、特征描述错误、稀疏编码错误和分类错误,可计算 得到判别的稀疏编码,同时可以得到一个线性的稀疏编码提取子和一 个线性的多类分类器。稀疏编码提取子主要通过在模型训练过程中最 小化图像数据之描述和其稀疏编码之间的拟合错误。测试图像分类主 要通过计算得到的线性分类器实现,输出测试样本的类别归属概率, 取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。
本申请中,步骤S100中,利用以下训练模型对原始训练集X中 训练样本进行标签一致的字典与嵌入学习,得到稀疏编码提取子P; 利用所述稀疏编码提取子P,优化得到线性多类分类器W。
具体地,给定原始训练集为图像数据向量集合 (其中,n是训练样本的维度,N是样本的数量), 其中包含有c个类别标签(c>2)。所述“编码+描述+分类”模型为:
< D , S , P , W , A , G > = arg min D , S , P , W , A , G | | GX - DS | | F 2 + α | | Q - AS | | F 2 + γ | | PX - S | | F 2 + β | | H - WPX | | F 2 ]]>
其中,是学习得到的重构字典,K是重构字典D 的维度,是原始训练集的稀疏编码,和 是投影矩阵,表示稀疏重构错误,表 示判别稀疏编码错误,α是该项的权衡参数,表示特征描述错 误,γ是该项的权衡参数,为分类错误,β是该项的权衡参 数。稀疏编码中,s.t.||si||0≤T1,i∈{j|j=1,2,…,N},其中,T1是稀疏约束;
是训练得到的分类器,W的分类精确度取决于稀疏 编码提取子提取稀疏编码的判别力,而稀疏编码提取子 P的表征能力取决于稀疏编码S的判别力。是训练数据 集的类别标签矩阵,中非零项所在的列数是训练样 本xi的类别标签,m是类别数量。
其中,由于原始数据集可能包含一些噪声影响特征提取的结果, G用来嵌入原始数据集X到一个变换特征间;是判别稀 疏编码,qi是输入向量xi的稀疏编码,当训练样本xi和xj属于不同类 别时,这两个训练样本在Q中对应的项为0,反之,为sim(xi,xj)。sim(i,j) 表示xi和xj的相似度,可通过计算cos(xi,xj)得到。
例如,包含3个类别的数据,x1,x2属于类别1,x3,x4,x5属于类别2,x6,x7属于类别3,Q可定义为:
Q = sim ( 1,1 ) sim ( 1,2 ) 0 0 0 0 0 sim ( 2,1 ) sim ( 2,2 ) 0 0 0 0 0 0 0 sim ( 3,3 ) sim ( 3,4 ) sim ( 3,5 ) 0 0 0 0 sim ( 4,3 ) sim ( 4,4 ) sim ( 4,5 ) 0 0 0 0 sim ( 5,3 ) sim ( 5,4 ) sim ( 5,5 ) 0 0 0 0 0 0 0 sim ( 6,6 ) sim ( 6,7 ) 0 0 0 0 0 sim ( 7,6 ) sim ( 7,7 ) ]]>
解决该问题应通过交替更新变量的方法。具体方法为,通过字典 学习方法计算出稀疏编码,然后获得稀疏编码提取子P与线性分类器 W。利用字典学习的方法得到稀疏编码过程如下:
假定β=0,当P和G已知时,目标函数为
< D , S , A > = arg min D , S , A | | GX - DS | | F 2 + α | | Q - AS | | F 2 + γ | | PX - S | | F 2 ]]>
s.t.||si||0≤T1,i∈{j|j=1,2…N},
该方程可被重新表示为:
< D , S , A > = arg min D , S , A | | GX α Q γ PX - D α A γ I K S | | F 2 ]]>
Subj||si||0≤T1,i∈{j|j=1,2,...,N}
假定 X new = ( ( GX ) T , α Q T , γ ( PX ) T ) T , D new = ( D T , α A T , γ I K ) T , ]]>假设Dnew是l2-范数列向量,目标函数可改写为:
< D new , S > = arg min D new , S { | | X new - D new S | | F 2 } ]]>
s . t . ∀ i , | | x i | | 0 ≤ T 1 , i ∈ { j | j = 1,2 , . . . , N } ]]>
该问题可以归结为K-SVD问题,可以有效的利用K-SVD算法找 到最优解。计算得到D和S后,假定In是n维单位矩阵,可通过如下 模型获得G:
Min G | | GX - DS | | F 2 + λ | | G | | F 2 , G * = DSX T ( XX T + λ I n ) - 1 ]]>
获得稀疏编码提取子P和线性分类器W过程如下:
通过出掉目标函数中与P、W不相关的项,可得如下目标函数:
< P , W > = arg min P , W γ | | PX - S | | F 2 + β | | H - WPX | | F 2 , ]]>
令偏导数可通过如下函数更新P:
P=(γIK+βWTW)-1(γSXT+βWTHXT)(XXT)-1,
令偏导数可通过如下函数更新W:
W=HXTPT(PXXTPT)-1。
与上述本申请一种基于稀疏编码提取子的图像分类方法实施例1 相对应,本申请还提供了一种基于稀疏编码提取子的图像分类系统实 施例1,参考图3,该系统300可以包括如下内容:
训练模块301,用于对原始训练集X中训练样本进行标签一致的 字典与嵌入学习,得到稀疏编码提取子P;利用所述稀疏编码提取子 P,优化得到线性多类分类器W;
测试预处理模块302,用于利用所述稀疏编码提取子P,对测试 样本xnew的显著特征进行提取,表征所述测试样本xnew的稀疏编码 snew,为下一步分类测试做好准备;
测试模块303,用于将所述测试样本xnew的数据特征输入到所述 线性多类分类器W进行分类,输出所述测试样本xnew的类别归属概率, 选取归属概率最大值对应的类别为所述测试样本xnew的类别,以得到 最准确的分类。
参阅表2,为本发明方法和SRC(Sparse Representation-based Classification)、KSVD、DKSVD(Discriminative K-SVD)、 LLC(Locality-constrained Linear Coding)、LC-KSVD1和 LC-KSVD2(Label Consistent K-SVD)方法在AR数据集随机选取面部特 征的识别结果对比表,给出了各方法实验的精度。本例中,参与比较 的SRC、KSVD、DKSVD、LLC、LC-KSVD1和LC-KSVD2方法(采 用各文献中算法使用的默认参数)使用各自得到的稀疏编码用于图像 数据的特征提取,且分类均采用线性分类器。
请参阅表3以及表4,为本发明方法和SRC、KSVD、DKSVD、 LLC、LC-KSVD1以及LC-KSVD2方法用AR-men以及AR-women数 据集的主要面部特征识别结果对比。
表2.AR数据集随机选取面部特征识别结果对比
实验方法 精度
SRC 66.5%
KSVD 86.5%
DKSVD 88.8%
LLC(30local bases) 69.5%
LLC(70local bases) 88.7%
LC-KSVD1 92.5%
LC-KSVD2 93.7%
本发明方法(15类) 94.1%
本发明方法(20类) 96.2%
表3.AR-men数据集主要面部特征识别结果对比
表4.AR-women数据集主要面部特征识别结果对比
通过AR真实数据集上的实例实验结果显示,本发明方法视觉上 地可有效用于图像数据分类。
通过实验结果我们可以看出本发明的图像识别分类效果明显优 于相关的SRC、KSVD、DKSVD、LLC、LC-KSVD1以及LC-KSVD2 方法,且表现出了较强的稳定性,具有一定的优势。
综上:本发明公开了一种基于稀疏编码提取子的图像分类方法及 系统,通过将一个特征描述正则化项集成到现有的判别型标签一致字 典学习框架,提出一个统一的“编码+描述+分类”模型框架。利用该 模型对图像数据进行标签一致的字典和嵌入学习,通过最小化稀疏重 构错误、特征描述错误、稀疏编码错误和分类错误,可计算得到判别 的稀疏编码,同时可以得到一个线性的稀疏编码提取子和一个线性的 多类分类器。稀疏编码提取子可用来提取测试图像数据的特征,表征 测试数据的稀疏编码,且可在模型训练过程中最小化图像数据之描述 和其稀疏编码之间的拟合错误。测试图像分类主要通过计算得到的线 性分类器实现,输出测试样本的类别归属概率,取概率的最大值,用 于图像类别的鉴定,得到最准确的分类结果。通过提出稀疏编码提取 子,对于输入的测试图像样本,可快速实现样本外数据的分类,不需 要引入额外的稀疏重构过程,有效提高了图像分类的精准度。
需要说明的是,本说明书中的各个实施例均采用递进的方式描 述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施 例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于 其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法 实施例的部分说明即可。
以上对本申请所提供的一种基于稀疏编码提取子的图像分类方 法及系统进行了详细介绍。本文中应用了具体个例对本申请的原理及 实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的 方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说, 在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰, 这些改进和修饰也落入本申请权利要求的保护范围内。