书签 分享 收藏 举报 版权申诉 / 12

一种基于流形距离表征的舰船目标分类识别算法.pdf

  • 上传人:大师****2
  • 文档编号:5880766
  • 上传时间:2019-03-28
  • 格式:PDF
  • 页数:12
  • 大小:705.10KB
  • 摘要
    申请专利号:

    CN201510788031.2

    申请日:

    2015.11.17

    公开号:

    CN105528612A

    公开日:

    2016.04.27

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):G06K 9/62申请日:20151117|||公开

    IPC分类号:

    G06K9/62

    主分类号:

    G06K9/62

    申请人:

    中国船舶重工集团公司第七0九研究所

    发明人:

    郭伟娅; 夏学知

    地址:

    430205 湖北省武汉市东湖新技术开发区凤凰产业园藏龙北路1号

    优先权:

    专利代理机构:

    武汉河山金堂专利事务所(普通合伙) 42212

    代理人:

    胡清堂

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了一种基于流形距离表征舰船目标分类识别算法在加权修正局部反熵算子表示的样本间的距离权值的基础上,提出了一种基于流形距离表征的目标对象间的相似度量标准。该度量标准较传统的距离度量标准更贴近反映目标对象真实的空间分布,它是一种有效的度量标准;同时基于该标准的样本的邻居样本的预处理筛选,提高了概率生成模型的分类效率,满足了舰船目标分类识别提出的实时性处理要求。

    权利要求书

    1.一种基于流形距离表征的舰船目标分类识别算法,其特征在于:该算法包括以下步骤:步骤1:在样本流形空间中,首先构建一个加权无向图G(V,E),其中V表示顶点,它由样本集组成,E表示边集;步骤2:假设p(Vi,Vj)为样本Vi、Vj所在的路径,又假设p为路径p(Vi,Vj)上任两个样本间的路径,pm为路径p(Vi,Vj)上的第m个样本,由最短路径计算原理,得到流形距离的计算公式:上式中,权值其中,为局部邻域区域内的局部反熵值,表示样本pm+1连接中线上距离二者最近的样本点,且步骤3:假设样本Vi的邻居节点为Vj、Vk,则根据步骤(2)定义的流形距离,若L(Vi,Vj)≤L(Vi,Vk),则邻居节点Vj占优于Vk,记做Vj>Vk,反之,若Vk占优于Vj,记做在占优关系定义的基础上,令集合V={V1,V2,V3,…,Vi,…,VN},则在集合V中,若Vi>Vi+1,则记做V>={V1,V2,V3,…,Vi,…,VN};反之,若则记做集合V>或就称作优势集;步骤4:基于上述定义,首先根据样本Vi和其邻居样本间的流形距离进行快速排序,于是得到一个对应的优势集V'>,假设V'>={V1,V2,V3,…,Vk,…,VN};步骤5:对于优势集V′>,从前往后依次选取个(N代表样本集个数)样本作为样本Vi的邻居样本,并将其带入概率生成模型中求解得到分类识别结果。2.根据权利要求1所述的一种基于流形距离表征的舰船目标分类识别算法,其特征在于:步骤2中所述的权值的公式推导如下:上式中,表示以样本为中心,r为半径的Hough圆邻域,为pm+1连接中线上距离二者最近的样本点,σ为高斯分布方差,一般取其经验值α,β为调节因子,且0<β<1。3.根据权利要求2所述的一种基于流形距离表征的舰船目标分类识别算法,其特征在于:所述调节因子β=0.5。

    说明书

    一种基于流形距离表征的舰船目标分类识别算法

    技术领域

    本发明涉及计算机应用技术领域,尤其涉及一种基于流形距离表征的舰船目标分类识别算法。

    背景技术

    舰船作为海上重要的载体,其自动检测与识别的效率如何,一定程度上关系到我军夺海战争的胜负成败。特别是近年来,随着卫星遥感技术的发展壮大,基于光学遥感图像的识别算法表现出了自身优势,引起了国内外学者的高度重视,涌现出了一系列具有一定理论参考意义及应用价值的研究成果。

    一般而言,解决目标分类的关键问题在于如何聚类,而聚类最主要的因素在于目标对象间的相似度的度量,传统相似度的计算方法一般仅参考目标对象间的夹角或距离,例如余弦相似度、欧式距离。这些方法缺少对目标对象空间分布情况的分析,片面认为参与运算的特征或属性对数据的划分能力的影响效果是等同的,这显然是不符合目标对象的实际分布情况的,从而影响了目标分类的精确性。

    究其分类识别的基本思想是根据提取的特征向量为类别未知的目标指派某一类别。其中,比较常见的算法有:K近邻(K-Nearest-Neighbor,KNN)、支持向量机(SupportVectorMachine,SVM)、分层判别回归(HierarchicalDiscriminantRegression,HDR)、概率生成模型(ProbabilityGenerativeModel,PGM)等方法。针对上述几种典型的分类算法,仿真对比实验表明,概率生成模型的识别效果较好。但在实际运用时,现有的这些算法都缺少对样本规模和样本相似关系衡量的全面考察。

    发明内容

    为了克服现有技术的不足,本发明提供一种基于流形距离表征的舰船目标分类识别算法。

    本发明为解决上述技术问题所采用的技术方案是:

    一种基于流形距离表征的舰船目标分类识别算法,包括以下步骤:

    步骤1:在样本流形空间中,首先构建一个加权无向图G(V,E),其中V表示顶点,它由样本集组成,E表示边集。

    步骤2:假设p(Vi,Vj)为样本Vi、Vj所在的路径,又假设p为路径p(Vi,Vj)上任两个样本间的路径,pm为路径p(Vi,Vj)上的第m个样本,由最短路径计算原理,得到流形距离的计算公式:

    上式中,权值其中,为局部邻域区域内的局部反熵值,表示样本pm+1连接中线上距离二者最近的样本点,且

    步骤3:假设样本Vi的邻居节点为Vj、Vk,则根据步骤(2)定义的流形距离,若L(Vi,Vj)≤L(Vi,Vk),则邻居节点Vj占优于Vk,记做Vj>Vk,反之,若Vk占优于Vj,记做Vj<Vk;

    在占优关系定义的基础上,令集合V={V1,V2,V3,…,Vi,…,VN},则在集合V中,若Vi>Vi+1,则记做V>={V1,V2,V3,…,Vi,…,VN};反之,若Vi<Vi+1,则记做V<={V1,V2,V3,…,Vi,…,VN}。集合V>或V<就称作优势集。

    步骤4:基于上述定义,首先根据样本Vi和其邻居样本间的流形距离进行快速排序,于是得到一个对应的优势集V'>,假设V'>={V1,V2,V3,…,Vk,…,VN};

    步骤5:对于优势集V'>,从前往后依次选取个(N代表样本集个数)样本作为样本Vi的邻居样本,并将其带入概率生成模型中求解得到分类识别结果。

    作为优选,步骤2中所述的权值的公式推导如下:

    上式中,表示以样本为中心,r为半径的Hough圆邻域,为pm+1连接中线上距离二者最近的样本点,σ为高斯分布方差,一般取其经验值α,β为调节因子,且0<β<1。

    作为优选,调节因子β=0.5。

    本发明的有益效果是:

    1、对于某两个样本而言,流形距离指的是基于流形空间上的二者之间的最短距离,它使得同一流形分布中距离较近的样本指定给同一类别,不同流形分布中的样本指定给不同类别,它较传统的欧式距离更能准确表达样本间存在的真实差异情况。

    2、用局部反熵算子来衡量样本所赋予的权值,可以实现扩大低密度区域内的样本间的距离,缩小高密度区域内的样本间的距离这一目的。

    3、通过定义基于流形距离表征的相似度选择标准和基于该标准的优势集基础上的样本数量的限制,可加快舰船目标识别的精度和速度,提高舰船目标识别的效率。

    附图说明

    图1是本发明的基于欧式空间表示的样本分布示意图;

    图2是本发明的熵函数及反熵函数图像;

    图3是本发明的基于流形距离度量的样本空间分布示意图;

    图4是本发明的舰船目标识别切片实验数据;

    图5是本发明的各个算法性能对比直方图;

    图6是本发明的舰船目标识别实验数据。

    具体实施方式

    下面结合附图及实施例对本发明作进一步说明。

    传统的距离例如欧式距离并不能准确表达样本间存在的真实差异情况,如图1所示,样本A、C之间的距离远大于样本A、B之间的距离。若按照欧式空间上距离的大小进行划分,那么A和B将被归类为同一空间,C将被划分为另一空间上,显然,采用这种分类方法所得到的分类结果与三个样本的实际分布情况是相悖的。为此研究中引入了流形空间的概念,旨在缩小位于高密度区域内的样本间的距离,扩大位于低密度区域内的样本间的距离,使样本的空间分布情况趋向于其真实分布。

    该计算方法的具体实施步骤如下:

    (1)定义Hough圆邻域

    设(X,D)为一个可度量的空间,且x∈X,则对于给定的实数r>0,有集合:

    {y∈X|D(x,y)≤r}

    将上式以x为中心,r为半径的Hough圆邻域记做C(x,r),其中,D表示基于欧式距离的度量标准,计算公式为

    (2)定义局部反熵算子

    以xi、xj的中点x0为中心,r为半径的Hough圆邻域上,借鉴局部熵算子的定义,给出局部反熵算子的概念,其公式计算如下:

    其中,f(xk)表示点xk处的像素灰度,p(xk)表示xk发生的概率密度,ε>0,一般取值为ε=2×10-15。C(x0,r)表示x0所在的Hough圆局部邻域,r的取值范围为D(xi,xj)≤r≤2D(xi,xj)。

    这里以函数y=-xlog(x)、y=-xlog(1-x),x∈(0,1)为例,对比说明局部熵算子和局部反熵算子的性质。如图2所示,不同于函数y=-xlog(x),函数y=-xlog(1-x)在区间(0,1)内是单独递增的,且随变量值的增加函数值的增幅越来越快,其图像性质接近于指数函数的变化性质。

    根据局部反熵算子基本性质可知,由于其函数变换趋势接近于指数函数,所以基于局部反熵算子的计算会导致目标“过增长”效应,需要对其进行修正。为此,首先将函数lg(1-p(xk))进行麦克劳林展开:

    这里,0<θ<1,0<p(xk)<1。因为(p(xk))n→0,所以首先采用一次多项式来拟合lg(1-p(xk)),然后通过高斯分布函数对局部反熵算子进行“微调”,最后通过设置两个调整因子α、β综合对局部反熵算子进行修正,故局部反熵算子的计算公式可表示如下:

    上式中,σ为高斯分布方差,一般取其经验值0<β<1,本发明取值β=0.5。

    由局部反熵算子的性质可知,对于图像灰度变化均匀的区域,其局部反熵值较小,而对于图像灰度变化较大的区域,其局部反熵值较大。因此,用局部反熵算子来衡量样本所赋予的权值,可以实现扩大低密度区域内的样本间的距离,缩小高密度区域内的样本间的距离这一目的。

    (3)定义流形距离

    在样本流形空间中,首先构建一个加权无向图G(V,E),其中V表示顶点,它由样本集组成,E表示边集。假设p(Vi,Vj)为样本Vi、Vj所在的路径,又假设p为路径p(Vi,Vj)上任两个样本间的路径,pm为路径p(Vi,Vj)上的第m个样本。由最短路径计算原理,得到流形距离的计算公式:

    上式中,权值其中,为局部邻域区域内的局部反熵值,表示样本pm+1连接中线上距离二者最近的样本点,且

    根据上述定义,如图3所示,在流形距离的度量标准下,图中非凸空间上的样本分布更趋向一致,同一空间分布上的样本间的流形距离较小,不同空间分布上的样本间的距离较大。因此,采用此标准来度量样本的空间分布更符合样本的真实分布情况。

    (4)表征占优关系及优势集

    假设样本Vi的邻居节点为Vj、Vk,则根据步骤(3)定义的流形距离,若L(Vi,Vj)≤L(Vi,Vk),则邻居节点Vj占优于Vk,记做Vj>Vk,反之,若Vk占优于Vj,记做Vj<Vk。

    在占优关系定义的基础上,令集合V={V1,V2,V3,…,Vi,…,VN},则在集合V中,若Vi>Vi+1,则记做V>={V1,V2,V3,…,Vi,…,VN};反之,若Vi<Vi+1,则记做V<={V1,V2,V3,…,Vi,…,VN}。集合V>或V<就称作优势集。

    (5)舰船目标的分类预处理

    基于上述定义,首先根据样本Vi和其邻居样本间的流形距离进行快速排序,于是得到一个对应的优势集V'>,假设V'>={V1,V2,V3,…,Vk,…,VN};然后对于优势集V'>,前往后依次选取个(N代表样本集个数)样本作为样本Vi的邻居样本,将其代入概率生成模型中,参与后续分类计算。

    (6)基于类别传播分布的概率生成模型舰船目标分类识别

    首先给出类别传播分布的定义。

    类别传播分布:假设待处理样本节点隶属于K个类别,其中样本节点Vi周围有个邻居样本节点,在这些邻居样本节点当中,共有Nic个样本节点所属类别为Lc,则对于样本节点Vi及其邻居样本节点而言,它们属于类别Lc的表达式为:

    其中,按照步骤(5)定义的方法进行取值。

    根据类别传播分布的定义,本发明就用样本节点Vi的类别传播分布及其邻居样本节点Vj的类别表示样本节点Vi和其邻居样本节点Vj之间存在边的概率。具体来说,样本节点Vi和样本节点Vj之间存在边的概率等价于样本节点Vi的类别传播分布占有样本节点Vj类别分量的大小。

    进一步给出概率生成模型生成过程,具体包括如下步骤:

    (a)从以δ(δ=1/K,K表示样本类别数)为参数的狄利克雷分布中为每个样本产生一个类别传播分布参数;

    (b)在区间[0,K-1](同上,K表示样本类别数)上的均匀分布中随机产生一个整数,将其作为某样本的类别索引值;

    (c)在以某样本的类别分量θ为参数的伯努利分布中,为该样本和其邻居样本建立一条边。

    基于以上分析,观察变量与潜在变量的联合概率分布表示如下:

    p(E,y|θ)=p(y)p(E|y,θ)

    其中,y表示类别未知的样本所属的类别索引集。

    将上式展开,并结合概率生成模型的生成过程,得到θi的第c个分量θic的估计值为:

    最后,采用吉布斯采样方法求解上述概率生成模型。其中,用于吉布斯采样的后验概率表示如下:

    上式中,表示节点Vi与类别是Lc的节点之间的边的个数(不包括样本节点Vu),Wiu表示节点Vi、Vu之间是否存在一条边,如果存在,则Wiu=1,否则Wiu=0。

    该模型直接采用迭代的方式按照上式进行采样,平均迭代20次。每次迭代时都需要记下每个类别未知的样本节点所属的类别,最后将指定次数最多的类别作为它的最终类别。如此,就可以得到所有类别未知的样本节点的类别了,从而问题得到求解。

    基于以上分析,基于流形距离表征的相似度量标准的样本的邻居样本的筛选预处理,可有效提高后续概率生成模型的分类精度和速度。

    本发明的实验数据为从谷歌地图中选取的航空遥感影像。本次实验提取了6个舰种,每种选取50幅,如图4示。为验证本发明所提供的一种基于流形距离表征的光学遥感图像舰船目标相似度计算方法的有效性,在相同的实验条件下,本发明将采用的概率生成模型(PGM)的实验结果与传统的K近邻(KNN)方法、支持向量机(SVM)方法以及分层判别回归(HDR)算法的结果进行比较。

    舰船目标识别方法流程,具体操作步骤如下:

    (i)获得实验数据的舰船目标切片,如图4所示;

    (ii)提取舰船目标的长宽比、周长、熵、紧致度、第7个Hu矩、第11个Zernike矩、3个小波不变矩、第1和第6个ARC特征,组成一个11维的特征向量;

    (iii)按照上述内容中的步骤(5)、(6),运用概率生成模型(PGM)对舰船目标进行分类识别;

    (iv)采用K近邻(KNN)、支持向量机(SVM)和分层判别回归(HDR)算法分别对舰船目标进行分类识别,并与步骤(iii)中概率生成模型(PGM)的识别效率进行比较。

    为验证本发明的舰船目标分类识别的效果,本实验分为8组,分别记作组1、2、3、4、5、6、7和8,每组实验分别从6类舰种中随机选取11、15、19、23、27、30、34、38个样本作为训练样本,剩余的作为测试样本,重复10次测试,并将10次计算获得的均值作为每组最终的识别结果。其实验数据如图6所示。

    图5分别为八组实验:组1、2、3、4、5、6、7和8的平均识别率(%)和平均耗时(s)所对应的直方图。

    实验结果阐明了在相同的实验条件下,概率生成模型较KNN算法的平均识别率提升约10%,平均耗时约减少90%;较SVM算法无论是平均识别率还是耗时都有明显提高;较HDR算法的平均识别率和平均耗时也有所改善。由此表明,这种基于流形距离相似度的选择标准以及基于该标准的样本优势集基础上的样本的邻居样本的预处理对提高概率生成模型的分类识别效率来说是有效的。

    说明书中未阐述的部分均为现有技术或公知常识。本实施例仅用于说明该发明,而不用于限制本发明的范围,本领域技术人员对于本发明所做的等价置换等修改均认为是落入该发明权利要求书所保护范围内。

    关 键  词:
    一种 基于 流形 距离 表征 舰船 目标 分类 识别 算法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种基于流形距离表征的舰船目标分类识别算法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-5880766.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1