书签 分享 收藏 举报 版权申诉 / 10

基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法.pdf

  • 上传人:b***
  • 文档编号:1004795
  • 上传时间:2018-03-25
  • 格式:PDF
  • 页数:10
  • 大小:395.07KB
  • 摘要
    申请专利号:

    CN200910100750.5

    申请日:

    2009.07.20

    公开号:

    CN101673280A

    公开日:

    2010.03.17

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情:

    发明专利申请公布后的驳回IPC(主分类):G06F 17/30公开日:20100317|||实质审查的生效IPC(主分类):G06F 17/30申请日:20090720|||公开

    IPC分类号:

    G06F17/30

    主分类号:

    G06F17/30

    申请人:

    浙江大学

    发明人:

    吴朝晖; 夏超伦; 姜晓红; 吴敏萍; 罗兆波; 盛 浩; 刘 森

    地址:

    310027浙江省杭州市西湖区浙大路38号

    优先权:

    专利代理机构:

    杭州裕阳专利事务所(普通合伙)

    代理人:

    张骁敏

    PDF完整版下载: PDF下载
    内容摘要

    本发明涉及基于数据挖掘的犯罪特征分析技术领域,涉及犯罪特征分析中的恐怖袭击事件、恐怖组织特征挖掘分析,特别是涉及一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法。该方法包括如下步骤:1)根据已知恐怖袭击事件的属性训练贝叶斯分类器;2)计算未知恐怖袭击事件的相似度;3)选取相似度最大的2个恐怖袭击事件,并假设为同一恐怖组织发起;4)将步骤3)选出的2个恐怖袭击事件一起放入步骤1)训练好的贝叶斯分类器中,让贝叶斯分类器同时对这2个事件做出分类。本发明不仅利用到了恐怖袭击本身所具有的特征属性,并

    权利要求书

    1.  一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:包括如下步骤:1)根据已知恐怖袭击事件的属性训练贝叶斯分类器;2)计算未知恐怖袭击事件的相似度;3)选取相似度最大的2个恐怖袭击事件,并假设为同一恐怖组织发起;4)将步骤3)选出的2个恐怖袭击事件一起放入步骤1)训练好的贝叶斯分类器中,让贝叶斯分类器同时对这2个事件做出分类。

    2.
      根据权利要求1所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述步骤1)中的训练过程为:通过已知的训练数据,先获得每个恐怖组织的先验概率P(gi):
    P(gi)=NgiNG]]>
    其中P(gi)表示某个被标记为gi的恐怖组织发起恐怖袭击的先验概率,Ngi为gi恐怖组织发起恐怖袭击的个数,NG表示训练样本中恐怖袭击的总个数;针对每个恐怖组织gi,计算一个关于5个属性的后验概率P(X1,...,X5|Y=gi),表示5个属性在恐怖组织gi所发起的所有恐怖袭击中的分布,X1,...,X5对应上文中5个属性量化后的取值。

    3.
      根据权利要求1或2所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述属性为:恐怖袭击日期、恐怖袭击类型、恐怖袭击地点、恐怖组织意识形态、恐怖袭击目标。

    4.
      根据权利要求1所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述步骤2)计算恐怖袭击事件之间的相似度采取以下公式:
    s(i,j)=Σk=1mwkθk(Xik,Xjk)]]>
    其中,
    s(i,j)是两个恐怖袭击事件(记为i,j)之间的相似度;
    m是恐怖袭击事件总属性个数,令m=5;
    Xik,为恐怖袭击事件i的第k个属性,k=1,…,5;
    θk(Xik,Xjk)为恐怖袭击事件i,j在第k个属性上的量化关系,其定义为:
    θk=(Xik,Xjk)=1/mXik=Xjk0Xik≠Xjk]]>
    wk为第k个属性量化后的权重系数,令wk=1/m。

    5.
      根据权利要求1所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述步骤3)选取相似度最大的2个恐怖袭击事件的方式为:每次选取2个不同的恐怖袭击事件,分别记为i,j,根据以下公式选取:
    (i,j)=argmax(i,j)s(i,j),i≠j]]>

    6.
      根据权利要求1所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述步骤4)按照如下公式进行分类:
    Yi=Yj=argmaxv(E(Yi=v)E(Yj=v))]]>
    其中,
    Yi和Yj分别为对恐怖袭击事件i,j的预测值。Yj和Yj的值相同,它们的值所代表的是一个恐怖组织,即恐怖袭击事件i,j是由该恐怖组织(Yi)发起的;
    v为枚举变量,代表恐怖组织;
    E(Yj=v)表示贝叶斯分类器给出的Yi=v的可能性,既第i个恐怖袭击事件是由恐怖组织v发起的可能性。

    7.
      根据权利要求4所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述E(Yi=v)的计算公式为:
    E(Yi=v)=P(Yi=v|X1=u1,...,Xm=um)
    其中,关于P(...)的定义来自朴素贝叶斯分类器,表示一个后验概率,即恐怖袭击事件i由恐怖组织v发起的概率。

    8.
      根据权利要求4所述的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,其特征在于:所述Yi和Yj的值相同的情况下,如果一个恐怖袭击由多个恐怖组织发起,判定恐怖袭击组织方法给出的是一个最主要的恐怖组织。

    说明书

    基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法
    技术领域
    本发明涉及基于数据挖掘的犯罪特征分析技术领域,涉及犯罪特征分析中的恐怖袭击事件、恐怖组织特征挖掘分析,特别是涉及一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法。
    背景技术
    自911事件以来,各个国家的安全部门十分重视恐怖组织与恐怖袭击事件数据的搜集和相关数据库的建设,同时基于相关数据库在数据挖掘方面进行了一系列的研究。恐怖袭击事件数据的分析以及挖掘是从显性的数据入手,寻找出某些隐性的有用信息。从恐怖袭击事件数据中可能隐藏的特征、行为或者其他的因素来提炼出相关的模式,以此来提供线索、协助办案,同时,尽可能地把提取的特征模式用于监控之中,实现预警。
    数据挖掘(Data Mining)旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。于这些概念相提并论,是因为数据挖掘瞄准的对象是阐述个体间联系的相关性知识、而非描述个体属性、支零破碎的数据。
    贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。应用贝叶斯网络分类器进行分类主要分成两阶段。第一阶段是贝叶斯网络分类器的学习,即从样本数据中构造分类器,包括结构学习和CPT学习;第二阶段是贝叶斯网络分类器的推理,即计算类结点的条件概率,对分类数据进行分类。
    传统的朴素贝叶斯分类器在处理多数据分类时,需要逐条进行单数据分类,不能在分类之前对相似事件进行具体定性的分析,也不能对事件之间的关系进行分析。
    发明内容
    为了解决以上问题,本发明提供了一种成对分类的贝叶斯分类器,不仅利用了恐怖袭击本身所具有的特征属性,并且也利用了恐怖袭击之间的内在关系的基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法。
    一种基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法,包括如下步骤:
    1)根据已知恐怖袭击事件的属性训练贝叶斯分类器;2)计算未知恐怖袭击事件的相似度;3)选取相似度最大的2个恐怖袭击事件,并假设为同一恐怖组织发起;4)将步骤3)选出的2个恐怖袭击事件一起放入步骤1)训练好的贝叶斯分类器中,让贝叶斯分类器同时对这2个事件做出分类。
    进一步的,所述步骤1)中的训练过程为:通过已知的训练数据,先获得每个恐怖组织的先验概率P(gi):
    P(gi)=NgiNG]]>
    其中P(gi)表示某个被标记为gi的恐怖组织发起恐怖袭击的先验概率,其中Ngi为gi恐怖组织发起恐怖袭击的个数,NG表示训练样本中恐怖袭击的总个数。针对每个恐怖组织gi,计算一个关于5个属性的后验概率P(X1,...,X5|Y=gi),表示5个属性在恐怖组织gi所发起的所有恐怖袭击中的分布,X1,...,X5对应上文中5个属性量化后的取值。
    进一步的,所述属性为:恐怖袭击日期、恐怖袭击类型、恐怖袭击地点、恐怖组织意识形态、恐怖袭击目标。
    进一步的,所述步骤2)计算恐怖袭击事件之间的相似度采取以下公式:
    s(i,j)=Σk=1mwkθk(Xik,Xjk)]]>
    其中,
    s(i,j)是两个恐怖袭击事件(记为i,j)之间的相似度;
    m是恐怖袭击事件总属性个数,令m=5;
    Xik,为恐怖袭击事件i的第k个属性,k=1,...,5;
    θk(Xik,Xjk)为恐怖袭击事件i,j在第k个属性上的量化关系,其定义为:
    θk(Xik,Xjk)=1/mXik=Xjk0Xik≠Xjk]]>
    wk为第k个属性量化后的权重系数,令wk=1/m。
    进一步的,所述步骤3)选取相似度最大的2个恐怖袭击事件的方式为:每次选取2个不同的恐怖袭击事件,分别记为i,j,根据以下公式选取:
    (i,j)=argmax(i,j)s(i,j),i≠j]]>
    进一步的,所述步骤4)按照如下公式进行分类:
    Yi=Yj=argmaxv(E(Yi=v)E(Yj=v))]]>
    其中,
    Yi和Yj分别为对恐怖袭击事件i,j的预测值。Yi和Yj的值相同,它们的值所代表的是一个恐怖组织,即恐怖袭击事件i,j是由该恐怖组织(Yi)发起的;
    v为枚举变量,代表恐怖组织;
    E(Yi=v)表示贝叶斯分类器给出的Yi=v的可能性,既第i个恐怖袭击事件是由恐怖组织v发起的可能性。
    更进一步的,所述E(Yi=v)的计算公式为:
    E(Yi=v)=P(Yi=v|X1=u1,...,Xm=um)
    其中,关于P(...)的定义来自朴素贝叶斯分类器,表示一个后验概率,即恐怖袭击事件i由恐怖组织v发起的概率。
    更进一步的,所述Yi和Yj的值相同的情况下,如果一个恐怖袭击由多个恐怖组织发起,判定恐怖袭击组织方法给出的是一个最主要的恐怖组织。
    本发明对恐怖袭击事件属性进行分析,将恐怖袭击的行为特征会展示出来,分析挖掘的关键在于不仅利用到了恐怖袭击本身所具有的特征属性,并且也利用到了恐怖袭击之间的内在关系,这使针对恐怖袭击事件分析的正确率有所提高。
    具体实施方式
    基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法首先通过对训练数据(已知恐怖组织的恐怖袭击事件)的特征提取来训练一个朴素贝叶斯分类器。然后根据恐怖袭击事件之间的相似度,每次从需要分类的恐怖袭击事件(测试数据)中选出相似度最大的两个恐怖袭击事件一起通过贝叶斯分类器获得推测结果,即这两个恐怖袭击事件的幕后恐怖组织。
    本方法的具体过程及实施例如下:
    1)对用于训练朴素贝叶斯分类器的恐怖袭击事件的5个属性:恐怖袭击日期、恐怖袭击类型、恐怖袭击地点、恐怖组织意识形态、恐怖袭击目标,进行量化处理,即将文字信息转为数字信息,其量化方式可任意选取,量化方式的不同不会影响最终结果的产生。例如,若总共存在10个地区,可将地区A量化为1,地区B量化为2,以次类推。
    2)用步骤(1)中获得的训练数据训练朴素贝叶斯分类器,获得一个可对恐怖袭击事件做出判定的预测分类器。具体训练方法为:通过已知的训练数据,先获得每个恐怖组织的先验概率P(gi):
    P(gi)=NgiNG]]>
    其中P(gi)表示某个被标记为gi的恐怖组织发起恐怖袭击的先验概率,Ngi为gi恐怖组织发起恐怖袭击的个数,NG表示训练样本中恐怖袭击的总个数;针对每个恐怖组织gi,计算一个关于5个属性的后验概率P(X1,...,X5|Y=gi),表示5个属性在恐怖组织gi所发起的所有恐怖袭击中的分布,X1,...,X5对应上文中5个属性量化后的取值。
    3)将未知恐怖组织的恐怖袭击事件集合(记为T)中的每个恐怖袭击事件的5个属性进行量化后(其量化方法必须与步骤(1)中的量化方法完全一致),采取以下公式计算所有恐怖袭击事件两两之间的相似度:
    s(i,j)=Σk=1mwkθk(Xik,Xjk)]]>
    其中,
    s(i,j)是两个恐怖袭击事件(记为i,j)之间的相似度;
    m是恐怖袭击事件总属性个数,令m=5;
    Xik,为第i个事件的第k个属性,k=1,...,5;
    θk(Xik,Xjk)为事件i,j在第k个属性上的量化关系,其定义为:
    θk(Xik,Xjk)=1/mXik=Xjk0Xik≠Xjk]]>
    wk为第k个属性量化后的权重系数,令wk=1/m;
    4)利用步骤(3)的计算结果,每次从T中选出2个不同的恐怖袭击事件,分别记为i,j,选取方式为:
    (i,j)=argmax(i,j)∈Ts(i,j),i≠j]]>
    5)将步骤(4)选出的2个恐怖袭击事件一起放入训练好的贝叶斯分类器中,让贝叶斯分类器同时对这2个事件做出分类判断,按照如下公式进行分类:
    Yi=Yj=argmaxv(E(Yi=v)E(Yj=v))]]>
    其中,
    Yi和Yj分别为对恐怖袭击事件i,j的预测值。Yi和Yj的值相同,它们的值所代表的是一个恐怖组织,即恐怖袭击事件i,j是由该恐怖组织(Yi)发起的(如果一个恐怖袭击由多个恐怖组织发起,本发明仅给出一个最主要的恐怖组织);
    v为枚举变量;
    E(Yi=v)表示贝叶斯分类器给出的Yi=v的可能性,即第i个恐怖袭击事件是由恐怖组织v发起的可能性:
    E(Yi=v)=P(Yi=v|X1=u1,...,Xm=um)
    上式中关于P(...)的定义来自朴素贝叶斯分类器,表示一个后验概率,即恐怖袭击事件i由恐怖组织v发起的概率。
    本发明可针对全世界范围的恐怖袭击事件做出分析。

    关 键  词:
    基于 恐怖袭击 事件 特征 挖掘 判定 组织 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于恐怖袭击事件特征挖掘的判定恐怖袭击组织方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1004795.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1