书签 分享 收藏 举报 版权申诉 / 8

一种社交网络中的社区结构发现方法.pdf

  • 上传人:a****
  • 文档编号:6161960
  • 上传时间:2019-05-13
  • 格式:PDF
  • 页数:8
  • 大小:1.36MB
  • 摘要
    申请专利号:

    CN201410020036.6

    申请日:

    2014.01.16

    公开号:

    CN103729467A

    公开日:

    2014.04.16

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    专利权的转移 IPC(主分类):G06F 17/30登记生效日:20190123变更事项:专利权人变更前权利人:重庆邮电大学变更后权利人:博拉网络股份有限公司变更事项:地址变更前权利人:400065 重庆市南岸区黄桷垭崇文路2号变更后权利人:401121 重庆市渝北区金开大道西段106号17幢|||授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140116|||公开

    IPC分类号:

    G06F17/30

    主分类号:

    G06F17/30

    申请人:

    重庆邮电大学

    发明人:

    苏畅; 王裕坤; 贾文强; 余跃; 吴琪

    地址:

    400065 重庆市南岸区黄桷垭崇文路2号

    优先权:

    专利代理机构:

    北京同恒源知识产权代理有限公司 11275

    代理人:

    赵荣之

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了一种复杂社交网络中的社区结构发现方法,属于网络技术领域。本方法包括以下步骤:步骤一:将社交网络转换为邻接矩阵形式,如果两个节点之间存在边,那么相对应的元素为1,否则为0;步骤二:利用随机游走理论对邻接矩阵进行处理,得到新的节点度数P-degree以及边权值P-weight;步骤三:根据新的节点度数P-degree得到社交网络中的领袖节点;步骤四:基于领袖节点生成子社区,并通过对子社区的一系列操作来进行社区发现。该方法能够高效的识别出社交网络中的社区结构,同时将本方法与一些经典的社区发现算法如Newman算法相比,在模块度指标上有着更好的表现。将本发明用于后续的社交网络实践中有着重要的意义。

    权利要求书

    权利要求书
    1.  一种社交网络中的社区结构发现方法,其特征在于:包括以下步骤:
    步骤一:将社交网络转换为邻接矩阵形式,如果两个节点之间存在边,那么相对应的元素为1,否则为0;
    步骤二:利用随机游走理论对邻接矩阵进行处理,得到新的节点度数P-degree以及边权值P-weight;
    步骤三:根据新的节点度数P-degree得到社交网络中的领袖节点;
    步骤四:基于领袖节点生成子社区,并通过对子社区的一系列操作来进行社区发现。

    2.  根据权利要求1所述的一种社交网络中的社区结构发现方法,其特征在于:在步骤二中,利用随机游走理论处理社交网络相对应的邻接矩阵,将新的节点度数命名为P-degree,新的边的权值命名为P-weight;领袖节点的基础是P-degree(i)的值;根据原始矩阵A,得到过渡矩阵P,其元素表示为Pij=Aij/ki,其中ki为节点i的度数;同时,根据过渡矩阵P得到Pt,其元素Pijt为一个随机游走者从节点i经过t步走到节点j的概率;矩阵PF用来表示最终得到的矩阵PF=P*θ1+P2*θ2+P3*θ3??+PT*θt,公式中参数θ1、θ2、θ2......θt,0≤θi≤1,1≤i≤t,表示对不同的过渡矩阵赋予不同的权值;根据过渡矩阵PF得到P-degree,(P-degree(i))=PF(i,i)。

    3.  根据权利要求2所述的一种社交网络中的社区结构发现方法,其特征在于:在步骤三中,首先将社交网络中的节点根据P-degree(i)的值进行降序排序,节点数目为n,以降序列表中n/4所处的位置元素作为领袖节点的门限值,然后以此进行领袖节点的选择;确认领袖节点后,以领袖节点作为核心将与领袖节点直接相连的节点合并,初步形成子社区结构。

    4.  根据权利要求3所述的一种社交网络中的社区结构发现方法,其特征在于:在步骤四中,利用按序统计模型进行剩余节点的加入以及子社区重叠部分的处理;使用cos-similarity来表示边的权值,cos-similarity(vi,vj)=(vi,vj)/((vi,vi)*(vj,vj)),]]>其中vi和vj,表示矩阵PF的第i行和第j行行向量;根据cos-similarity的值得到P-weight(i,j)的公式如下:(P-weight(i,j))=w*(cos-similarity),其中w为权值;对子社区Ct,节点i相对于Ct的统计值为对不同的子社区计算不同的δt,δ=max(δ1,δ2δ3......δt),如果δk最大,那么节点i就属于第k个子社区。

    5.  根据权利要求4所述的一种社交网络中的社区结构发现方法,其特征在于:在步骤中需要将较小的社区并入较大的社区中,采用如下步骤进行处理:用min_length来定义小社区概 念,min_length=aver_length(as1,as2......ast)/4,其中,aver_length(as1,as2......ast)表示的是各社区平均节点数目,对于社区之间的合并,采用以下公式进行:ask=max_link(link(as1,ask),link(as2,ask)......link(ast,ask)),link(ast,ask)表示的是ast,ask连接的边的数目,求得ask与所有的社区连接边数最大的那个社区就是将要与ask合并的社区,合并完成后得到相对应的社区结构。

    说明书

    说明书一种社交网络中的社区结构发现方法
    技术领域
    本发明属于网络技术领域,涉及一种复杂社交网络中的社区结构发现方法。
    背景技术
    现实生活中,许多复杂的系统或以复杂网络的形式出现,或者能够被转换为复杂网络,比如社会关系网络,论文合作网络,计算机病毒传播网络,Facebook网络,QQ朋友圈等等。社区发现就是探测并揭示复杂网络中所固有的社区结构。它被用来帮助人们理解复杂网络中的功能,发现隐藏在复杂网络中的规律,和预测复杂网络的行为。自从Girvan和Newman提出GN算法至今,新的理论新的方法层出不穷。社区发现相关算法的应用领域也不断的涌现。
    除了一些经典的社区发现算法,还有一些算法在社区发现中也可以取得比较好的划分效果,例如,韩毅、贾焰等人提出的在社会网络中实现社区发现的方法(专利号:201110103491.9,公开日:2012.05.16);蔺智挺、吴秀龙等人提出的基于随机游走的社区发现方法(专利号:201110177783.7,公开日:2013.01.02);徐冰莹、韩伟红等人提出的一种社区发现方法和系统(专利号:201310201298.8,公开日:2013.09.25)等等。除此之外,张璐、蔡皖东等人提出的社交网络意见领袖识别方法(专利号:201310028159.X,公开日:2013.05.22);蔡琳、蔡皖东等人提出了微博网络意见领袖识别方法(专利号:201310027808,公开日:2013.06.05)等对领袖节点的识别以及作用都做了很好的阐述,但是关于领袖节点的识别也还存在着一些不足。
    基于上述的一些社区发现算法,虽然可以得到相应的社区结构,但是以模块度作为标准进行衡量的时候,还是存在着一些不足,本发明提出了一种基于领袖节点的社区发现算法,旨在更好的得到社交网络中的社区结构,特别在以模块度作为衡量标准的情况下,能够得到较高的模块度值,本发明在实际经典网络数据集中进行测试时,算法性能稳定高效,将算法用于后续的社交网络分析中具有非常重要的意义以及广阔的应用前景。
    发明内容
    有鉴于此,本发明的目的在于提供一种社交网络中的社区结构发现方法,该方法是利用随机游走的思想来进对邻接矩阵进行处理,得到新的节点度数P-degree以及边权值-weight,根据新的节点度数P-degree可以得到社交网络中的领袖节点,基于领袖节点来生成子社区,通过对子社区的一系列操作来进行社区发现。
    为达到上述目的,本发明提供如下技术方案:
    一种社交网络中的社区结构发现方法,包括以下步骤:步骤一:将社交网络转换为邻接矩阵形式,如果两个节点之间存在边,那么相对应的元素为1,否则为0;步骤二:利用随机游走理论对邻接矩阵进行处理,得到新的节点度数P-degree以及边权值P-weight;步骤三:根据新的节点度数P-degree得到社交网络中的领袖节点;步骤四:基于领袖节点生成子社区,并通过对子社区的一系列操作来进行社区发现。
    进一步,在步骤二中,利用随机游走理论处理社交网络相对应的邻接矩阵,将新的节点度数命名为P-degree,新的边的权值命名为P-weight;领袖节点的基础是P-degree(i)的值;根据原始矩阵A,得到过渡矩阵P,其元素表示为Pij=Aij/ki,其中ki为节点i的度数;同时,根据过渡矩阵P得到Pt,其元素Pijt为一个随机游走者从节点i经过t步走到节点j的概率;矩阵PF用来表示最终得到的矩阵PF=P*θ1+P2*θ2+P3*θ3......+PT*θt,公式中参数θ1、θ2、θ2......θt,0≤θi≤1,1≤i≤t,表示对不同的过渡矩阵赋予不同的权值;根据过渡矩阵PF得到P-degree,(P-degree(i))=PF(i,i)。
    进一步,在步骤三中,首先将社交网络中的节点根据P-degree(i)的值进行降序排序,节点数目为n,以降序列表中n/4所处的位置元素作为领袖节点的门限值,然后以此进行领袖节点的选择;确认领袖节点后,以领袖节点作为核心将与领袖节点直接相连的节点合并,初步形成子社区结构。
    进一步,在步骤四中,利用按序统计模型进行剩余节点的加入以及子社区重叠部分的处理;使用cos-similarity来表示边的权值,cos-similarity(vi,vj)=(vi,vj)/((vi,vi)*(vj,vj)),]]>其中vi和vj,表示矩阵PF的第i行和第j行行向量;根据cos-similarity的值得到P-weight(i,j)的公式如下:(P-weight(i,j))=w*(cos-similarity),其中w为权值;对子社区Ct,节点i相对于Ct的统计值为对不同的子社区计算不同的δt,δ=max(δ1,δ2δ3......δt),如果δk最大,那么节点i就属于第k个子社区。
    进一步,在步骤中需要将较小的社区并入较大的社区中,采用如下步骤进行处理:用min_length来定义小社区概念,min_length=aver_length(as1,as2......ast)/4,其中,aver_length(as1,as2......ast)表示的是各社区平均节点数目,对于社区之间的合并,采用以下公式进行:ask=max_link(link(as1,ask),link(as2,ask)......link(ast,ask)),link(ast,ask)表示的是ast,ask 连接的边的数目,求得ask与所有的社区连接边数最大的那个社区就是将要与ask合并的社区,合并完成后得到相对应的社区结构。
    本发明的有益效果在于:本发明提供的社区发现方法,有效的解决了如何更有效的发现领袖节点,并将发现的领袖节点用于社区发现的问题,能够高效的识别出社交网络中的社区结构;同时将本方法与一些经典的社区发现算法如Newman算法相比,在模块度指标上有着更好的表现。将本发明用于后续的社交网络实践中有着重要的意义。
    附图说明
    为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
    图1为本发明所述方法的宏观流程图;
    图2为本方法应用于Karate搏击俱乐部网络拓扑示意图;
    图3为本方法应用于Dolphins关系网络拓扑示意图;
    图4为本方法应用于AmericanFootball俱乐部网络拓扑示意图。
    具体实施方式
    下面将结合附图,对本发明的优选实施例进行详细的描述。
    本发明的整体技术实施方案如下:
    1.算法测试数据集
    在本实施例中,所采用的数据集有三个,分别是Karate俱乐部网络,Dolphins关系网络以及AmericanFootball网络,其网络数据集描述如下:
    1)Karate搏击俱乐部网络
    20世纪70年代初期,Wayne Zachary用两年的时间来观察空手道俱乐部,这家空手道俱乐部是来自美国的一所大学。Wayne Zachary构造了俱乐部成员的网络,这个网络是根据俱乐部内成员之间的社会关系所构成的。然而在他调查过程中发现了该俱乐部的内部问题,就是关于是否提高收费标标准,他们的主管与校长之间意见产生了分歧。结果,一部分成员被教练带走组织成了一个新的俱乐部,而剩下的成员则留在原来的俱乐部,最终Zachary空手道俱乐部分裂成了两个小俱乐部,一个以校长为首,另一个则是以主管为核心。图一所示的是Zachary空手道俱乐部划分成的两个不同的社团,共包含34个成员和78条边,各节点分别代表了分裂后的小俱乐部中的各个成员。在复杂网络的社团结构分析中,Zachary网络已被广泛应用到研究网络社团结构划分算法中,在本发明中我们使用的就是这个数据集。我们将本发明中的算法应用于此数据集,得到的网络拓扑结构如图2所示。
    2)Dolphins关系网络
    在1994年至2001年,D.Lusseau对海豚研究了七年的时间得到了Dolphins关系网络。这个网络一共包含62个节点,其中每一个节点代表一只海豚,两只海豚有亲密的关系,就把这两只海豚代表的节点之间连一条边,我们将本发明的算法应用于此数据集,得到的网络拓扑结构如图3所示。
    3)AmericanFootball网络
    一个美国大学组织的2000季足球连赛季的一场小组比赛。其中网络中的每一个节点代表一个足球队,而节点之间的连边表示的是两个球队之间有比赛。而这次的所有的比赛可以分成12个组,每个球队与属于同一小组的球队比赛次数比较多,大约7场;而与不属于一个小组的比赛相对较少,大约4场,所以这些球队结成了一个具有社团结构的网络。通过我们的算法对美国大学足球赛网络进行划分,这些球队结成了一个具有社团结构的网络。我们将本发明的算法应用于此数据集,得到的网络拓扑结构如图4所示。
    2.实现基于领袖节点的社区发现算法
    为了发现社交网络中的领袖节点以及子社区,首先利用随机游走对邻接矩阵进行处理,得到社区网络中的领袖节点,以领袖节点作为核心构建子社区,然后通过对剩余节点的加入,以及子社区之间的合并得到相应的社区结构。
    根据社交网络相对应的邻接矩阵获得领袖节点具体步骤如下:
    步骤一:通过对社交网络相对的邻接矩阵进行预处理得到P-degree。根据原始矩阵A,得到过渡矩阵P,其元素可以表示为Pij=Aij/ki,其中ki为节点i的度数。于此同时,根据过渡矩阵P得到Pt,其元素表示Pijt表示一个随机游走者从节点i经过t步走到节点j的概率。矩阵PF用来表示最终得到的矩阵PF=P*θ1+P2*θ2+P3*θ3......+PT*θt,公式中参数θ1、θ2、θ2......θt,0≤θi≤1,1≤i≤t,表示对不同的过渡矩阵赋予不同的权值。根据过渡矩阵PF得到P-degree,(P-degree(i))=PF(i,i)。
    步骤二:利用P-degree得到领袖节点以及子社区。首先将社交网络中的节点根据P-degree(i)的值进行降序排序,节点数目为n,以降序列表中n/4所处的位置元素作为领袖节点的门限值,然后以此进行领袖节点的选择。确认领袖节点后,以领袖节点作为核心将与领袖节点直接相连的节点合并,初步形成子社区结构。
    得到领袖节点以及相关子社区之后,剩下的工作就是根据邻接矩阵获得P-weight的值,根据P-weight的值对社交网络中的剩余节点进行加入,最后将获得的子社区进一步合并得到 最终的社区结构。其具体步骤如下:
    步骤一:根据邻接矩阵获得P-weight的值以及剩余节点加入。我们使用cos-similarity来表示边的权值,cos-similarity(vi,vj)=(vi,vj)/((vi,vi)*(vj,vj)),]]>其中vi和vj,表示矩阵PF的第i行和第j行行向量。根据cos-similarity的值得到P-weight(i,j)的公式如下:(P-weight(i,j))=w*(cos-similarity),其中w为权值。对子社区Ct,节点i相对于Ct的统计值为对不同的子社区计算不同的δt,δ=max(δ1,δ2δ3......δt),如果δk最大,那么节点i就属于第k个子社区。
    步骤二:子社区进一步合并得到社区结构。现在得到的社区结构存在多节点重叠现象,以及社区之间的节点数目之差有时候会很大,需要将较小的社区并入较大的社区中,用min_length来定义小社区概念,min_length=aver_length(as1,as2......ast)/4,aver_length(as1,as2......ast)表示的是各社区平均节点数目,至于社区之间的合并,采用以下数学公式ask=max_link(link(as1,ask),link(as2,ask)......link(ast,ask)),link(ast,ask)表示的是ast,ask连接的边的数目,求得ask与所有的社区连接边数最大的那个社区就是将要与ask合并的社区。合并完成后得到相对应的社区结构。
    最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

    关 键  词:
    一种 社交 网络 中的 社区 结构 发现 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种社交网络中的社区结构发现方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-6161960.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1