基于子图采样的大规模属性图上的无监督图表示学习方法和装置.pdf
《基于子图采样的大规模属性图上的无监督图表示学习方法和装置.pdf》由会员分享,可在线阅读,更多相关《基于子图采样的大规模属性图上的无监督图表示学习方法和装置.pdf(10页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010673816.6 (22)申请日 2020.07.14 (71)申请人 北京大学 地址 100871 北京市海淀区颐和园路5号北 京大学 (72)发明人 王佳麟高军白金泽李朝 张吉王佳 (74)专利代理机构 北京君尚知识产权代理有限 公司 11200 代理人 邱晓锋 (51)Int.Cl. G06K 9/62(2006.01) G06N 3/08(2006.01) (54)发明名称 基于子图采样的大规模属性图上的无监督 图表示学习方法和装置 (57)摘要 本发明涉及一。
2、种基于子图采样的大规模属 性图上的无监督图表示学习方法和装置。 该方法 包括: 根据属性图的结构信息和节点属性信息, 对属性图进行子图采样, 生成多张子图; 利用属 性图的结构信息、 节点属性信息和社区信息, 在 每个子图上进行图自编码器的学习, 得到属性图 中节点的低维向量表示。 图自编码器包括编码器 和解码器; 编码器采用图卷积神经网络; 解码器 包含图结构损失重构解码器、 图内容损失重构解 码器以及图社区损失重构解码器。 本发明支持用 户利用此方法以无监督的方式学习大规模属性 图中的节点的低维向量表示, 这些向量表示会尽 可能保留图上的拓扑结构信息和节点属性信息, 这些向量作为输入应用于。
3、不同的下游任务来对 图进行数据挖掘任务。 权利要求书2页 说明书6页 附图1页 CN 111950594 A 2020.11.17 CN 111950594 A 1.一种基于子图采样的大规模属性图上的无监督图表示学习方法, 其特征在于, 包括 以下步骤: 根据属性图的结构信息和节点属性信息, 对属性图进行子图采样, 生成多张子图; 利用属性图的结构信息、 节点属性信息和社区信息, 在每个子图上进行图自编码器的 学习, 得到属性图中节点的低维向量表示。 2.根据权利要求1所述的方法, 其特征在于, 所述子图采样包括: 计算节点影响矩阵其维度大小为N, N, N为图中的节点数量; 通过结合 的有偏。
4、斜的随机游走来采样子图。 3.根据权利要求2所述的方法, 其特征在于, 所述计算节点影响矩阵包括: 利用线性图卷积变换计算节点表示向量矩阵X ; 其中, 线性图卷积变换输入的是图的 邻接矩阵A和节点属性向量矩阵X, 输出的是新的节点表示向量矩阵X , 计算公式为X SKX, 其中其中I是和A大小相同的单位矩阵; 是 的度数矩阵, K代 表节点的感受域覆盖的K阶邻居范围; 根据根据节点表示向量矩阵X 中向量的相似性构造节点影响矩阵 4.根据权利要求3所述的方法, 其特征在于, 节点影响矩阵 的计算公式为: 其中, (X )T是X 的转置, cos代表cosine, 通过cosine函数计算向量相。
5、似度, 同时利用 softmax函数对节点所有邻居相似度做归一化。 5.根据权利要求2所述的方法, 其特征在于, 所述通过结合 的有偏斜的随机游走来采 样子图, 包括: 对于每次子图采样过程, 首先根据图的拓扑结构随机采样种子节点, 然后从每个种子 节点出发, 随机游走一条长度为T的路径; 游走过程中对于所有邻居是根据 来采样; 在全图中, 把包含随机游走路径的节点作为子图的节点从而抽出一张子图。 6.根据权利要求1所述的方法, 其特征在于, 所述图自编码器包括编码器和解码器; 编 码器采用图卷积神经网络; 解码器包含图结构损失重构解码器、 图内容损失重构解码器以 及图社区损失重构解码器, 其。
6、中图结构损失重构解码器用于重构子图上的边, 图内容损失 重构解码器用于重构子图的节点属性向量, 图社区损失重构解码器用于重构子图的社区信 息。 7.根据权利要求6所述的方法, 其特征在于: 所述图结构损失重构解码器, 通过重构子图邻接矩阵的方式来计算损失函数, 即衡量 重构邻接矩阵和真实子图邻接矩阵At的差别来定义损失函数; 所述图内容损失重构解码器, 通过同编码器中完全对称的网络结构来重构子图节点属 性向量矩阵然后通过计算和真实的Xt的差别来定义损失函数。 所述图社区损失重构解码器, 通过最大化子图中的节点向量表示和子图全图向量表示 的互信息来计算损失函数, 包括: 首先根据子图中所有的节点。
7、向量来计算社区向量表示: 其中Nt代表子图中节点的个数, 代表第i个节点的隐层向量表示; 然 后通过利用腐蚀函数打乱子图中的向量表示Xt, 并据此计算腐蚀掉的节点向量表示然后 权利要求书 1/2 页 2 CN 111950594 A 2 在损失函数中迫使semb与Zt更相似, 与更不相似, 通过计算semb同Zt以及的相似程度的不 同来最大化互信息。 8.根据权利要求6所述的方法, 其特征在于, 在训练阶段, 先采样多张子图, 然后在每张 子图上, 根据三种解码器中的损失函数计算神经网络的损失, 然后通过反向传播梯度下降 训练神经网络后, 得到训练好的神经网络的参数; 在推测阶段, 输入全图的。
8、邻接矩阵和节点 向量矩阵, 然后通过训练好参数的图自编码器中的编码器来进行节点隐层向量矩阵的计 算, 得到图表示学习中的节点的低维向量表示。 9.根据权利要求1所述的方法, 其特征在于, 所述属性图为下列中的一种: 属性图采用论文引用数据集, 图中节点是论文, 边是论文引用关系; 属性图采用图片数据集, 图中节点是图片, 当且仅当两张图片有着相似属性时会连边; 属性图采用社区帖子数据集, 图中节点是海报的内容, 两个节点连边当且仅当两个帖 子会被同一个用户评论; 属性图采用电子商务数据集, 图中节点是网页上的商品, 如果两个商品被同一个用户 购买则进行连边。 10.一种采用权利要求19中任一权。
9、利要求所述方法的基于子图采样的大规模属性图 上的无监督图表示学习装置, 其特征在于, 包括: 子图采样模块, 用于根据属性图的拓扑结构信息和节点属性信息, 对属性图进行子图 采样, 生成多张子图; 图自编码器模块, 用于利用属性图的结构信息、 节点属性信息和社区信息, 在每个子图 上进行图自编码器的学习, 得到属性图中节点的低维向量表示。 权利要求书 2/2 页 3 CN 111950594 A 3 基于子图采样的大规模属性图上的无监督图表示学习方法和 装置 技术领域 0001 本发明属于信息技术领域, 具体涉及一种基于子图采样的大规模属性图上的无监 督图表示学习方法和装置。 背景技术 000。
10、2 近年来, 随着互联网的飞速发展, 数据规模爆炸式增长, 数据之间的联系也越来越 复杂紧密。 图以点和边的形式来描述事物及事物间的关系, 是一种能够直观描述客观世界 的数据结构, 广泛存在于生产生活中, 如社交网络, 交通路网, 电子商务。 而这些图中的节点 通常带有丰富的属性信息, 如论文引用网络中, 节点代表论文, 边代表引用关系, 而节点上 的属性信息是论文摘要或者全文的内容。 如何在海量的属性图的数据中高效地挖掘出有效 的信息是一种迫切的需要。 0003 图表示学习是一种挖掘图中信息的方法, 由于有监督任务中, 对海量数据进行人 工打标记代价巨大, 本专利关注无监督的图表示学习问题。。
11、 属性图上的无监督的图表示学 习方法是利用神经网络模型来学习生成图中节点的低维向量表示, 这些向量表示要尽可能 保持图上原有的结构信息和节点的属性信息, 它们(节点向量)可以被用于多种下游任务 (如节点分类, 节点聚类)来挖掘图上的信息。 0004 现有的方法从模型角度可以分为两大类: 基于随机游走的算法, 基于图神经网络 的算法。 基于随机游走的算法在原图中通过随机游走生成多条路径, 然后通过神经网络学 习, 使得在多条路径中一起出现概率大的节点对的节点有着更类似的向量表示。 基于图神 经网络的算法利用图自编码器来学习节点的向量表示, 它在编码器中利用图卷积神经网络 (或者其它图神经网络)来。
12、编码图的结构信息和节点属性信息, 然后在解码器中重构图上的 边。 以上两种算法是通过不同的方法使得网络学习过程中考虑图上的各种维度的信息来学 习节点的低维向量表示, 都是无监督的图表示学习方法。 0005 从算法可扩展性的角度, 现有研究中适用于大规模图(十万级别的点, 百万级别的 边的规模以上)的算法通常是基于随机游走的方法, 它们只利用图中的结构信息。 而基于图 神经网络的算法能够同时利用图中的结构信息和节点属性信息的算法, 但是只适用于小图 上(上千个节点, 上万条边的规模), 可扩展性受限。 0006 从信息利用的角度, 现有的算法, 即上述两类算法, 在损失函数中都只关注图中的 局部。
13、结构信息, 重构边或者局部紧邻的邻居节点, 缺乏对节点属性信息和图上高阶结构信 息(如社区)的利用。 发明内容 0007 为了提高算法的可扩展性, 并且在算法训练过程中对属性图中的各种维度的信息 进行充分利用, 本专利提出了一种基于子图采样的大规模属性图上的无监督图表示学习方 法和装置, 支持用户利用此方法以无监督的方式学习大规模属性图中的节点的低维向量表 说明书 1/6 页 4 CN 111950594 A 4 示, 这些向量表示会尽可能保留图上的拓扑结构信息和节点属性信息, 这些向量作为输入 应用于不同的下游任务来对图进行数据挖掘任务。 0008 本发明采用的技术方案如下: 0009 一种。
14、基于子图采样的大规模属性图上的无监督图表示学习方法, 包括以下步骤: 0010 根据属性图的结构信息和节点属性信息, 对属性图进行子图采样, 生成多张子图; 0011 利用属性图的结构信息、 节点属性信息和社区信息, 在每个子图上进行图自编码 器的学习, 得到属性图中节点的低维向量表示。 0012 进一步地, 所述子图采样包括: 0013计算节点影响矩阵其维度大小为N,N, N为图中的节点数量; 0014通过结合 的有偏斜的随机游走来采样子图。 0015进一步地, 所述计算节点影响矩阵包括: 0016 利用线性图卷积变换计算节点表示向量矩阵X ; 其中, 线性图卷积变换输入的是 图的邻接矩阵A。
15、和节点属性向量矩阵X, 输出的是新的节点表示向量矩阵X , 计算公式为X SKX, 其中其中I是和A大小相同的单位矩阵; 是的度数矩阵, K代表节点的感受域覆盖的K阶邻居范围; 0017根据根据节点表示向量矩阵X 中向量的相似性构造节点影响矩阵 0018进一步地, 所述通过结合 的有偏斜的随机游走来采样子图, 包括: 0019 对于每次子图采样过程, 首先根据图的拓扑结构随机采样种子节点, 然后从每个 种子节点出发, 随机游走一条长度为T的路径; 游走过程中对于所有邻居是根据 来采样; 0020 在全图中, 把包含随机游走路径的节点作为子图的节点从而抽出一张子图。 0021 进一步地, 所述图。
16、自编码器包括编码器和解码器; 编码器采用图卷积神经网络; 解 码器包含图结构损失重构解码器、 图内容损失重构解码器以及图社区损失重构解码器, 其 中图结构损失重构解码器用于重构子图上的边, 图内容损失重构解码器用于重构子图的节 点属性向量, 图社区损失重构解码器用于重构子图的社区信息。 0022 进一步地: 所述图结构损失重构解码器, 通过重构子图邻接矩阵的方式来计算损 失函数, 即衡量重构邻接矩阵和真实子图邻接矩阵At的差别来定义损失函 数; 0023 所述图内容损失重构解码器, 通过同编码器中完全对称的网络结构来重构子图节 点属性向量矩阵然后通过计算和真实的Xt的差别来定义损失函数。 00。
17、24 所述图社区损失重构解码器, 通过最大化子图中的节点向量表示和子图全图向量 表示的互信息来计算损失函数, 包括: 首先根据子图中所有的节点向量来计算社区向量表 示:其中Nt代表子图中节点的个数, 代表第i个节点的隐层向量表 示; 然后通过利用腐蚀函数打乱子图中的向量表示Xt, 并据此计算腐蚀掉的节点向量表示 然后在损失函数中迫使semb与Zt更相似, 与更不相似, 通过计算semb同Zt以及的相似 程度的不同来最大化互信息。 0025 进一步地, 在训练阶段, 先采样多张子图, 然后在每张子图上, 根据三种解码器中 说明书 2/6 页 5 CN 111950594 A 5 的损失函数计算神。
18、经网络的损失, 然后通过反向传播梯度下降训练神经网络后, 得到训练 好的神经网络的参数; 在推测阶段, 输入全图的邻接矩阵和节点向量矩阵, 然后通过训练好 参数的图自编码器中的编码器来进行节点隐层向量矩阵的计算, 得到图表示学习中的节点 的低维向量表示。 0026 进一步地, 所述属性图为下列中的一种: 0027 属性图采用论文引用数据集, 图中节点是论文, 边是论文引用关系; 0028 属性图采用图片数据集, 图中节点是图片, 当且仅当两张图片有着相似属性时会 连边; 0029 属性图采用社区帖子数据集, 图中节点是海报的内容, 两个节点连边当且仅当两 个帖子会被同一个用户评论; 0030 。
19、属性图采用电子商务数据集, 图中节点是网页上的商品, 如果两个商品被同一个 用户购买则进行连边。 0031 一种基于子图采样的大规模属性图上的无监督图表示学习装置, 其包括: 0032 子图采样模块, 用于根据属性图的拓扑结构信息和节点属性信息, 对属性图进行 子图采样, 生成多张子图; 0033 图自编码器模块, 用于利用属性图的结构信息、 节点属性信息和社区信息, 在每个 子图上进行图自编码器的学习, 得到属性图中节点的低维向量表示。 0034 本发明的有益效果如下: 0035 本发明的基于子图采样的大规模属性图上的无监督图表示学习方法是在无监督 设置下, 考虑算法可扩展性, 图中不同维度。
20、信息的利用的情况下实现了图中节点向量的生 成。 该方法的优点是: 1)本方法利用子图采样的形式提高算法的可扩展性, 现有方法大多通 过层级邻居采样来提升算法可扩展性, 子图采样策略与之相比更加灵活且高效, 同时现有 的基于子图采样的方法在子图采样设计时值考虑了图的结构信息, 本发明的子图采样策略 综合考虑图结构信息和节点属性信息, 更加合理有效。 2)现有的利用图自编码器的算法在 解码器中只关注图结构(边)的重构, 本发明的方法在解码器综合考虑图结构信息, 节点内 容信息, 图中高阶结构(社区)的信息使得学习的节点向量表示更加有效。 附图说明 0036 图1是本发明方法的整体框架和流程示意图。。
21、 其中, A表示图的邻接矩阵, X表示节 点属性向量矩阵, At表示子图的邻接矩阵, Xt表示子图的节点属性向量矩阵, 表示自编码 器重构的子图邻接矩阵, 表示自编码器重构的节点属性向量矩阵, 代表被腐蚀函数腐 蚀过的子图邻接矩阵, 表示被腐蚀函数腐蚀过的节点属性向量矩阵。 具体实施方式 0037 为使本发明的上述目的、 特征和优点能够更加明显易懂, 下面通过具体实施例和 附图, 对本发明做进一步详细说明。 0038 本专利是在无监督的设置下利用图神经网络来学习属性图中的节点的低维向量 表示。 为了提升算法的可扩展性, 对于大图, 本专利利用子图采样的方法来减小训练数据规 说明书 3/6 页 。
22、6 CN 111950594 A 6 模, 该子图采样方法综合考虑了图的结构信息和节点属性信息, 使得采样的子图更加合理。 为了网络在学习过程中综合利用图的结构信息, 节点属性信息, 以及图上的社区信息, 在图 自编码器的解码器中设计了与以上三种信息相关的损失函数。 其中社区信息是指节点和其 所属社区(结构上紧密相连, 节点属性信息方面上高度相似的一组点)在节点表示上的相似 性。 0039 本发明方法的整体框架如图1所示。 给定属性图GV,E,X, 其中V代表图中的节 点集, E代表图中的边集, X代表图中的节点属性向量矩阵, A代表G的邻接矩阵。 首先利用子 图采样方法(称为SAMP)对G进。
23、行子图采样生成多张子图, 然后在每个子图上进行图自编码 器的学习, 图自编码器的编码器利用的是图卷积神经网络(这里的图卷积神经网络指的是 GCN Layer), 图自编码器的解码器包含三个模块, 图结构损失重构解码器(这里用的是 Product Layer), 图内容损失重构解码器, 图社区损失重构解码器。 其中图结构损失重构解 码器是重构子图上的边(这里的loss是L1), 图内容损失重构解码器是重构子图的节点属性 向量(这里的loss是L2), 图社区损失重构解码器是重构子图的社区信息(这里的loss是 L3)。 0040 下面给出子图采样, 图自编码器两块的详细构造以及具体实施方式。 0。
24、041 1.子图采样: 0042 对于给定的图G, 本发明的采样方法SAMP可以使得图上在结构和内容角度联系紧 密的节点对被采样到同一张子图的概率更大, 并且保证子图不会过于稀疏。 0043 具体来说, 子图采样包括以下步骤: 00441)计算节点影响矩阵 0045节点影响矩阵 的维度大小为N,N, N为图中的节点数量, 这个矩阵衡量了不同节 点之间的相关性。 0046为了计算首先利用线性图卷积变换计算节点表示向量矩阵X , 然后根据节点表 示向量的相似性构造节点影响矩阵这里的线性图卷积变换输入的是图的邻接矩阵A, 和 节点属性向量矩阵X, 输出的是新的节点表示向量矩阵X , 计算公式为X S。
25、KX, 其中 其中I是和A大小相同的单位矩阵, 是的度数矩阵。 这样X 就结 合了图的结构信息和节点内容信息(即节点属性信息)。 这里的K代表的是节点的感受域覆 盖的K阶邻居范围, 通常被设置为2, 即代表节点通过计算过程可以感受到的2阶邻居的信 息。 0047给定节点表示向量矩阵X , 可以 计算节点影响矩阵计算公式为 其中(X )T是X 的转置, cos代表cosine, 通过cosine函数计算向量 相似度, 同时利用softmax函数对节点所有邻居相似度做归一化。 00482)通过结合 的有偏斜的随机游走来采样子图 0049在得到 后, 通过结合 的有偏斜的随机游走来采样子图。 对于每。
26、次子图采样过程, 首先根据图的拓扑结构(如节点度数, Pagerank值)来随机采样种子节点, 然后从每个种子 节点出发, 随机游走一条长度为T的路径, 游走过程中, 对于所有邻居, 是根据 来采样, 这样 相关性高的节点就有更高的概率出现在一条随机游走路径中。 然后在全图中, 把包含这些 说明书 4/6 页 7 CN 111950594 A 7 随机游走路径的节点作为子图的节点抽出一张子图。 0050 2.图自编码器: 0051 在得到多张子图后, 每个子图上训练图自编码器这一神经网络, 图自编码器分为 编码器和解码器两个模块, 解码器又细分为图结构损失重构解码器, 图内容损失重构解码 器,。
27、 图社区损失重构解码器三部分。 下面分别给出其具体实现形式: 0052 假设子图是GtAt,Xt, 其中At是子图的邻接矩阵, Xt是子图的节点属性向量矩 阵。 0053 本专利中的图编码器, 利用图神经网络, 编码图的结构信息和节点内容信息, 可以 利用很多种形式的图神经网络如图卷积神经网络, 图注意力机制神经网络。 这里给出图卷 积神经网络其中l代表网络的第l层,代表网络中第l层的节点 向量表示, St同S在A中的定义相同, Wl是第l层中的可训练的参数, 为网络中的激活函数, 通常被设置为RELU。 这样经过L层网络后, 得到网络中的隐层节点向量表示 0054 本专利中的图结构损失重构解。
28、码器, 是通过重构子图邻接矩阵的方式来计算损失 函数, 即衡量重构邻接矩阵和真实子图邻接矩阵At的差别来定义损失函数。 0055 本专利中的图内容损失重构解码器, 是通过重构子图节点属性向量矩阵的方式来 计算损失函数, 它通过同编码器中完全对称的网络结构来重构子图节点属性向量矩阵 然后通过计算和真实的Xt的差别来定义损失函数。 0056 本专利中的图社区损失重构解码器, 是通过最大化子图中的节点向量表示和子图 全图(社区)向量表示的互信息来计算损失函数。 首先根据一种聚合计算的方式, 根据子图 中所有的节点向量来计算社区向量表示:其中Nt代表子图中节点的个 数, 而代表第i个节点的隐层向量表示。
29、。 然后通过利用腐蚀函数打乱子图, 得到腐蚀后的 子图邻接矩阵矩阵以及腐蚀后的节点向量表示并据此计算腐蚀掉的节点向量表示 然后在损失函数中迫使semb与Zt更相似, 与更不相似, 通过计算semb同Zt以及的相似 程度的不同来最大化互信息。 0057 在训练阶段, 先采样多张子图, 然后每张子图上, 根据上述三种解码器中的损失函 数计算神经网络的损失, 然后通过反向传播梯度下降训练神经网络后, 得到训练好的神经 网络的参数。 在推测阶段, 输入全图的邻接矩阵和节点向量矩阵, 然后通过训练好参数的图 自编码器中的编码器来进行节点隐层向量矩阵的计算, 得到最后的图表示学习中的节点的 低维向量表示,。
30、 这些低维向量表示可以方便地用于下游不同的图数据挖掘任务, 比如节点 分类, 节点聚类等。 0058 为了测试方法的有效性, 在六个公开的属性图数据集上进行了实验, 其中Cora, Citeseer和Pubmed是论文引用数据集, 它们的图中节点是论文, 边是论文引用关系, Cora数 据集中有2708个点, 5429条边, Citeseer有3327个点, 4732条边, Pumbed有19717个点, 44338 条边。 Flickr是图片数据集, 节点是图片, 当且仅当两张图片有着相似属性时会连边, 它有 89250个点, 899756条边。 Reddit是社区帖子数据集, 节点是海报的。
31、内容, 两个节点连边当且 说明书 5/6 页 8 CN 111950594 A 8 仅当两个帖子会被同一个用户评论, Reddit有232965个点, 11606919条边。 Amazon数据集是 电子商务数据集, 节点是Amazon网页上的商品, 如果两个商品被同一个用户购买则会进行 连边, 它有1008606个点, 116196671条边。 0059 在以上六个数据集上, 利用生成的节点向量表示接入节点分类任务, 节点分类任 务利用简单的logistic回归分析来根据节点向量对输入的节点进行分类, 评价指标用分类 精确度和F1分数(F1 Score)来评判。 实验结果表明, 本专利的方法在。
32、无监督的图表示学习 中达到了优秀的结果, 比已有的先进方法平均高出5个百分点。 同时还在Cora和Citeseer数 据集上, 利用生成的节点向量下游接入节点聚类任务, 利用生成的节点向量后面接入K- means算法进行聚类, 评测指标用归一化互信息(NMI), 社区分类精确度等来评测聚类结果, 实验发现, 本发明的方法比已有的先进的图表示学习方法提高平均高出7个百分点。 0060 随着信息时代的来临, 互联网上数据规模海量增长, 数据之间的关系越来越复杂, 这时利用属性图这一数据结构就能够更好的描述和表达数据的特征和它们之间的关系。 同 时, 在不同的属性图中的数据挖掘任务中, 对海量数据进。
33、行人工打标记的代价巨大, 所以无 监督设置下的属性图中的图表示学习任务显得尤为重要。 本专利结合近年来被广泛研究和 使用的深度学习技术图神经网络来进行图表示学习任务, 通过子图采样的策略提高算法的 可扩展性, 通过对图结构信息, 图中节点的属性信息, 以及图中的社区信息的利用学习到更 好的节点向量表示, 以供下游不同图数据挖掘任务使用。 1)本发明首先是能够应用于大规 模属性图(百万级节点, 上亿条边)上的图表征学习, 例如社交网络中的用户表征学习, 电子 商务中的商品表征学习等。 2)本发明适用于带有丰富节点属性的图中, 例如学术论文引用 网络中, 图中的节点(论文)有着丰富的文本表示, 这。
34、些文本信息可以被更好的利用。 3)本发 明所学习的节点的低维向量表示, 可以应用于不同的下游的图挖掘任务, 例如这些向量可 以直接通过聚类算法来发掘图中的社区信息, 可以通过线性的逻辑回归层来判断图中的链 接预测任务和节点分类任务等。 0061 基于同一发明构思, 本发明的另一个实施例提供一种采用本发明方法的大规模属 性图上的无监督图表示学习装置, 其包括: 0062 子图采样模块, 用于根据属性图的拓扑结构信息和节点属性信息, 对属性图进行 子图采样, 生成多张子图; 0063 图自编码器模块, 用于利用属性图的结构信息、 节点属性信息和社区信息, 在每个 子图上进行图自编码器的学习, 得到。
35、属性图中节点的低维向量表示。 0064 基于同一发明构思, 本发明的另一个实施例提供一种电子装置(计算机、 服务器、 智能手机等), 其包括存储器和处理器, 所述存储器存储计算机程序, 所述计算机程序被配 置为由所述处理器执行, 所述计算机程序包括用于执行本发明方法中各步骤的指令。 0065 基于同一发明构思, 本发明的另一个实施例提供一种计算机可读存储介质(如 ROM/RAM、 磁盘、 光盘), 所述计算机可读存储介质存储计算机程序, 所述计算机程序被计算 机执行时, 实现本发明方法的各个步骤。 0066 以上公开的本发明的具体实施例和附图, 其目的在于帮助理解本发明的内容并据 以实施, 本领域的普通技术人员可以理解, 在不脱离本发明的精神和范围内, 各种替换、 变 化和修改都是可能的。 本发明不应局限于本说明书的实施例和附图所公开的内容, 本发明 的保护范围以权利要求书界定的范围为准。 说明书 6/6 页 9 CN 111950594 A 9 图1 说明书附图 1/1 页 10 CN 111950594 A 10 。
- 内容关键字: 基于 采样 大规模 属性 监督 图表 学习方法 装置
基于捕获模块验证的载波防错锁方法、装置及数据接收机.pdf
浅层气浮设备.pdf
安全防护装置及冲床.pdf
市电路灯灯杆结构及其LED路灯.pdf
激光复合清洗装置.pdf
具有防撞功能的海洋环境监测设备安装装置.pdf
通讯线缆盘卷装置.pdf
防尘式EVA塑料粒破碎机.pdf
晶圆检测的承载治具.pdf
多级滑杆机构的太阳能板角度调节装置.pdf
新型锚索注浆装置.pdf
便于定长控制的不锈钢激光切割机.pdf
用于输配电线路仿线飞行的激光雷达.pdf
单主梁吊钩门式起重机.pdf
具有防尘功能的振动电机.pdf
矿用单轨式吊载人车.pdf
水生态环境治理的污水回用设备.pdf
条装食品装袋机的条装食品组输送机构.pdf
条装食品的堆叠机.pdf
建筑施工振捣装置.pdf
节能型白法沥青烟净化系统.pdf
可调节取样位置的取样器.pdf
管柱筒调节支架机加工定位工装.pdf
高压厚壁球壳外壁裂纹应力强度因子的计算方法.pdf
电极组件及其制备方法、电池单体、电池和用电装置.pdf
混凝土喷淋养护装置.pdf
地坪研磨机齿轮箱.pdf
智能充电桩用车牌识别系统及方法.pdf
基于深度相机的矩形托盘孔识别方法及系统.pdf
免烧砖及其制备方法.pdf
高抗风强度的三角通讯塔结构.pdf
电传改装系统、其安装方法及车辆.pdf