用于理解图卷积神经网络的可视分析方法.pdf
《用于理解图卷积神经网络的可视分析方法.pdf》由会员分享,可在线阅读,更多相关《用于理解图卷积神经网络的可视分析方法.pdf(22页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910973555.7 (22)申请日 2019.10.14 (71)申请人 杭州电子科技大学 地址 310018 浙江省杭州市下沙高教园区2 号大街 (72)发明人 史晓颖僧德文吕凡顺徐海涛 (74)专利代理机构 杭州浙科专利事务所(普通 合伙) 33213 代理人 吴秉中 (51)Int.Cl. G06K 9/62(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于理解图卷积神经网络的可视分析 方法 。
2、(57)摘要 本发明公开了一种用于理解图卷积神经网 络的可视分析方法, 包括如下步骤: 步骤一, 将输 入的图结构数据集划分为训练集、 验证集和测试 集; 步骤二, 定义参数集合, 包括隐藏层数集合和 隐藏神经元数集合; 步骤三, 基于定义好的所述 参数集合, 训练得到一系列的图卷积神经网络模 型; 步骤四, 设计隐藏层分析视图, 展示隐藏层参 数对分类准确率的影响; 步骤五, 设计损失和准 确率视图, 展示所述模型迭代训练过程中损失和 分类准确率的变化; 步骤六, 采用GraphTSNE可视 化方法计算图中节点的位置, 设计图布局视图, 呈现在不同训练步数下所述节点的预测情况和 两个训练步数。
3、间所述节点预测情况的差异。 权利要求书3页 说明书8页 附图10页 CN 110781933 A 2020.02.11 CN 110781933 A 1.一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 包括如下步骤: 步骤一, 将输入的图结构数据集划分为训练集、 验证集和测试集; 步骤二, 定义参数集合, 包括隐藏层数集合和隐藏神经元数集合; 步骤三, 基于定义好的所述参数集合, 训练得到一系列的图卷积神经网络模型; 步骤四, 设计隐藏层分析视图, 展示隐藏层参数对分类准确率的影响; 步骤五, 设计损失和准确率视图, 展示所述模型迭代训练过程中损失和分类准确率的 变化; 步骤六, 采。
4、用GraphTSNE可视化方法计算图中节点的位置, 设计图布局视图, 呈现在不 同训练步数下所述节点的预测情况和两个训练步数间所述节点预测情况的差异。 2.根据权利要求1所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述步骤一, 所述图结构数据集可以表示为G(V,E), 其中所述为具有N个所述节 点的节点集合, 所述为边集合, 所述vi和所述vj分别表示第i个和第j个节 点; 邻接矩阵ARNN编码了所述节点间的关联, 特征矩阵XRNC包含所有所述节点的特征 向量, 其中每个所述节点vi具有一个C维的所述特征向量xi和一个类别标签, 所述数据集共 有F个类别; 根据所述节点的总。
5、数N将所述数据集划分为所述训练集、 所述验证集和所述测 试集。 3.根据权利要求1所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述步骤二, 定义所述隐藏层数集合为1, 2, 3; 对于每个隐藏层, 使用layerID-startID: stepID:endID来定义所述隐藏神经元数集合, 所述layerID为隐藏层数, 所述startID为第 ID个所述隐藏层的起始隐藏神经元数, 所述stepID为每次递增的隐藏神经元数, 所述endID 为第ID个所述隐藏层的结束隐藏神经元数。 4.根据权利要求1所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述步骤三,。
6、 具有一个隐藏层的图卷积神经网络模型表示为 其中所述所述所述IN是一个单位矩阵, 是一个对角矩阵, 且 所述是从输入层到所述第一个隐藏层的权重矩阵, 所述第一个隐藏层 具有H1个特征图, 所述是从所述第一个隐藏层到输出层的所述权重矩阵, 所述F为 类别数量, 所述softmax()和所述ReLu()代表激励函数; 具有两个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到第所述一个隐藏层的所述权重矩阵, 所述第一个隐藏 层具有所述H1个特征图, 所述是从所述第一个隐藏层到第二个隐藏层的所述权重 矩阵, 所述第二个隐藏层具有所述H2个特征图, 所述是从所述第二个隐藏层到所述 输出层的所述。
7、权重矩阵; 具有三个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到 所述第一个隐藏层的所述权重矩阵, 所述第一个隐藏层具有所述H1个特征图, 所述 是从所述第一个隐藏层到第二个隐藏层的所述权重矩阵, 所述第二个隐藏层具有 权利要求书 1/3 页 2 CN 110781933 A 2 所述H2个特征图, 所述是从所述第二个隐藏层到三个隐藏层的权重矩阵, 所述第 三个隐藏层具有所述H3个特征图, 所述是从所述第三个隐藏层到所述输出层的所 述权重矩阵; 当所述隐藏层数为一层、 二层、 三层时, 分别选择相应的所述图卷积神经网络模型, 从 所述隐藏神经元数集合layerID-startID。
8、:stepID:endID中得到所述H1、 H2和H3的取值范 围; 在训练过程中, 使用epoch表示所述训练步数, epoch1表示所有训练数据集都训练过 一次, 使用Xavier初始化方法对初始的所述权重矩阵进行随机赋值, 使用Adam方法训练所 述模型, 以交叉熵作为损失函数; 在所述迭代训练过程中, 针对每一个所述epoch, 分别计算 所述训练集和所述验证集的损失和分类准确率; 在训练完成得到相应的图卷积神经网络模 型后, 采用所述测试集计算模型的所述分类准确率。 5.根据权利要求1所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述步骤四, 采用基于网格的可视化方。
9、法来设计隐藏层分析视图, 展示隐藏层参数对所述 分类准确率的影响, 所述隐藏层参数包括所述隐藏层数和每层的所述隐藏神经元数, 设计 三个子视图来分别展示具有不同所述隐藏层的所述图卷积神经网络模型的所述分类准确 率; 对于所述具有一个隐藏层的图卷积神经网络模型, 设计一个隐藏层子视图, 首先基于 所述隐藏神经元数集合layer1-start1:step1:end1计算所述集合中的所有元素, 然后采 用一维网格来渲染所述一个隐藏层子视图; 其中x轴表示所述第一个隐藏层中隐藏神经元 的数量; 对于所述具有两个隐藏层的图卷积神经网络模型, 设计两个隐藏层子视图, 首先基于 所述隐藏神经元数集合laye。
10、r1-start1:step1:end1和layer2-start2:step2:end2计 算所述集合中的所有元素, 然后采用二维网格来渲染所述两个隐藏层子视图; 其中所述x轴 表示所述第一个隐藏层中所述隐藏神经元的数量, y轴表示所述第二个隐藏层中所述隐藏 神经元的数量; 对于所述具有三个隐藏层的图卷积神经网络模型, 设计三个隐藏层子视图, 首先基于 所述隐藏神经元数集合layer1-start1:step1:end1、 layer2-start2:step2:end2和 layer3-start3:step3:end3计算所述集合中的所有元素, 然后用所述二维网格编码前两 个所述隐藏层中。
11、的所述隐藏神经元的数量, 最后将多个所述二维网格并列排放来编码所述 第三个隐藏层的所述隐藏神经元数量, 并采用并列排放的所述二维网格来渲染所述三个隐 藏层子视图; 其中第一个所述二维网格展示了当所述第三个隐藏层的所述隐藏神经元数为 start3时的所述分类准确率, 第二个所述二维网格展示了当所述第三个隐藏层的所述隐藏 神经元数为start3+step3时的所述分类准确率, 以此类推, 直到最后一个所述二维网格展 示的所述第三个隐藏层的所述隐藏神经元数为end3时的所述分类准确率; 每个所述子视图中网格的颜色编码了每一种所述参数组合在所述测试集上的所述分 类准确率。 6.根据权利要求1所述的一种。
12、用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述步骤五, 所述损失和准确率视图包括损失子视图和准确率子视图, 所述两个子视图的x 轴代表epoch, y轴分别代表所述损失和所述分类准确率, 所述损失子视图包括所述训练集 和所述验证集的损失曲线, 所述准确率子视图包括所述训练集和所述验证集的分类准确率 权利要求书 2/3 页 3 CN 110781933 A 3 曲线, 当选中所述隐藏层分析视图中的一格时, 表明选择了对应所述隐藏层参数的一个所 述模型, 此时, 所述损失和准确率视图会同步更新来展示所选择的所述模型对应的所述曲 线。 7.根据权利要求1所述的一种用于理解图卷积神经网络的。
13、可视分析方法, 其特征在于, 所述步骤六, 包括如下步骤: (1)采用所述GraphTSNE可视化方法将具有高维特征向量的所述节点集合V映射到二维 点空间中; 所述特征矩阵X可以表示为一个特征集合每个节点的所述特征向 量xi可以被看作是一个高维点, 采用所述GraphTSNE可视化方法得到一个非线性的映射函 数, 所述映射函数将所述高维特征向量映射到二维点空间, 基于所述映射函数计算所述每 个节点的位置, 并采用所述每个节点的位置渲染图布局中的节点; (2)设计图布局视图, 所述图布局视图包括预测版本和差异比较版本; 所述预测版本展示所述图卷积神经网络模型在不同状态下的预测情况, 所述预测版本。
14、 包括初始状态视图和中间状态视图, 所述初始状态视图展示了图结构数据初始时的布局情 况, 节点位置由所述GraphTSNE可视化方法计算得到, 对于所述训练集中的节点, 由于节点 类别是已知的, 节点颜色代表真实的类别, 对于其他节点, 即所有不在训练集中的节点, 所 述节点颜色用灰色表示; 所述中间状态视图随着所述epoch的增加, 节点预测状况会变化, 用户首先需要输入一个所述epoch, 所述视图中用带有外环的较大圆点表示训练集节点, 一 个圆点的中心颜色表示该节点真实的类别, 所述外环颜色表示在当前epoch中节点的预测 类别, 如果所述预测类别正确, 则所述圆点的所述中心颜色和所述外。
15、环颜色是相同的, 对于 其他节点, 用灰色表示在当前epoch中被预测错误的节点, 而被预测正确的节点用它们真实 的类别颜色所表示; 所述差异比较版本, 首先需要用户输入startEpoch和endEpoch两个数值, 分别表示起 始训练步数和终止训练步数, 所述节点位置由GraphTSNE计算得到, 在所述startEpoch中被 预测错误而在所述endEpoch中被预测正确的节点用它们真实的所述类别颜色绘制, 剩余的 节点则用灰色所表示。 8.根据权利要求5所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 当选中所述网格的一格时, 显示该格的细节信息, 所述细节信息包括每一层。
16、中的隐藏神经 元数取值和对应的所述分类准确率。 9.根据权利要求5所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在于, 所述颜色采用渐变的颜色映射机制, 使不同颜色的所述网格对应不同的所述分类准确率。 10.根据权利要求7所述的一种用于理解图卷积神经网络的可视分析方法, 其特征在 于, 所述图布局视图, 当选中一个节点时, 不仅展示对应的预测信息, 同时显示该节点直接 相连的邻居节点, 所述预测信息包括节点ID、 真实类别和所述预测类别。 权利要求书 3/3 页 4 CN 110781933 A 4 一种用于理解图卷积神经网络的可视分析方法 技术领域 0001 本发明涉及了图卷积神经。
17、网络, 尤其是涉及了一种用于理解图卷积神经网络的可 视分析方法。 背景技术 0002 随着人工智能的发展, 图卷积神经网络(Graph Convolutional Network, GCN)在 近几年来受到了广泛的关注。 GCN可以用于处理任意结构的图数据, 并被成功用于处理不同 的任务, 如对推荐系统做推荐、 预测交通状况、 对引文网络中的文章进行分类等。 0003 尽管GCN被用于解决各类问题, 但由于其内在的复杂性和非线性结构, 人们对其底 层的决策过程和模型为什么能实现良好的性能没有得到很好的理解。 解释和理解深度神经 网络是现阶段人工智能研究的热点之一。 现有的数据可视分析方法能辅助。
18、人们理解深度神 经网络, 但主要针对卷积神经网络、 循环神经网络和深度强化学习模型等。 现有的研究缺乏 以一种易于理解的方式分析GCN的内部操作和执行过程。 0004 由于图结构数据集内在的复杂性, 如何可视化GCN的决策过程存在三大难点。 0005 1)图节点通常包含高维特征, 且节点间的关系非常复杂。 常用的可视化图数据的 方法有力导引图和t-SNE(t-distributed Stochastic Neighbor Embedding, t-分布领域 嵌入)降维方法。 前者只考虑了节点间的关联, 会生成拥挤的节点聚集。 后者只能对节点的 特征维度进行降维, 忽略了图结构信息。 如何同时考。
19、虑节点特征和节点间的关系来布局节 点, 生成简洁清楚的图布局结果是一个难点。 0006 2)多种因素会影响GCN模型预测的准确率, 如隐藏层数、 隐藏神经元数、 训练步数 等。 需要设计可视化视图直观地呈现多种因素的影响。 0007 3)分析者可能不熟悉GCN, 需要设计一种可视分析方法支持自上而下、 渐进式地分 析GCN, 帮助分析者快速理解模型的运行机理。 发明内容 0008 为解决现有技术的不足, 使分析GCN的操作和过程更易于理解, 本发明采用如下的 技术方案: 0009 一种用于理解图卷积神经网络的可视分析方法, 包括如下步骤: 0010 步骤一, 将输入的图结构数据集划分为训练集、。
20、 验证集和测试集; 0011 步骤二, 定义参数集合, 包括隐藏层数集合和隐藏神经元数集合; 0012 步骤三, 基于定义好的所述参数集合, 训练得到一系列的图卷积神经网络模型; 0013 步骤四, 设计隐藏层分析视图, 展示隐藏层参数对分类准确率的影响; 0014 步骤五, 设计损失和准确率视图, 展示所述模型迭代训练过程中损失和分类准确 率的变化; 0015 步骤六, 采用GraphTSNE可视化方法计算图中节点的位置, 设计图布局视图, 呈现 在不同训练步数下所述节点的预测情况和两个训练步数间所述节点预测情况的差异。 说明书 1/8 页 5 CN 110781933 A 5 GraphT。
21、SNE是一种图结构数据的可视化方法。 0016所述步骤一, 所述图结构数据集可以表示为G(V,E), 其中所述为具有N 个所述节点的节点集合, 所述为边集合, 所述vi和所述vj分别表示第i个和 第j个节点; 邻接矩阵ARNN编码了所述节点间的关联, 特征矩阵XRNC包含所有所述节 点的特征向量, 其中每个所述节点vi具有一个C维的所述特征向量xi和一个类别标签, 所述 数据集共有F个类别; 根据所述节点的总数N将所述数据集划分为所述训练集、 所述验证集 和所述测试集, 如将5的节点划分到训练集, 训练集中的节点类别是已知的, 且每个类别 包含的节点个数相同; 将20的节点划分到验证集, 将4。
22、0的节点划分到测试集。 0017 所述步骤二, 定义所述隐藏层数集合为1, 2, 3, 由于当隐藏层数较大时, 图卷积 神经网络的分类性能不佳, 因此最多考虑3个隐藏层, 保证图卷积神经网络有较好的分类性 能; 对于每个隐藏层, 使用layerID-startID:stepID:endID来定义所述隐藏神经元数集 合, 所述layerID为隐藏层数, 所述startID为第ID个所述隐藏层的起始隐藏神经元数, 所述 stepID为每次递增的隐藏神经元数, 所述endID为第ID个所述隐藏层的结束隐藏神经元数, 如1-16:16:80表示选择16,32,48,64,80作为第一个隐藏层的所述隐藏。
23、神经元数。 0018 所述步骤三, 具有一个隐藏层的图卷积神经网络模型表示为 其中所述所述所述IN是一个单位矩 阵, 是一个对角矩阵, 且所述是从输入层到所述第一个隐藏层的权重 矩阵, 所述第一个隐藏层具有H1个特征图, 所述是从所述第一个隐藏层到输出层 的所述权重矩阵, 所述F为类别数量, 所述softmax()和所述ReLu()代表激励函数; 0019 具有两个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到第所述一 个隐藏层的所述权重矩阵, 所述第一个隐藏层具有所述H1个特征图, 所述是从所 述第一个隐藏层到第二个隐藏层的所述权重矩阵, 所述第二个隐藏层具有所述H2个特征 图,。
24、 所述是从所述第二个隐藏层到所述输出层的所述权重矩阵; 0020 具有三个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到 所述第一个隐藏层的所述权重矩阵, 所述第一个隐藏层具有所述H1个特征图, 所述 是从所述第一个隐藏层到第二个隐藏层的所述权重矩阵, 所述第二个隐藏层具有 所述H2个特征图, 所述是从所述第二个隐藏层到三个隐藏层的权重矩阵, 所述第 三个隐藏层具有所述H3个特征图, 所述是从所述第三个隐藏层到所述输出层的所 述权重矩阵; 0021 当所述隐藏层数为一层、 二层、 三层时, 分别选择相应的所述图卷积神经网络模 型, 从所述隐藏神经元数集合layerID-startI。
25、D:stepID:endID中得到所述H1、 H2和H3的取 值范围; 在训练过程中, 使用epoch表示所述训练步数, epoch1表示所有训练数据集都训 练过一次, 使用Xavier初始化方法对初始的所述权重矩阵进行随机赋值, 使用Adam方法训 练所述模型, 以交叉熵作为损失函数; 在所述迭代训练过程中, 针对每一个所述epoch, 分别 说明书 2/8 页 6 CN 110781933 A 6 计算所述训练集和所述验证集的损失和分类准确率; 在训练完成得到相应的图卷积神经网 络模型后, 采用所述测试集计算模型的所述分类准确率。 0022 所述步骤四, 采用基于网格的可视化方法来设计隐藏。
26、层分析视图, 展示隐藏层参 数对所述分类准确率的影响, 所述隐藏层参数包括所述隐藏层数和每层的所述隐藏神经元 数, 设计三个子视图来分别展示具有不同所述隐藏层的所述图卷积神经网络模型的所述分 类准确率; 0023 对于所述具有一个隐藏层的图卷积神经网络模型, 设计一个隐藏层子视图, 首先 基于所述隐藏神经元数集合layer1-start1:step1:end1计算所述集合中的所有元素, 然 后采用一维网格来渲染所述一个隐藏层子视图; 其中x轴表示所述第一个隐藏层中隐藏神 经元的数量; 0024 对于所述具有两个隐藏层的图卷积神经网络模型, 设计两个隐藏层子视图, 首先 基于所述隐藏神经元数集合。
27、layer1-start1:step1:end1和layer2-start2:step2: end2计算所述集合中的所有元素, 然后采用二维网格来渲染所述两个隐藏层子视图; 其中 所述x轴表示所述第一个隐藏层中所述隐藏神经元的数量, y轴表示所述第二个隐藏层中所 述隐藏神经元的数量; 0025 对于所述具有三个隐藏层的图卷积神经网络模型, 设计三个隐藏层子视图, 首先 基于所述隐藏神经元数集合layer1-start1:step1:end1、 layer2-start2:step2:end2 和layer3-start3:step3:end3计算所述集合中的所有元素, 然后用所述二维网格编码前。
28、 两个所述隐藏层中的所述隐藏神经元的数量, 最后将多个所述二维网格并列排放来编码所 述第三个隐藏层的所述隐藏神经元数量, 并采用并列排放的所述二维网格来渲染所述三个 隐藏层子视图; 其中第一个所述二维网格展示了当所述第三个隐藏层的所述隐藏神经元数 为start3时的所述分类准确率, 第二个所述二维网格展示了当所述第三个隐藏层的所述隐 藏神经元数为start3+step3时的所述分类准确率, 以此类推, 直到最后一个所述二维网格 展示的所述第三个隐藏层的所述隐藏神经元数为end3时的所述分类准确率; 0026 每个所述子视图中网格的颜色编码了每一种所述参数组合在所述测试集上的所 述分类准确率。 。
29、0027 所述步骤五, 所述损失和准确率视图包括损失子视图和准确率子视图, 所述两个 子视图的x轴代表epoch, y轴分别代表所述损失和所述分类准确率, 所述损失子视图包括所 述训练集和所述验证集的损失曲线, 所述准确率子视图包括所述训练集和所述验证集的分 类准确率曲线, 当选中所述隐藏层分析视图中的一格时, 表明选择了对应所述隐藏层参数 的一个所述模型, 此时, 所述损失和准确率视图会同步更新来展示所选择的所述模型对应 的所述曲线。 0028 所述步骤六, 包括如下步骤: 0029 (1)采用所述GraphTSNE可视化方法将具有高维特征向量的所述节点集合V映射到 二维点空间中; 所述特征。
30、矩阵X可以表示为一个特征集合每个节点的所述特 征向量xi可以被看作是一个高维点, 采用所述GraphTSNE可视化方法得到一个非线性的映 射函数, 所述映射函数将所述高维特征向量映射到二维点空间, 基于所述映射函数计算所 述每个节点的位置, 并采用所述每个节点的位置渲染图布局中的节点; 0030 (2)设计图布局视图, 所述图布局视图包括预测版本和差异比较版本; 说明书 3/8 页 7 CN 110781933 A 7 0031 所述预测版本展示所述图卷积神经网络模型在不同状态下的预测情况, 帮助用户 观察节点预测情况的演化过程; 所述预测版本包括初始状态视图和中间状态视图, 所述初 始状态视。
31、图展示了图结构数据初始时的布局情况, 节点位置由所述GraphTSNE可视化方法 计算得到, 对于所述训练集中的节点, 由于节点类别是已知的, 节点颜色代表真实的类别, 对于其他节点, 即所有不在训练集中的节点, 所述节点颜色用灰色表示; 所述中间状态视图 随着所述epoch的增加, 节点预测状况会变化, 在观察所述中间状态视图时, 用户首先需要 输入一个所述epoch, 所述视图中用带有外环的较大圆点表示训练集节点, 一个圆点的中心 颜色表示该节点真实的类别, 所述外环颜色表示在当前epoch中节点的预测类别, 如果所述 预测类别正确, 则所述圆点的所述中心颜色和所述外环颜色是相同的, 用户。
32、从中可以识别 出一个训练节点是否被正确预测, 对于其他节点, 用灰色表示在当前epoch中被预测错误的 节点, 而被预测正确的节点用它们真实的类别颜色所表示; 0032 所述差异比较版本帮助用户比较不同所述epoch间预测情况的差异, 首先需要用 户输入startEpoch和endEpoch两个数值, 分别表示起始训练步数和终止训练步数, 所述节 点位置由GraphTSNE计算得到, 在所述startEpoch中被预测错误而在所述endEpoch中被预 测正确的节点用它们真实的所述类别颜色绘制, 剩余的节点则用灰色所表示, 可以帮助用 户清晰地了解在两个epoch间哪些节点被预测正确了。 00。
33、33 当用户将鼠标移动到所述网格中的某一格上时, 显示该格的细节信息, 所述细节 信息包括每一层中的隐藏神经元数取值和对应的所述分类准确率。 0034 所述颜色采用渐变的颜色映射机制, 使不同颜色的所述网格对应不同的所述分类 准确率。 使用户更直观的通过颜色比较出分类准确率的高低。 0035 所述图布局视图, 当用户将鼠标移动到某一个节点上时, 不仅展示对应的预测信 息, 同时显示该节点直接相连的邻居节点, 所述预测信息包括节点ID、 真实类别和所述预测 类别。 0036 本发明的优势和有益效果在于: 0037 提出了一种新的可视分析方法, 能支持渐进式地分析图卷积神经网络的工作流程 和影响因。
34、素。 该发明设计了多个协同的视图, 通过解决半监督的节点分类任务来展示图卷 积神经网络的作用, 其中隐藏层分析视图、 损失和准确率视图能直观地展示多个隐藏层参 数对分类准确率的影响; 图布局视图采用新型的GraphTSNE, 一种图结构化数据的可视化方 法来布局图结构数据中的节点位置, 不仅同时考虑了图结构和节点特征, 而且能清晰地呈 现节点预测状况的演化过程。 分析者可以通过与丰富的可视化视图进行交互, 深入理解图 卷积神经网络的执行过程和运行机理, 理解GCN模型如何有效地在图上传导信息、 基于训练 集中少量已知标签的节点来正确预测大量节点的标签、 发现节点被分类错误的原因。 附图说明 0。
35、038 图1是本发明的可视分析方法的流程图。 0039 图2a是本发明中一个隐藏层子视图的生成过程图。 0040 图2b是本发明中两个隐藏层子视图的生成过程图。 0041 图2c是本发明中三个隐藏层子视图的生成过程图。 0042 图3a是本发明中隐藏神经元数为16的损失子视图。 说明书 4/8 页 8 CN 110781933 A 8 0043 图3b是本发明中隐藏神经元数为16的准确率子视图。 0044 图3c是本发明中隐藏神经元数为80的损失子视图。 0045 图3d是本发明中隐藏神经元数为80的准确率子视图。 0046 图4a是本发明中初始状态视图。 0047 图4b是本发明中epoch。
36、1时的中间状态视图。 0048 图4c是本发明中epoch10时的中间状态视图。 0049 图4d是本发明中epoch70时的中间状态视图。 0050 图5a是本发明中epoch1时的预测情况细致分析图。 0051 图5b是本发明中epoch2时的预测情况细致分析图。 具体实施方式 0052 以下结合附图和具体实施例对本发明作具体的介绍。 0053 如图1所示, 一种用于理解图卷积神经网络的可视分析方法, 包括如下步骤: 0054 步骤一, 将输入的图结构数据集划分为训练集、 验证集和测试集; 0055 步骤二, 定义参数集合, 包括隐藏层数集合和隐藏神经元数集合; 0056 步骤三, 基于定。
37、义好的所述参数集合, 训练得到一系列的图卷积神经网络模型; 0057 步骤四, 设计隐藏层分析视图, 展示隐藏层参数对分类准确率的影响; 0058 步骤五, 设计损失和准确率视图, 展示所述模型迭代训练过程中损失和分类准确 率的变化; 0059 步骤六, 采用GraphTSNE可视化方法计算图中节点的位置, 设计图布局视图, 呈现 在不同训练步数下所述节点的预测情况和两个训练步数间所述节点预测情况的差异。 0060所述步骤一, 所述图结构数据集可以表示为G(V,E), 其中所述为具有N 个所述节点的节点集合, 所述为边集合, 所述vi和所述vj分别表示第i个和 第j个节点; 邻接矩阵ARNN编。
38、码了所述节点间的关联, 特征矩阵XRNC包含所有所述节 点的特征向量, 其中每个所述节点vi具有一个C维的所述特征向量xi和一个类别标签, 所述 数据集共有F个类别; 根据所述节点的总数N将所述数据集划分为所述训练集、 所述验证集 和所述测试集, 如将5的节点划分到训练集, 训练集中的节点类别是已知的, 且每个类别 包含的节点个数相同; 将20的节点划分到验证集, 将40的节点划分到测试集。 0061 所述步骤二, 定义所述隐藏层数集合为1, 2, 3, 由于当隐藏层数较大时, 图卷积 神经网络的分类性能不佳, 因此最多考虑3个隐藏层, 保证图卷积神经网络有较好的分类性 能; 对于每个隐藏层,。
39、 使用layerID-startID:stepID:endID来定义所述隐藏神经元数集 合, 所述layerID为隐藏层数, 所述startID为第ID个所述隐藏层的起始隐藏神经元数, 所述 stepID为每次递增的隐藏神经元数, 所述endID为第ID个所述隐藏层的结束隐藏神经元数, 如1-16:16:80表示选择16,32,48,64,80作为第一个隐藏层的所述隐藏神经元数。 0062 所述步骤三, 具有一个隐藏层的图卷积神经网络模型表示为 其中所述所述所述IN是一个单位矩 阵, 是一个对角矩阵, 且所述是从输入层到所述第一个隐藏层的权重 矩阵, 所述第一个隐藏层具有H1个特征图, 所述是。
40、从所述第一个隐藏层到输出层的 说明书 5/8 页 9 CN 110781933 A 9 所述权重矩阵, 所述F为类别数量, 所述softmax()和所述ReLu()代表激励函数; 0063 具有两个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到第所述一 个隐藏层的所述权重矩阵, 所述第一个隐藏层具有所述H1个特征图, 所述是从所述 第一个隐藏层到第二个隐藏层的所述权重矩阵, 所述第二个隐藏层具有所述H2个特征图, 所述是从所述第二个隐藏层到所述输出层的所述权重矩阵; 0064 具有三个隐藏层的图卷积神经网络模型表示为 其中所述是从所述输入层到 所述第一个隐藏层的所述权重矩阵, 所述。
41、第一个隐藏层具有所述H1个特征图, 所述 是从所述第一个隐藏层到第二个隐藏层的所述权重矩阵, 所述第二个隐藏层具有 所述H2个特征图, 所述是从所述第二个隐藏层到三个隐藏层的权重矩阵, 所述第 三个隐藏层具有所述H3个特征图, 所述是从所述第三个隐藏层到所述输出层的所 述权重矩阵; 0065 当所述隐藏层数为一层、 二层、 三层时, 分别选择相应的所述图卷积神经网络模 型, 从所述隐藏神经元数集合layerID-startID:stepID:endID中得到所述H1、 H2和H3的取 值范围; 在训练过程中, 使用epoch表示所述训练步数, epoch1表示所有训练数据集都训 练过一次, 使。
42、用Xavier初始化方法对初始的所述权重矩阵进行随机赋值, 使用Adam方法训 练所述模型, 以交叉熵作为损失函数; 在所述迭代训练过程中, 针对每一个所述epoch, 分别 计算所述训练集和所述验证集的损失和分类准确率; 在训练完成得到相应的图卷积神经网 络模型后, 采用所述测试集计算模型的所述分类准确率。 0066 所述步骤四, 采用基于网格的可视化方法来设计隐藏层分析视图, 展示隐藏层参 数对所述分类准确率的影响, 所述隐藏层参数包括所述隐藏层数和每层的所述隐藏神经元 数, 设计三个子视图来分别展示具有不同所述隐藏层的所述图卷积神经网络模型的所述分 类准确率; 0067 如图2a所示, 。
43、对于所述具有一个隐藏层的图卷积神经网络模型, 设计一个隐藏层 子视图, 首先基于所述隐藏神经元数集合layer1-start1:step1:end1计算所述集合中的 所有元素, 然后采用一维网格来渲染所述一个隐藏层子视图; 其中x轴表示所述第一个隐藏 层中隐藏神经元的数量; 0068 如图2b所示, 对于所述具有两个隐藏层的图卷积神经网络模型, 设计两个隐藏层 子视图, 首先基于所述隐藏神经元数集合layer1-start1:step1:end1和layer2- start2:step2:end2计算所述集合中的所有元素, 然后采用二维网格来渲染所述两个隐藏 层子视图; 其中所述x轴表示所述第。
44、一个隐藏层中所述隐藏神经元的数量, y轴表示所述第 二个隐藏层中所述隐藏神经元的数量; 0069 如图2c所示, 对于所述具有三个隐藏层的图卷积神经网络模型, 设计三个隐藏层 子视图, 首先基于所述隐藏神经元数集合layer1-start1:step1:end1、 layer2-start2: step2:end2和layer3-start3:step3:end3计算所述集合中的所有元素, 然后用所述二 维网格编码前两个所述隐藏层中的所述隐藏神经元的数量, 最后将多个所述二维网格并列 排放来编码所述第三个隐藏层的所述隐藏神经元数量, 并采用并列排放的所述二维网格来 说明书 6/8 页 10 C。
45、N 110781933 A 10 渲染所述三个隐藏层子视图; 其中第一个所述二维网格展示了当所述第三个隐藏层的所述 隐藏神经元数为start3时的所述分类准确率, 第二个所述二维网格展示了当所述第三个隐 藏层的所述隐藏神经元数为start3+step3时的所述分类准确率, 以此类推, 直到最后一个 所述二维网格展示的所述第三个隐藏层的所述隐藏神经元数为end3时的所述分类准确率; 0070 每个所述子视图中网格的颜色编码了每一种所述参数组合在所述测试集上的所 述分类准确率。 如图2b所示, 右侧为颜色映射条, 所述颜色采用红黄绿渐变的颜色映射机 制, 分辨率自高到低分别用由红到黄、 由黄到绿的。
46、不同分辨率的网格表示, 使用户更直观的 通过颜色比较出分类准确率的高低。 所述三个子视图中都采用同样的颜色映射机制。 0071 当用户将鼠标移动到所述网格中的某一格上时, 显示该格的细节信息, 所述细节 信息包括每一层中的隐藏神经元数取值和对应的所述分类准确率。 0072 所述步骤五, 所述损失和准确率视图包括损失子视图和准确率子视图, 所述两个 子视图的x轴代表epoch, y轴分别代表所述损失和所述分类准确率, 所述损失子视图包括所 述训练集和所述验证集的损失曲线, 所述准确率子视图包括所述训练集和所述验证集的分 类准确率曲线, 当选中所述隐藏层分析视图中的一格时, 表明选择了对应所述隐藏。
47、层参数 的一个所述模型, 此时, 所述损失和准确率视图会同步更新来展示所选择的所述模型对应 的所述曲线。 0073 图3a-d展示了当隐藏层数为1时, 基于Cora数据集的损失和准确率视图, Cora数据 集是一种论文数据集; 图3a、 b为隐藏神经元数为16时的损失子视图和准确率子视图, 图3a 中, 随着epoch的增加, 训练集损失和验证集损失逐渐降低, 图3b中, 当epoch大于70时, 训练 集和验证集的分类准确率趋于稳定, 其中训练集准确率接近1, 表明几乎训练集中所有的节 点都被预测正确, 验证集准确率接近于0.8; 图3c、 d为隐藏神经元数为80时的损失子视图和 准确率子视。
48、图, 相较于隐藏神经元数为16时的结果, 图3d中, 训练集和验证集的准确率快速 收敛, 在最初的10个epoch中, 准确率快速提升, 当epoch大于40时, 准确率趋于稳定。 0074 所述步骤六, 包括如下步骤: 0075 (1)采用所述GraphTSNE可视化方法将具有高维特征向量的所述节点集合V映射到 二维点空间中; 所述特征矩阵X可以表示为一个特征集合每个节点的所述特 征向量xi可以被看作是一个高维点, 采用所述GraphTSNE可视化方法得到一个非线性的映 射函数, 所述映射函数将所述高维特征向量映射到二维点空间, 基于所述映射函数计算所 述每个节点的位置, 并采用所述每个节点。
49、的位置渲染图布局中的节点; 0076 (2)设计图布局视图, 所述图布局视图包括预测版本和差异比较版本; 0077 所述预测版本展示所述图卷积神经网络模型在不同状态下的预测情况, 帮助用户 观察节点预测情况的演化过程; 所述预测版本包括初始状态视图和中间状态视图, 所述初 始状态视图展示了图结构数据初始时的布局情况, 节点位置由所述GraphTSNE可视化方法 计算得到, 对于所述训练集中的节点, 由于节点类别是已知的, 节点颜色代表真实的类别, 对于其他节点, 即所有不在训练集中的节点, 所述节点颜色用灰色表示; 所述中间状态视图 随着所述epoch的增加, 节点预测状况会变化, 在观察所述。
50、中间状态视图时, 用户首先需要 输入一个所述epoch, 所述视图中用带有外环的较大圆点表示训练集节点, 一个圆点的中心 颜色表示该节点真实的类别, 所述外环颜色表示在当前epoch中节点的预测类别, 如果所述 预测类别正确, 则所述圆点的所述中心颜色和所述外环颜色是相同的, 用户从中可以识别 说明书 7/8 页 11 CN 110781933 A 11 出一个训练节点是否被正确预测, 对于其他节点, 用灰色表示在当前epoch中被预测错误的 节点, 而被预测正确的节点用它们真实的类别颜色所表示; 图4a-d利用图布局视图, 分析了 隐藏层数为1, 隐藏神经元数为16时, 基于Cora数据集的。
- 内容关键字: 用于 理解 图卷 神经网络 可视 分析 方法
井用踏步.pdf
油田用平板闸阀密封连接结构.pdf
混凝土搅拌装置.pdf
用于针织设备的供纱机构.pdf
魔方.pdf
防拱装置.pdf
2-乙基蒽醌生产用废酸处理装置.pdf
零件加工定位工装.pdf
水基压裂液搅拌装置.pdf
气动式料带接料台.pdf
电缆生产用托架.pdf
气体环境检测装置.pdf
建筑工程桩.pdf
混凝土保温体系.pdf
自动钉裤袢装置.pdf
无电动力驱动装置.pdf
多功能的离心泵生产加工装置.pdf
静脉设备摄像头模组异常检测的方法和系统.pdf
微模块机房环境监控方法及系统.pdf
供排水设备关联数据在线监测方法及系统.pdf
基于平均队列长度变化趋势的网络自适应拥塞控制方法.pdf
结合事件日志和知识图谱的流程操作序列生成方法及系统.pdf
计算机控制设备的运行功率监测系统.pdf
雷达产品的测试系统及测试方法.pdf
纬纱绕卷装置.pdf
基于代谢组学和人工智能技术的肺腺癌早期诊断标志物及其应用.pdf
基于大模型的信息校验方法及装置.pdf
带有升降旋转摄像头的智能手表拍照控制方法及系统.pdf
公路施工用岩土取样装置.pdf
能够快速调节的建筑施工用垂直检测设备.pdf
中央空调冷热源节能智控系统.pdf
水上天然气管道支护结构.pdf
一种葡萄干风干装置.pdf
一种罗氏沼虾虾苗的培育方法.pdf
医用方便病人漱口的水杯.pdf
后片镂空的使得织物透气性好短袖.pdf
一种牛粪提取研制饲料设备.pdf
一种削皮机的削皮装置.pdf
一种除渣清洗生产线.pdf
一种烘制压紧茶的专用烘房.pdf
一种用于毛豆去壳机上的辅助辊轮.pdf
一种有效保留原茶香气和口感的普洱茶活性茶膏及其制备方法.pdf
一种剥笋机的摆板装置.pdf
匍匐害虫防治用粉剂.pdf
多桶式高效莲子磨皮机.pdf
一种促进银鲳性腺发育成熟的方法.pdf
一种海藻的烘干生产线.pdf
一种工业化卤煮装置.pdf
上排料搅拌炒锅.pdf
玉米三垄两沟条带播种耧.pdf
植物病害分类防治方法.pdf