多任务的图分类方法.pdf

上传人:伱** 文档编号:11150264 上传时间:2021-09-08 格式:PDF 页数:8 大小:513.89KB
收藏 版权申诉 举报 下载
多任务的图分类方法.pdf_第1页
第1页 / 共8页
多任务的图分类方法.pdf_第2页
第2页 / 共8页
多任务的图分类方法.pdf_第3页
第3页 / 共8页
文档描述:

《多任务的图分类方法.pdf》由会员分享,可在线阅读,更多相关《多任务的图分类方法.pdf(8页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910548944.5 (22)申请日 2019.06.24 (71)申请人 广东工业大学 地址 510062 广东省广州市大学城外环西 路100号 (72)发明人 林志全刘波肖燕珊钟昊文 (74)专利代理机构 广东广信君达律师事务所 44329 代理人 杜鹏飞 (51)Int.Cl. G06K 9/62(2006.01) (54)发明名称 一种多任务的图分类方法 (57)摘要 本发明公开了一种多任务的图分类方法, 首 先利用挖掘子图确定一个最佳子图集, 最佳子图 分为共同。

2、特征和特定特征, 以此代表一个向量; 接着对多任务的图分类进行重构, 以此学习多任 务的学习方程, 并用拉格朗日定律进行优化, 得 到目标方程; 最后通过学习的最佳子图集, 学习 该目标方程, 得到一个最后的分类精度; 本发明 通过重构方程式, 能够有效利用子图之间关系, 利用多个任务之间的相关度, 进行任务的分类; 同时, 挖掘子图的结果更好利用, 这样能够在面 对任务的数量增多时, 更好利用任务之间的相关 性, 也不失分类的精准度。 权利要求书1页 说明书4页 附图2页 CN 110378390 A 2019.10.25 CN 110378390 A 1.一种多任务的图分类方法, 其特征在。

3、于, 包括下述步骤: (1)用gSpan对测试组进行一个挖掘子图, 并将子图分为三项, 分别为共同特征 1、 辅助 特征 2和专用特征 3; 其中, 共同特征是服务于所有任务, 辅助特征是服务于多个任务, 专用 特征只服务于特有任务t; 使用以下公式表示, 若G中有子图gk那么该坐标为1, 否则为0: (2)获得子图, 并得到向量形式表达图: xi,thg1(Gt,i),hg2(Gt,i),hg3(Gt,i),hgk(Gt,i)T; (3)利用学习得到的三个辅助特征, 但是这三个辅助特征并不是每个任务都可以使用, 因此需要将一些没有分类意义的子图去除, 得到一个然后放入分类器中进行学习; (4。

4、)通过构建目标模型来确定多任务的图分类之间的联系, 即学习任务之间的相关性 问题, 如下述公式所示: s.t. 其中T代表有T个任务, t1,2,3,代表任务1, 任务2, 任务3, m代表最佳子图集里的 m个子图; 利用ranksvm来进行学习, ranksvm是一种排序svm, 同时可以利用排序的方法进行 检索和分类; 受限的和表示任意两个向量中的相减, 得到一个最优的向量; (5)利用拉格朗日对式子进行优化, 引入拉格朗日算子 , , 然后用梯度下降得到以下 表示式: 则该方程为目标方程; (6)通过学习最佳子图集, 并学习目标方程, 得到最后的分类精度。 权利要求书 1/1 页 2 C。

5、N 110378390 A 2 一种多任务的图分类方法 技术领域 0001 本发明涉及机器学习技术领域, 具体涉及一种多任务的图分类方法。 背景技术 0002 图数据是一种数据类型, 它的特点是只有结构信息而没有特征信息, 但是对于一 些信息有很强的表达能力, 例如地图、 化学结构式、 脑网络等等; 又如分析化学式, 因为图数 据, 只有结点信息和连接两点的边的信息, 所以我们可以利用结点代表化学式中的化学原 子数, 利用结点的边来具体代表化学式中的化学键。 在实际应用中, 往往需要在成千上万个 数据中, 来寻找我们希望获得的数据。 图数据由于它的特殊性, 导致现存的很多机器学习方 法都无法直。

6、接应用, 然而图分类是一个很常见的应用场景。 0003 在大数据时代, 图分类应用在多个领域, 经典的图分类应用场景, 化合物的准确分 类, 而且这个往往是多个任务同时进行的, 此时就需要多任务分类的方法进行比较。 而现有 的多任务的图分类方法, 只是在对挖掘子图中, 做一部分修改, 并没有重构方程, 这会导致 最后的分类精度下降。 0004 图分类学习主要分为两种方法, 一个是基于图的核方法学习, 另一个是挖掘子图 的方法。 挖掘子图的目的是寻找代表图的最佳子图, 通常利用gSpan的方法, gSpan是一种频 繁子图的挖掘方法, 可以找到代表图的最佳子图, 该方法的第一步, 挖掘子图的过程。

7、中, 准 确寻找到一个最佳的子图集合来准确代表能分类图的全部特征, 然后用这些子图集作为特 征, 例如一个最佳子图集有8个子图, 要分类图a, 如果有里面的第一个子图, 那么第一个向 量为1, 否则为0; 如果图a有里面有其中的第1,3,8子图, 那么向量代表就是(1,0,1,0,0,0, 0,1); 然后再利用支持向量机等方法, 进行学习, 得出结果。 0005 图分类的方法, 一般都是指单任务的图分类方法, 而现实生活中, 分类往往是多个 任务同时存在的, 例如, 分类动物的图片, 往往需要同时分类出各种动物的图片, 而不是一 种动物的图片, 所以多任务的研究是很有必要的。 而多任务的学习。

8、方法, 就是利用任务的相 关性, 从而提高参数的使用, 以此提高任务的准确性和任务的学习效率。 现有技术中的多任 务的图分类方法, 并没有重新学习多任务的图分类, 而仅仅是在多任务中, 对挖掘子图分为 三个部分: 共同特征、 辅助特征、 还有特定特征; 仅仅在挖掘子图中作为修改, 这是不够的, 对于精度的提升有限。 发明内容 0006 本发明的目的在于克服现有技术的缺点与不足, 提供一种多任务的图分类方法, 该方法从多任务角度出发, 重构多任务的学习方程, 更好利用任务之间的相关性, 保证分类 速度的同时提高分类的精确度。 0007 本发明的目的通过下述技术方案实现: 0008 一种多任务的图。

9、分类方法, 包括下述步骤: 0009 (1)用gSpan对测试组进行一个挖掘子图, 并将子图分为三项, 分别为共同特征 1、 说明书 1/4 页 3 CN 110378390 A 3 辅助特征 2和专用特征 3; 其中, 共同特征是服务于所有任务, 辅助特征是服务于多个任务, 专用特征只服务于特有任务t; 使用以下公式表示, 若G中有子图gk那么该坐标为1, 否则为 0: 0010 0011 (2)获得子图, 并得到向量形式表达图: 0012 xi,thg1(Gt,i),hg2(Gt,i),hg3(Gt,i),hgk(Gt,i)T; 0013 (3)利用学习得到的三个辅助特征, 但是这三个辅助。

10、特征并不是每个任务都可以 使用, 因此需要将一些没有分类意义的子图去除, 得到一个然后放入分类器中进行学 习; 0014 (4)通过构建目标模型来确定多任务的图分类之间的联系, 即学习任务之间的相 关性问题, 如下述公式所示: 0015 0016 其中T代表有T个任务, t1,2,3,代表任务1, 任务2, 任务3, m代表最佳子图集 里的m个子图; 利用ranksvm来进行学习, ranksvm是一种排序svm, 同时可以利用排序的方法 进行检索和分类; 受限的和表示任意两个向量中的相减, 得到一个最优的向量; 0017 (5)利用拉格朗日对式子进行优化, 引入拉格朗日算子 , , 然后用梯。

11、度下降得到 以下表示式: 0018 0019 则该方程为目标方程; 0020 (6)通过学习最佳子图集, 并学习目标方程, 得到最后的分类精度。 0021 本发明与现有技术相比具有以下的有益效果: 0022 本发明通过重构方程式, 能够有效利用子图之间关系, 利用多个任务之间的相关 度, 进行任务的分类; 同时, 挖掘子图的结果更好利用, 这样能够在面对任务的数量增多时, 更好利用任务之间的相关性, 也不失分类的精准度。 附图说明 0023 图1为本发明最佳子图集中共同特征和辅助特征选择流程示意图; 说明书 2/4 页 4 CN 110378390 A 4 0024 图2为本发明的任务流程示意。

12、图。 具体实施方式 0025 下面结合实施例及附图对本发明作进一步详细的描述, 但本发明的实施方式不限 于此。 0026 本发明提出了一种多任务的图分类方法, 首先利用挖掘子图确定一个最佳子图 集, 最佳子图分为共同特征和特定特征, 以此代表一个向量; 接着对多任务的图分类进行重 构, 以此学习多任务的学习方程, 并用拉格朗日定律进行优化, 得到目标方程; 最后通过学 习的最佳子图集, 学习该目标方程, 得到一个最后的分类精度。 0027 具体来说, 如图12所示, 一种多任务的图分类方法, 包括下述步骤: 0028 (1)用gSpan对测试组进行一个挖掘子图, 并将子图分为三项, 分别为共同。

13、特征 1、 辅助特征 2和专用特征 3; 其中, 共同特征是服务于所有任务, 辅助特征是服务于多个任务, 专用特征只服务于特有任务t; 使用以下公式表示, 若G中有子图gk那么该坐标为1, 否则为 0: 0029 0030 (2)获得子图, 并得到向量形式表达图: 0031 xi,thg1(Gt,i),hg2(Gt,i),hg3(Gt,i),hgk(Gt,i)T; 0032 (3)利用学习得到的三个辅助特征, 但是这三个辅助特征并不是每个任务都可以 使用, 因此需要将一些没有分类意义的子图去除, 得到一个然后放入分类器中进行学 习; 0033 (4)通过构建目标模型来确定多任务的图分类之间的联。

14、系, 即学习任务之间的相 关性问题, 如下述公式所示: 0034 0035 其中T代表有T个任务, t1,2,3,代表任务1, 任务2, 任务3, m代表最佳子图集 里的m个子图; 利用ranksvm来进行学习, ranksvm是一种排序svm, 同时可以利用排序的方法 进行检索和分类; 受限的和表示任意两个向量中的相减, 得到一个最优的向量; 0036 (5)利用拉格朗日对式子进行优化, 引入拉格朗日算子 , , 然后用梯度下降得到 以下表示式: 说明书 3/4 页 5 CN 110378390 A 5 0037 0038 则该方程为目标方程; 0039 (6)通过学习最佳子图集, 并学习目。

15、标方程, 得到最后的分类精度。 0040 本发明利用基于Ranksvm首次一个多任务的图分类学习并重构了目标方程。 重构 目标方程, 能够解决多任务问题, 即使任务达到一定数量, 分类的准确性不会降低, 也不会 增加学习的复杂度问题。 0041 本发明通过重构方程式, 能够有效利用子图之间关系, 利用多个任务之间的相关 度, 进行任务的分类; 同时, 挖掘子图的结果更好利用, 这样能够在面对任务的数量增多时, 更好利用任务之间的相关性, 也不失分类的精准度。 0042 上述为本发明较佳的实施方式, 但本发明的实施方式并不受上述内容的限制, 其 他的任何未背离本发明的精神实质与原理下所作的改变、 修饰、 替代、 组合、 简化, 均应为等 效的置换方式, 都包含在本发明的保护范围之内。 说明书 4/4 页 6 CN 110378390 A 6 图1 说明书附图 1/2 页 7 CN 110378390 A 7 图2 说明书附图 2/2 页 8 CN 110378390 A 8 。

展开阅读全文
内容关键字: 任务 分类 方法
关于本文
本文标题:多任务的图分类方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11150264.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1