存在部分缺失和未知类别标记的多标记分类方法.pdf
![存在部分缺失和未知类别标记的多标记分类方法.pdf_第1页](https://img.zhuanlichaxun.net/fileroot4/2021-6/2/0283a9bc-563a-4ca8-b62d-0fce00014061/0283a9bc-563a-4ca8-b62d-0fce000140611.gif)
![存在部分缺失和未知类别标记的多标记分类方法.pdf_第2页](https://img.zhuanlichaxun.net/fileroot4/2021-6/2/0283a9bc-563a-4ca8-b62d-0fce00014061/0283a9bc-563a-4ca8-b62d-0fce000140612.gif)
![存在部分缺失和未知类别标记的多标记分类方法.pdf_第3页](https://img.zhuanlichaxun.net/fileroot4/2021-6/2/0283a9bc-563a-4ca8-b62d-0fce00014061/0283a9bc-563a-4ca8-b62d-0fce000140613.gif)
《存在部分缺失和未知类别标记的多标记分类方法.pdf》由会员分享,可在线阅读,更多相关《存在部分缺失和未知类别标记的多标记分类方法.pdf(11页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010870298.7 (22)申请日 2020.08.26 (71)申请人 安徽工业大学 地址 243002 安徽省马鞍山市湖东路59号 (72)发明人 黄俊屈喜文郑啸陶陶 袁志祥程泽凯秦锋 (74)专利代理机构 安徽知问律师事务所 34134 代理人 平静 (51)Int.Cl. G06K 9/62(2006.01) G06N 20/00(2019.01) G06F 17/16(2006.01) (54)发明名称 一种存在部分缺失和未知类别标记的多标 记分类方法 (57。
2、)摘要 本发明公开了一种存在部分缺失和未知类 别标记的多标记分类方法, 属于机器学习技术领 域; 本发明将部分缺失类别标记和未知类别标记 的问题融合在一个框架中, 利用高斯距离函数, 计算样本相似度矩阵, 再将相似度矩阵分解, 得 到完整类别标记矩阵的近似解, 约束近似解的部 分结果与已观测的标记结果一致, 同时构建从样 本特征到完整标记的分类模型, 建模已知标记和 新发现未知标记之间的关联性, 约束相关性较强 的具有相似的分类模型系数, 并不断优化完整标 记矩阵的结果, 进而学习得到准确的分类模型。 本可发明不仅可以解决已知类别标记存在部分 缺失值问题, 还可以发现多标记数据中的未知类 别标。
3、记, 挖掘出数据中有价值的隐含信息。 权利要求书3页 说明书6页 附图1页 CN 112132186 A 2020.12.25 CN 112132186 A 1.一种存在部分缺失和未知类别标记的多标记分类方法, 其特征在于, 其步骤为: 步骤一、 对训练数据进行特征提取和类别标注, 获得数据特征表示矩阵X和已知类别标 记矩阵Y; 步骤二、 计算特征表示矩阵X和已知类别标记矩阵Y的相似度矩阵S; 步骤三、 将相似度矩阵S分解得到保持样本相似性结构信息的完整类别标记矩阵的近 似表示H, 并约束得到的近似表示H的部分结果与步骤一得到的已知类别标记矩阵Y的结果 一致; 步骤四、 利用矩阵重构技术对完整。
4、类别标记矩阵的近似表示H进行优化, 将H优化为重 构结果HC; 步骤五、 构建从数据特征表示矩阵X映射到完整类别标记矩阵的重构结果HC的线性分 类模型, 并对模型系数W做稀疏约束, 学习类属特征; 同时, 利用模型系数W对新发现标记进 行语义描述; 步骤六、 采用流行正则约束任意两个类别标记对应的模型系数的相似性, 进而优化完 整标记矩阵H的结果; 步骤七、 给定一个测试样本t, 将测试样本t带入经过步骤一至六学习得到的最终分类 模型, 输出测试样本在已知类别标记和未知类别标记上的预测结果。 2.根据权利要求1所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤一。
5、中,为一个二维实数矩阵, n为样本个数, d为特征个数, 为 实数域; 已知类别的类别标记矩阵Y0, 1nq存在部分缺失值, q为已知的类别标记个数; 设置未知类别标记个数为r, 则完整类别标记矩阵是一个大小为nl的二维矩阵, 其中lq +r表示总类别标记个数, 且每个元素取值范围为0, 1。 3.根据权利要求2所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤二中, 对特征表示矩阵X和已知类别标记矩阵Y进行高斯距离函数计算, 得到相似度矩阵其中第i行j列元素Sij可以通过式(1)计算得到, 式(1)中, exp为指数函数,xi和xj分别表示特征表示矩阵X的 第。
6、i行和第j行, yi和yj分别表示已知类别标记矩阵Y的第i行和第j行;表示xj的k近邻 样本集合。 4.根据权利要求3所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤三中, 利用非负矩阵分解技术, 将样本相似度矩阵分解为HHT, 其中H0, 1nl作为完整类别标记矩阵的近似表示, HT为H的转置矩阵; 通过矩阵P约束近 似表示H的部分结果与已知类别标记矩阵Y的结果一致, 进而得到最小化目标公式, 其中, 0, 1nn表示需要保持的近邻关系, 1表示保持, 0表示不保持;为映 射矩阵, 其取值为一个ll单位矩阵的前q列, 矩阵H为待求解的模型参数, 0为非负权重。
7、系 权利要求书 1/3 页 2 CN 112132186 A 2 数, 取值域为10-1, 100, 101。 5.根据权利要求4所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤四中,为一重构系数矩阵, 对于第i个样本的第j个标记结果 Hij, 通过该样本在其余标记上的结果来重构, 可得矩阵表示形式为H HC, 进而得到缺失结果的标记值; 将完整类别标记矩阵的近似表示H优化为HC, 得到更新的 最小化目标公式: 其中, 矩阵H和C为待求解的模型参数;1为非负权重系数, 取值域为100, 101, 102。 6.根据权利要求5所述的一种存在部分缺失和未知类别标记。
8、的多标记分类方法, 其特 征在于: 所述的步骤五中, 使用多元线性回归模型作为分类器, 建立线性分类模型基于训练 数据的特征表示X, 学习一个映射到优化后完整类别标记矩阵HC的线性分类模型f(X, W) XW, 并对模型参数做L1正则约束, 来学习特征数据表示中的类属特征, 得到更新的 最小化目标公式: H0, 1nl, HPY (4) 式(4)中, 使得H0, 1nl, 矩阵W、 H和C为待求解的模型参数, 2为非负权重系数, 取值 域为10-1, 100, 101。 7.根据权利要求6所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤五中, 对模型系数W的后。
9、r列, 根据元素值的绝对值大小, 分别对每一列 进行降序排序, 取每一列中前10个取值较大的系数对应的特征构成类属特征集合, 设数据 集的特征集合为ff1, f2, ., fd, 模型系数W的后r列为wq+1, wq+2, ., wq+r, 分别对应个 新发现的类别标记的模型系数, 对每个|wq+i|进行降序排序, 然后取前10个取值较大的系数 对应的特征构成类属特征集合, 用于描述新发现的第i个未知类别标记的语义概念。 8.根据权利要求7所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤六中, 直接学习ZTZ, 逼近真实的标记相关性矩阵的拉普拉斯矩阵, 并利 。
10、用流行正则约束相关标记对应的模型系数的相似性, 即得到最终需要求 解的目标公式为, 其中,l为总的类别标记个数, m为超参数; ZT为Z的转置矩阵, WT为W的转置矩 阵; diag(ZTZ)返回由ZTZ的左对角线上元素构成的向量, 约束diag(ZTZ)1, 防止矩阵Z0 的无效解; 矩阵W、 H, C和Z为待求解的模型参数,3为非负权重系数, 取值域为50, 51, 52, 53, tr()表示矩阵迹范数。 9.根据权利要求1-8任一项所述的一种存在部分缺失和未知类别标记的多标记分类方 法, 其特征在于: 所述的步骤七中, 给定一个测试样本t的特征表示根据训练阶段 权利要求书 2/3 页 。
11、3 CN 112132186 A 3 得到的模型系数W, 对测试样本t得到预测值 f(xt, W)xtW (6)。 10.根据权利要求9所述的一种存在部分缺失和未知类别标记的多标记分类方法, 其特 征在于: 所述的步骤七中, 根据得到的测试样本t的预测值以及设置的分类阈值 , 计算测试 样本在已知q个类别以及未知的r个类别上的最终输出标记向量yt0, 11l, yt(i)f(xt, W)i , 1il (7) 其中, 为指示函数, 其内部表示的条件成立时, 返回结果为1, 否则返回0; 当f(xt, W)i 值为1时, 表示测试样本t属于第i类, 否则表示不属于第i类; 向量yt的前q个元素值。
12、 表示测试样本是否属于已知的q个类别, 后r个元素则表示测试样本t是否属于新发现的r个 未知的类别标记。 权利要求书 3/3 页 4 CN 112132186 A 4 一种存在部分缺失和未知类别标记的多标记分类方法 技术领域 0001 本发明涉及机器学习技术领域, 更具体地说, 涉及一种存在部分缺失和未知类别 标记的 多标记分类方法。 背景技术 0002 多标记学习是当前机器学习领域的一个研究热点, 近年来受到了学术界和企业界 研究人 员的广泛关注。 在多标记学习的学习中, 每个样本可以同时属于多个类别标记, 例 如一部电 影可以同时属于多个类别, 如 “动作片” ,“战争片” ,“惊悚片” 。
13、等。 多标记学习在现 实 生活中得到了广泛应用, 如文本分类、 图像和视频标注、 音乐分类、 商品推荐等。 0003 多标记学习的主要任务是根据给定的训练数据集, 学习一个高效的多标记分类模 型, 可 以给新的样本预测一个或多个可能的类别标记。 针对多标记学习问题, 研究人员已 经提出了 很多方法。 现有多标记学习方法主要假设训练数据集的类别标记集合是完整的, 并且所有标 记值均已知。 在多标记数据标注过程中, 标注者会给样本标注一个或者多个相 关的类别标记, 标注过程费时费力, 标注者很难准确的给样本标注所有相关的类别, 尤其 当类别标记总数较 多时, 很容易导致标注结果存在部分缺失, 甚至。
14、完全缺失的情况, 即这 些类别标记没有标注 给任何一个样本。 此外, 多标记数据的语义复杂, 可能会存在一些类 别标记超出人类的认知 范围, 也会导致这些类别标记没有标注给任何一个样本, 这些完全 缺失的类别标记在训练阶 段都是未知的, 导致学习难度较大。 0004 当前, 研究人员已经提出了一些处理缺失标记的多标记分类方法, 但是只能处理 存在部 分缺失值的情况, 不能处理数据集存在未知类别标记的情况。 这些方法主要基于矩 阵补全或 者在构造分类损失函数时不考虑缺失项, 这两种策略的前提要求是每个类别至 少要有一个正 例样本。 因此, 当数据存在某些未知类别标记时, 它们的标记结果是完全缺 。
15、失时, 现有方法 均无法处理。 目前被提出的有两个方法可以用来处理存在未知类别标记的 情况, 如A.Pham 等在国际机器学习会议上发表的存在新颖标记实例的多实例多标记学习 方法和朱越等在人工 智能促进协会年会发表的发现多个新颖标记的多实例多标记学习方 法, 但是这两个方法只能 用于多实例多标记学习, 无法用于一般情况下的多标记学习, 即 单实例多标记学习, 而且也 无法处理存在部分缺失标记的情况。 0005 经检索, 中国专利申请号: 201911306128.X, 申请公布日: 2020年4月21日, 发明名 称为: 一种多标记分类中潜在类别发现和分类方法; 该申请案将已知标记分类和潜在标。
16、记 发 现及分类融合在一框架中, 利用非负矩阵分解技术, 将特征矩阵分解为完整类别标记矩 阵的 近似解和系数矩阵, 并约束近似解的已知部分结果与真实值一致, 同时构建从样本特 征到完 整标记的分类模型, 发现潜在的标记类型; 通过潜在标记发现, 挖掘出数据中有价 值的隐含 信息, 利用已知标记和潜在标记之间的关联性, 约束相关性较强的任意类别具有 相似的分类 模型系数, 得到近似的分类预测结果, 使已知标记分类和潜在标记分类相互指 导, 共同促进, 最终提升已知标记和潜在标记的分类性能, 更好的进行多标记学习任务。 但 该申请案假设已 知标记部分的标记值完全观测, 当已知标记值存在缺失时, 该。
17、申请案中所 说明书 1/6 页 5 CN 112132186 A 5 提算法的性能会受 到影响。 且在实际应用中, 当数据存在未知新标记时, 已知标记部分的 标记值存在缺失则更 为常见, 该申请案在应用到实际上时, 会存在误差。 发明内容 0006 1.发明要解决的技术问题 0007 鉴于现有技术中, 传统的多标记学习方法假定数据集的类别标记个数是固定且所 有标记 结果都是已知的, 不能处理数据集中存在未知类别标记的情况, 从而影响分类的准 确性的问 题, 本发明提供了一种存在部分缺失和未知类别标记的多标记分类方法, 本发明 提出有效的 学习方法, 发现数据集中未知的类别标记, 构建已知类别和。
18、未知类别标记的多 标记分类模型, 使多标记分类结果更加准确。 0008 2.技术方案 0009 为达到上述目的, 本发明提供的技术方案为: 0010 本发明的一种存在部分缺失和未知类别标记的多标记分类方法, 其步骤为: 0011 步骤一、 对训练数据进行特征提取和类别标注, 获得数据特征表示矩阵X和已知类 别标记 矩阵Y; 0012 步骤二、 计算特征表示矩阵X和已知类别标记矩阵Y的相似度矩阵S; 0013 步骤三、 将相似度矩阵S分解得到保持样本相似性结构信息的完整类别标记矩阵 的近似表 示H, 并约束得到的近似表示H的部分结果与步骤一得到的已知类别标记矩阵Y的 结果一致; 0014 步骤四。
19、、 利用矩阵重构技术对完整类别标记矩阵的近似表示H进行优化, 将H优化 为重构 结果HC; 0015 步骤五、 构建从数据特征表示矩阵X映射到完整类别标记矩阵的重构结果HC的线 性分类 模型, 并对模型系数W做稀疏约束, 学习类属特征; 同时, 利用模型系数W对新发现标 记进 行语义描述; 0016 步骤六、 采用流行正则约束任意两个类别标记对应的模型系数的相似性, 进而优 化完整 标记矩阵H的结果; 0017 步骤七、 给定一个测试样本t, 将测试样本t带入经过步骤一至六学习得到的最终 分类模 型, 输出测试样本在已知类别标记和未知类别标记上的预测结果。 0018 3.有益效果 0019 采。
20、用本发明提供的技术方案, 与已有的公知技术相比, 具有如下显著效果: 0020 (1)鉴于现有技术中, 现有的多标记学习方法假定数据集的类别标记都是已知的, 不能 同时处理数据中存在部分缺失和未知类别标记的问题, 进而影响多标记分类方法的 准确性的 问题, 本发明将部分缺失和未知类别标记处理及分类融合在统一框架中, 利用矩 阵分解技术, 将特征矩阵和类别标记矩阵计算得到相似度矩阵分解, 得到完整标记矩阵的 近似解, 以此来 发现未知的类别标记; 约束近似解的存在部分缺失值的已知类别标记的结 果与真实的已观测 值的一致, 同时构建从样本特征到完整标记的多标记分类模型, 可以为 新的样本同时预测已。
21、 知类别和新发现的类别标记。 0021 (2)本发明的一种存在部分缺失和未知类别标记的多标记分类方法, 通过发现未 知类别 标记, 能够挖掘出数据中有价值的隐含信息。 同时通过标记重构技术, 能够处理部 说明书 2/6 页 6 CN 112132186 A 6 分缺失标 记的结果。 本发明通过建模已知类别和未知类别标记的相互关联性, 在提升已知 类别标记分 类准确性的同时, 还能够提升模型发现未知类别标记的能力。 通过模型学习到 的类属特征, 可以有效描述新发现类别的语义概念。 附图说明 0022 图1为本发明的多标记分类方法模型框架图; 0023 图2为五个新类别标记语义描述表。 具体实施方。
22、式 0024 为进一步了解本发明的内容, 结合附图和实施例对本发明作详细描述。 0025 本发明首先根据样本特征和已知标记的结果计算样本相似度矩阵, 然后利用非负 矩阵技 术对该样本相似度矩阵分解得到未知新标记的近似结果, 并且可以保持样本间的 近邻结构关 系。 其次, 本发明利用矩阵重构技术和标记相关性, 共同优化整个标记矩阵的 结果, 包括部 分缺失和完整缺失的标记。 最后, 由于标记矩阵存在部分缺失和完全缺失值, 无法直接计算 标记相关性矩阵大小, 直接利用完整标记矩阵的近似结果计算出来的结果 也存在一定误差, 本发明提出直接根据模型自动学习的方法, 将相关性学习融入到模型优 化过程中。。
23、 0026 实施例1 0027 结合图1, 本实施例的一种存在部分缺失和未知类别标记的多标记分类方法, 包含 模型 训练和标记预测两个阶段, 具体步骤如下: 0028 (1)模型训练 0029 步骤一、 对训练数据进行特征提取和类别标注, 获得数据特征表示矩阵X, 以及已 知类别 标记矩阵Y, 其中Y存在部分缺失值, 设定未知类别标记个数为整数r。 具体为: 0030假定训练数据特征表示为一个二维实数矩阵其中, n表示样本个数, d表 示特 征个数, 表示实数域。 Y0, 1nq是训练数据已知类别的类别标记矩阵, q表示已 知的类 别标记个数, 其中矩阵Y中的第i行j列的元素用Yij表示。 当。
24、Yij1时, 则表示第i个 样本属于 第j个类别标记, Yij0则表示第i个样本不属于第j个类别或者当前值缺失, i为1 到n之间的 正整数, j为1到q之间的正整数。 设置未知类别标记个数为r, 则完整类别标记矩 阵是一个 大小为nl的二维矩阵, 其中lq+r表示总类别标记个数, 且每个元素取值范围 为0, 1。 0031 步骤二、 将训练数据的特征表示矩阵X和已知类别标记矩阵Y通过高斯距离函数计 算相似 度矩阵S, 具体为: 0032 将训练数据的特征表示矩阵X和已知类别标记矩阵Y通过高斯距离函数计算样本 相似度 矩阵其中第i行j列元素Sij可以通过式(1)计算得到, 0033 说明书 3。
25、/6 页 7 CN 112132186 A 7 0034式(1)中, exp为指数函数,xi和xj分别表示特征表示矩 阵X的第i 行和第j行, yi和yj分别表示已知类别标记矩阵Y的第i行和第j行。表示xj 的k近邻样本 集合。 0035 步骤三、 将相似度矩阵S分解得到保持样本相似性结构信息的完整类别标记矩阵 的近似表 示H, 约束得到的近似表示的部分结果与步骤一得到的已知类别标记矩阵Y的结 果一致: 0036通过非负矩阵分解技术, 将样本相似度矩阵分解为HHT。 此过程近似等价 于利 用K-Means(K均值)算法将训练数据的n个样本聚类到l个类别中, 其中H0, 1nl表 示 软聚类结果。
26、指示矩阵, HT为H的转置矩阵。 因此, H可以作为完整类别标记矩阵的近似表 示。 通过对样本相似度矩阵S分解, H和S具有相同的样本间相似性结构关系。 0037 约束近似表示H的部分结果与已知类别标记矩阵Y的结果一致。 由于改变H中列的 顺序, 不影响H与其转置矩阵HT的乘积HHT的结果。 因此, 可假定H的前q列结果与Y一致。 设置 矩 阵P为一个ll单位矩阵的前q列, 然后使用P矩阵右乘H, 可以返回H的前q列结果, 然后 最小化其与Y之间的误差, 这里采用F范数来计算误差。 得到最小化目标公式: 0038 0039 式(2)中, 0, 1nn表示需要保持的近邻关系, 1表示保持, 0表。
27、示不保持。 为映 射矩阵, 其取值为一个ll单位矩阵的前q列, 矩阵H为待求解的模型参数, 0为非负权重系 数, 取值域为10-1, 100, 101。 0040 步骤四、 利用矩阵重构技术, 优化完整标记矩阵H的结果, 得到HC。 具体为: 0041学习一个重构系数矩阵对于第i个样本的第j个标记结果Hij, 可以通过 该样本 在其余标记上的结果来重构, 即写成矩阵表示形式为HHC。 当 某个标 记结果缺失时, 利用该方法可以获得标记值。 因此, 通过求解重构系数矩阵C, 可以 优化标记 矩阵H的结果得到HC, 得到更新的最小化目标公式: 0042 0043式(3)中,表示重构系数矩阵, 矩阵。
28、H和C为待求解的模型参数。 1为非负权 重 系数, 取值域为100, 101, 102。 0044 步骤五、 构建从数据特征表示矩阵X映射到完整类别标记矩阵的重构结果HC的线 性分类 模型, 并对模型系数做稀疏约束, 学习类属特征。 同时, 利用模型系数W对新发现标 记进行 语义描述。 具体为: 0045 使用多元线性回归模型作为分类器, 建立线性分类模型; 基于训练数据的特征表 示X, 学 习一个映射到优化后完整类别标记矩阵HC的线性分类模型f(X, W)XW, 并对模型 参数 做L1正则约束, 来学习特征数据表示中的类属特征, 用来描述未知类别标 记的语义 概念。 得到更新的最小化目标公式。
29、: 说明书 4/6 页 8 CN 112132186 A 8 0046 0047 式(4)中, 使得H0, 1nl, 矩阵W、 H和C为待求解的模型参数,2为非负权重系数, 取值域为10-1, 100, 101。 0048 对模型系数W的后r列, 根据元素值的绝对值大小, 分别对每一列进行降序排序, 取 每一 列中前10个取值较大的系数对应的特征构成类属特征集合。 基于此类属特征集合, 可 以用于 描述新发现类别的语义概念。 具体为: 0049 设数据集的特征集合为ff1, f2, ., fd, 模型系数W的后r列为wq+1, wq+2, ., wq+r, 分别对应个新发现的类别标记的模型系数。
30、。 其中, L1正则约束的作用是特征选择, 过 滤掉对 类别判别力弱的特征, 保留具有强判别力的特征。 模型系数W中元素的绝对值越大, 说明判 别力越强。 对每个|wq+i|进行降序排序, 然后取前10个取值较大的系数对应的特征 构成类属 特征集合, 用于描述新发现的第i个未知类别标记的语义概念。 0050 步骤六、 根据模型自动学习类别标记间的相关性大小, 采用流行正则约束任意两 个类别 标记对应的模型系数的相似性, 进而优化完整标记矩阵H的结果。 0051 由于标记矩阵的中已知标记存在部分缺失值, 未知标记的标记值完全未知, 直接 利用近 似表示H计算得到的类别相关性结果不精确。 因此, 。
31、本案采用直接学习ZTZ来逼近真 实的标记 相关性矩阵的拉普拉斯矩阵。 对标记间的相关性进行建模, 利用流行正则约束相 关标记对应 的模型系数的相似性最终需要求解的目标公式为, 0052 0053式(5)中,l为总的类别标记个数, m为超参数。 diag(ZTZ)返回由ZTZ的左 对角线上元素构成的向量, 约束diag(ZTZ)1, 可以防止矩阵Z0的无效解。 矩阵W、 H, C和 Z为待求解的模型参数, 3为非负权重系数, 取值域为50, 51, 52, 53, tr()表示矩阵迹 范 数。 0054 (2)标记预测 0055 步骤七、 给定一个测试样本t, 将测试样本t带入经过步骤一至六学习。
32、得到的最终 分类模 型, 输出测试样本在已知类别标记和未知类别标记上的预测结果。 具体为: 0056给定一个测试样本t的特征表示根据训练阶段得到的模型系数W, 对测 试样 本t得到预测值 0057 f(xt, W)xtW 0058 然后, 根据式(6)所得到的测试样本t的预测值以及设置的分类阈值 , 计算测试样 本在 已知q个类别以及未知的r个类别上的最终输出标记向量yt0, 11l: 0059 yt(i)f(xt, W)i , 1il (7) 0060 式(7)中, 为指示函数, 其内部表示的条件成立时, 返回结果为1, 否则返回0。 说明书 5/6 页 9 CN 112132186 A 9。
33、 当 f(xt, W)i 值为1时, 表示测试样本t属于第i类, 否则表示不属于第i类。 向量yt的前q 个 元素值表示测试样本是否属于已知的q个类别, 后r个元素则表示测试样本t是否属于新 发现的 r个未知的类别标记。 0061 本实施例的方法中的语义描述方法对于文本型数据效果较好, 直接通过词语即可 获知新 标记的含义, 图2中给出了关于一个计算机相关的数据集的例子, 通过本实施例的 方法学习 得到的新类别标记的类属特征。 对于图像、 视频等数据集, 需要使用高层特征, 例 如利用深 度学习模型学习得到的特征。 0062 本实施例将多标记学习中部分缺失类别标记和未知类别标记的学习问题融合在。
34、 一个统一 的框架中, 利用高斯距离函数, 对特征矩阵和存在缺失值的标记矩阵计算样本相 似度矩阵, 利用非负矩阵分解技术将相似度矩阵分解, 得到完整类别标记矩阵的近似解, 约束近似解的 部分结果与已观测的标记结果一致, 同时构建从样本特征到完整标记的分 类模型, 建模已知 标记和新发现的这些未知标记之间的相互关联性, 约束相关性较强的任 意两个类别具有相似 的分类模型系数, 并通过标记重构技术, 不断优化完整标记矩阵的结 果, 进而学习得到更准 确的分类模型。 本实施例不仅可以解决已知类别标记存在部分缺失 值问题, 还可以发现多标 记数据中的未知类别标记, 挖掘出数据中有价值的隐含信息。 本 实施例中提出的多标记分类 模型, 可以对新样本同时预测已知类别和新发现的类别标记。 0063 以上示意性的对本发明及其实施方式进行了描述, 该描述没有限制性, 附图中所 示的也 只是本发明的实施方式之一, 实际的结构并不局限于此。 所以, 如果本领域的普通 技术人员 受其启示, 在不脱离本发明创造宗旨的情况下, 不经创造性的设计出与该技术方 案相似的结 构方式及实施例, 均应属于本发明的保护范围。 说明书 6/6 页 10 CN 112132186 A 10 图1 图2 说明书附图 1/1 页 11 CN 112132186 A 11 。
- 内容关键字: 存在 部分 缺失 未知 类别 标记 分类 方法
显示装置.pdf
电子机芯生产用配件装配设备.pdf
玻璃制品生产原料除铁设备.pdf
电路板点焊设备.pdf
茶叶分选用过滤装置.pdf
用于茶叶的储存罐结构.pdf
基于压感自调张力的化纤面料圆筒针织机牵拉结构.pdf
多功能小车移动防护结构.pdf
可拆卸式的灌装装置.pdf
输配电线路无线通信型激光雷达.pdf
炼厂货用升降机轿厢制停测距装置.pdf
文档扫描仪的纸张对齐机构.pdf
测量斜绕螺线管磁场强度的实验装置.pdf
通电检测夹具.pdf
用于丁基胶灌装机的压盘结构.pdf
真空绝热外墙复合一体板.pdf
提高丰年虫孵化率的孵化装置.pdf
陶瓷加工用球磨机.pdf
快速调节间隙的悬挂端梁.pdf
洁净室恒温恒湿空气处理组合风柜.pdf
汽车管柱筒生产用下料设备.pdf
裤耳机的裤耳定位装置.pdf
建筑设施抗震性能的评估方法、装置、设备及存储介质.pdf
基于牵引振动落饵料的导料槽结构及灭蚁毒饵撒料机.pdf
高通量高分辨率静态傅里叶变换光谱测量方法.pdf
智能计量包装方法及装置.pdf
RNA疫苗递送制剂及其制备方法.pdf
基于点云与有限元分析的飞机蒙皮修配方法.pdf
检测番鸭查帕马病毒的引物和探针、病毒分离培养方法.pdf
长效保湿乳液及其制备方法.pdf
水泥碎渣废料清理装置.pdf
基于病患信息的全病程管理平台的应用方法及系统.pdf
一种水性多彩涂料.pdf
用于可松释地将衣物附着到人体上的装置.pdf
一种汉麻水刺非织造布及其制备方法.pdf
二次空气喷射系统及方法.pdf
分层无接头环形输送带的加工方法.pdf
可拆卸的电动车.pdf
一种台阶轴用材料合金工具钢5CRNIMO自由锻加工工艺.pdf
一种超低比转数离心泵叶轮多工况多目标水力优化方法.pdf
一种定位精准的冲孔模具.pdf
基于物联网的地下变电站环境监测系统.pdf
用于去除饮用水中大环内酯类抗生素的过滤介质及制法.pdf
酸系统尾气喷淋净水回用及碱水排放洗涤塔及其自动控制洗涤工艺.pdf
一种轴流风机叶轮结构.pdf
一种特大型铸件地坑造型用硬砂床及其铺设方法.pdf
玄武岩拉丝工位调温通讯控制系统及方法.pdf
一种回收钨细泥中黑白钨的选矿方法和系统.pdf
一种汽车爆胎方向盘转角限制和分轮制动联合控制系统及方法.pdf
一种经过除杂脱氨后的沉钒废水的处理方法.pdf
粒子捕捉单元、该粒子捕捉单元的制造方法及基板处理装置.pdf
相关文档
更多![山莨菪碱的细胞糖萼保护作用.pdf](/Images/s.gif)
![考虑攻击时间和攻击角度约束的异构飞行器协同制导方法.pdf](/Images/s.gif)
![智能配电室可视化展示方法及系统.pdf](/Images/s.gif)
![按摩椅底座.pdf](/Images/s.gif)
![舭龙骨安装角度定位检测方法.pdf](/Images/s.gif)
![SQL开发方法、装置及终端设备.pdf](/Images/s.gif)
![基于DCNN的双时相遥感影像变化检测方法.pdf](/Images/s.gif)
![自动滚转托座.pdf](/Images/s.gif)
![污水污染处理箱.pdf](/Images/s.gif)
![风淋门联动控制系统及方法.pdf](/Images/s.gif)
![柔性聚氨酯基碳纳米复合电磁屏蔽材料及其制备方法.pdf](/Images/s.gif)
![废弃矿山的土壤生态修复方法.pdf](/Images/s.gif)
![园林多功能浇灌装置.pdf](/Images/s.gif)
![分布式的量子计算仿真方法和装置.pdf](/Images/s.gif)
![多元醇环氧脂肪酸酯增塑剂的制备方法.pdf](/Images/s.gif)
![吸盘装置和具有其的激光成像设备.pdf](/Images/s.gif)
![冲压多工位生产线板料定位结构.pdf](/Images/s.gif)
![紫外光可见分光计.pdf](/Images/s.gif)
![基于光电振荡器的准分布式光纤扭转角度测量装置和方法.pdf](/Images/s.gif)
![应用于FPC板的全自动撕膜机.pdf](/Images/s.gif)