神经网络的训练方法、数据获取方法和装置.pdf
《神经网络的训练方法、数据获取方法和装置.pdf》由会员分享,可在线阅读,更多相关《神经网络的训练方法、数据获取方法和装置.pdf(47页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010594053.6 (22)申请日 2020.06.24 (71)申请人 华为技术有限公司 地址 518129 广东省深圳市龙岗区坂田华 为总部办公楼 (72)发明人 韩亚洪姜品武阿明邵云峰 齐美玉李秉帅 (51)Int.Cl. G06K 9/62(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 神经网络的训练方法、 数据获取方法和装置 (57)摘要 本申请公开了人工智能领域中的一种神经 网络的训练方法、 。
2、数据获取方法和装置。 该神经 网络的训练方法包括: 获取训练数据; 使用训练 数据对所述神经网络进行训练, 使得神经网络从 训练数据中学习分解域不变特征和域特定特征。 通过从训练数据中分解域不变特征和域特定特 征, 使得域不变特征能够与域特定特征解耦; 其 中, 所述域特定特征为表征所述训练数据所属的 领域的特征, 所述域不变特征为与所述训练数据 所属领域无关的特征。 由于本申请的方法训练的 神经网络使用特征解耦得到的域不变特征来执 行任务, 避免了域特定特征对于神经网络的影 响, 从而提升了神经网络在不同领域之间的迁移 性能。 权利要求书5页 说明书26页 附图15页 CN 11189863。
3、5 A 2020.11.06 CN 111898635 A 1.一种神经网络的训练方法, 其特征在于, 包括: 获取训练数据; 使用所述训练数据对神经网络进行训练, 使得所述神经网络从所述训练数据中学习分 解域不变特征和域特定特征; 其中, 所述域特定特征为表征所述训练数据所属的领域的特征, 所述域不变特征为与 所述训练数据所属领域无关的特征。 2.根据权利要求1所述的方法, 其特征在于, 所述使用所述训练数据对神经网络进行训 练包括: 从所述训练数据的特征中分解出域不变特征和域特定特征; 使用所述域不变特征执行任务, 得到任务损失, 并计算所述域不变特征和所述域特定 特征之间的互信息损失, 。
4、所述任务损失用于表征使用所述域不变特征执行任务所得到的结 果与任务标签之间的差距, 所述互信息损失用于表示所述域不变特征和所述域特定特征之 间的差异; 根据所述任务损失和所述互信息损失, 训练所述神经网络。 3.根据权利要求2所述的方法, 其特征在于, 还包括: 使用所述域特定特征进行域分类, 得到域分类损失; 其中, 所述根据所述任务损失和所述互信息损失, 训练所述神经网络, 包括: 根据所述任务损失、 所述互信息损失和所述域分类损失训练所述神经网络。 4.根据权利要求2或3所述的方法, 其特征在于, 所述从所述训练数据的特征中分解出 域不变特征和域特定特征, 包括: 从所述训练数据中提取初。
5、始特征; 将所述初始特征分解成所述域不变特征和所述域特定特征, 其中, 所述方法, 还包括: 训练所述神经网络, 以减小所述初始特征所包含的信息与所述域不变特征和所述域特 定特征共同包含的信息之间的差异。 5.根据权利要求4所述的方法, 其特征在于, 在所述训练所述神经网络, 以减小所述初 始特征所包含的信息与所述域不变特征和所述域特定特征共同包含的信息之间的差异之 前, 还包括: 使用所述域不变特征和所述域特定特征对所述初始特征进行重建, 得到重建特征; 比较所述初始特征和所述重建特征, 以确定所述初始特征所包含的信息与所述域不变 特征和所述域特定特征共同包含的信息之间的差异。 6.根据权利。
6、要求2所述的方法, 其特征在于, 还包括: 使用所述域不变特征和所述域特定特征对初始特征进行重建, 得到重建特征, 其中所 述域不变特征和所述域特定特征是从所述初始特征中分解出的特征; 比较所述初始特征和所述重建特征以获取重建损失, 所述重建损失用于表征所述初始 特征所包含的信息与所述域不变特征和所述域特定特征共同包含的信息之间的差异, 其中, 所述根据所述任务损失和所述互信息损失, 训练所述神经网络, 包括: 根据所述任务损失, 对所述神经网络进行第一阶段的训练; 根据所述互信息损失, 对所述神经网络进行第二阶段的训练, 权利要求书 1/5 页 2 CN 111898635 A 2 其中, 。
7、所述方法还包括: 根据所述重建损失, 对所述神经网络进行第三阶段的训练。 7.根据权利要求2或3所述的方法, 其特征在于, 所述神经网络包括第一解耦器和第二 解耦器, 所述从所述训练数据的特征中分解出域不变特征和域特定特征, 包括: 从所述训练数据中提取所述训练数据的第一特征; 采用所述第一解耦器从所述第一特征中提取初步域不变特征和初步域特定特征; 将所述初步域不变特征与所述第一特征融合, 得到第二特征; 从所述第二特征中提取所述训练数据的第三特征; 采用第二解耦器从所述第三特征中提取所述域不变特征和所述域特定特征。 8.根据权利要求7所述的方法, 其特征在于, 还包括: 训练所述神经网络, 。
8、以减小所述第三特征所包含的信息与所述域不变特征和所述域特 定特征共同所包含的信息之间的差异。 9.根据权利要求1至8中的任一项所述的方法, 其特征在于, 所述神经网络用于进行域 自适应学习, 所述训练数据包括不同领域的图像数据。 10.一种数据获取方法, 其特征在于, 包括: 获取源域的数据和/或目标域的数据; 将所述源域的数据和/或所述目标域的数据输入神经网络进行训练, 以获取损失函数 的梯度信息; 根据所述梯度信息, 对所述源域的数据和/或所述目标域的数据进行扰动, 得到中间域 的数据; 其中, 所述源域和所述目标域为数据特征存在差异的两个领域, 所述中间域与所述源 域和所述目标域中的任一。
9、领域之间的数据特征的差异小于所述源域和所述目标域之间的 数据特征的差异。 11.根据权利要求10所述的方法, 其特征在于, 所述将所述源域的数据和/或所述目标 域的数据输入神经网络进行训练, 以获取损失函数的梯度信息, 包括: 将所述源域的带有标签的数据输入第一神经网络, 进行训练, 得到第一梯度信息, 其 中, 所述第一神经网络是基于所述目标域的带有标签的数据训练生成的。 12.根据权利要求10所述的方法, 其特征在于, 所述将所述源域的数据和/或所述目标 域的数据输入神经网络进行训练, 以获取损失函数的梯度信息, 包括: 将所述目标域的没有标签的数据输入第二神经网络, 以虚拟对抗训练的方式。
10、进行训 练, 得到第二梯度信息, 其中, 所述第二神经网络是基于带有标签的数据训练生成的。 13.一种神经网络的训练装置, 其特征在于, 包括: 获取模块, 配置为获取训练数据; 训练模块, 配置为使用所述训练数据对神经网络进行训练, 使得所述神经网络从所述 训练数据中学习分解域不变特征和域特定特征; 其中, 所述域特定特征为表征所述训练数据所属的领域的特征, 所述域不变特征为与 所述训练数据所属领域无关的特征。 14.根据权利要求13所述的装置, 其特征在于, 所述训练模块配置为, 从所述训练数据 的特征中分解出域不变特征和域特定特征; 使用所述域不变特征执行任务, 得到任务损失, 权利要求。
11、书 2/5 页 3 CN 111898635 A 3 并计算所述域不变特征和所述域特定特征之间的互信息损失, 所述任务损失用于表征使用 所述域不变特征执行任务所得到的结果与任务标签之间的差距, 所述互信息损失用于表示 所述域不变特征和所述域特定特征之间的差异; 根据所述任务损失和所述互信息损失, 训 练所述神经网络。 15.根据权利要求14所述的装置, 其特征在于, 所述训练模块进一步配置为, 使用所述 域特定特征进行域分类, 得到域分类损失; 根据所述任务损失、 所述互信息损失和所述域分 类损失训练所述神经网络。 16.根据权利要求14或15所述的装置, 其特征在于, 所述训练模块进一步配置。
12、为, 从所 述训练数据中提取初始特征; 将所述初始特征分解成所述域不变特征和所述域特定特征; 训练所述神经网络, 以减小所述初始特征所包含的信息与所述域不变特征和所述域特定特 征共同所包含的信息之间的差异。 17.根据权利要求16所述的装置, 其特征在于, 所述训练模块配置为, 使用所述域不变 特征和所述域特定特征对所述初始特征进行重建, 得到重建特征; 比较所述初始特征和所 述重建特征, 以确定所述初始特征所包含的信息与所述域不变特征和所述域特定特征共同 包含的信息之间的差异。 18.根据权利要求17所述的装置, 其特征在于, 所述训练模块进一步配置为, 使用所述 域不变特征和所述域特定特征。
13、对初始特征进行重建, 得到重建特征, 其中所述域不变特征 和所述域特定特征是从所述初始特征中分解出的特征; 比较所述初始特征和所述重建特征 以获取重建损失, 所述重建损失用于表征所述初始特征所包含的信息与所述域不变特征和 所述域特定特征共同包含的信息之间的差异, 其中, 所述训练模块配置为, 根据所述任务损失对所述神经网络进行第一阶段的训练; 根据所述互信息损失对所述神经网络进行第二阶段的训练; 根据所述重建损失对所述神经 网络进行第三阶段的训练。 19.根据权利要求14或15所述的装置, 其特征在于, 所述神经网络包括第一解耦器和第 二解耦器, 所述训练模块配置为, 从所述训练数据中提取所述。
14、训练数据的第一特征; 采用所 述第一解耦器从所述第一特征中提取初步域不变特征和初步域特定特征; 将所述初步域不 变特征与所述第一特征融合, 得到第二特征; 从所述第二特征中提取所述训练数据的第三 特征; 采用第二解耦器从所述第三特征中提取所述域不变特征和所述域特定特征。 20.根据权利要求19所述的装置, 其特征在于, 所述训练模块进一步配置为, 训练所述 神经网络, 以减小所述第三特征所包含的信息与所述域不变特征和所述域特定特征共同包 含的信息之间的差异。 21.一种数据获取装置, 其特征在于, 包括: 数据获取模块, 配置为获取源域的数据和/或目标域的数据; 梯度信息获取模块, 配置为将所。
15、述源域的数据和/或所述目标域的数据输入神经网络 进行训练, 以获取损失函数的梯度信息; 中间域数据生成模块, 配置为根据所述梯度信息, 对所述源域的数据和/或所述目标域 的数据进行扰动, 得到中间域的数据; 其中, 所述源域和所述目标域为数据特征存在差异的两个领域, 所述中间域与所述源 域和所述目标域中的任一领域之间的数据特征的差异小于所述源域和所述目标域之间的 权利要求书 3/5 页 4 CN 111898635 A 4 数据特征的差异。 22.根据权利要求21所述的装置, 其特征在于, 所述梯度信息获取模块配置为将所述源 域的带有标签的数据输入第一神经网络, 进行训练, 得到第一梯度信息,。
16、 其中, 所述第一神 经网络是基于所述目标域的带有标签的数据训练生成的。 23.根据权利要求21所述的装置, 其特征在于, 所述梯度信息获取模块配置为将所述目 标域的没有标签的数据输入第二神经网络, 以虚拟对抗训练的方式进行训练, 得到第二梯 度信息, 其中, 所述第二神经网络是基于带有标签的数据训练生成的。 24.一种神经网络的训练装置, 包括: 存储器, 用于存储程序; 处理器, 用于执行所述存储器存储的程序, 当所述存储器存储的程序被执行时, 所述处 理器用于执行如权利要求1-9中任一项所述的神经网络的训练方法或如权利要求10至权利 要求12中任一项所述的数据获取方法。 25.一种神经网。
17、络, 其特征在于, 包括: 第一特征提取层, 用于基于输入数据提取第一特征; 第一域不变特征解耦层, 用于基于所述第一特征提取第一域不变特征; 特征融合层, 用于融合所述第一特征和所述第一域不变特征, 以获取第二特征; 第二特征提取层, 用于基于所述第二特征提取第三特征; 第二域不变特征解耦层, 用于基于所述第三特征提取第二域不变特征; 其中, 所述第一域不变特征和所述第二域不变特征分别为表征所述输入数据所属的领 域的特征, 所述第一域特定特征和所述第二域特定特征分别为与所述输入数据所属领域无 关的特征。 26.一种数据处理系统, 其特征在于, 包括: 数据获取网络, 用于基于第一数据获取损失。
18、函数的梯度信息, 并根据所述梯度信息对 所述第一数据进行扰动以获取第二数据; 特征解耦网络, 用于使用包括所述第二数据的训练数据对神经网络进行训练, 使得所 述神经网络从所述训练数据中学习分解域不变特征和域特定特征; 其中, 所述域特定特征为表征所述训练数据所属的领域的特征, 所述域不变特征为与 所述训练数据所属领域无关的特征。 27.根据权利要求26所述的数据处理系统, 其特征在于, 所述特征解耦网络包括: 第一特征提取层, 用于基于所述训练数据提取第一特征; 第一域不变特征提取层, 用于基于所述第一特征提取第一域不变特征; 第一域特定特征提取层, 用于基于所述第一特征提取第一域特定特征; 。
19、第一互信息损失获取层, 用于基于所述第一域不变特征和所述第一域特定特征获取第 一互信息损失; 特征融合层, 用于融合所述第一特征和所述第一域不变特征, 以获取第二特征; 第二特征提取层, 用于基于所述第二特征提取第三特征; 第二域不变特征解耦层, 用于基于所述第三特征提取第二域不变特征; 第二域特定特征提取层, 用于基于所述第三特征提取第二域特定特征; 第二互信息损失获取层, 用于基于所述第二域不变特征和所述第二域特定特征获取第 权利要求书 4/5 页 5 CN 111898635 A 5 二互信息损失; 任务损失获取层, 用于使用所述第二域不变特征执行任务以获取任务损失。 28.根据权利要求。
20、27所述的数据处理系统, 其特征在于, 进一步包括: 第一域分类器, 用于基于所述第一域特定特征执行分类任务以获取第一分类损失; 第一梯度反转层, 用于将所述第一分类损失的梯度信息取反; 和/或, 第二域分类器, 用于基于所述第二域特定特征执行分类任务以获取第二分类损失; 第二梯度反转层, 用于将所述第二分类损失的梯度信息取反。 29.根据权利要求27或28所述的数据处理系统, 其特征在于, 进一步包括: 重建损失获取层, 用于使用所述第二域不变特征和所述第二域特定特征对所述第三特 征进行重建, 得到重建特征; 比较所述第三特征和所述重建特征, 以获取重建损失。 30.根据权利要求26至29中。
21、任一所述的数据处理系统, 其特征在于, 所述第一数据包括 源域的数据和/或目标域的数据, 其中, 所述数据获取网络包括: 基于所述目标域的带有标签的数据训练生成的第一训练网络; 和/或, 基于带有标签的数据训练生成的第二训练网络。 31.一种安防设备, 其特征在于, 包括如权利要求25所述的神经网络。 权利要求书 5/5 页 6 CN 111898635 A 6 神经网络的训练方法、 数据获取方法和装置 技术领域 0001 本申请涉及人工智能领域, 具体涉及一种神经网络的训练方法、 数据获取方法和 装置。 背景技术 0002 人工智能(artificial intelligence, AI)是。
22、利用数字计算机或者数字计算机控 制的机器模拟、 延伸和扩展人的智能, 感知环境、 获取知识并使用知识获得最佳结果的理 论、 方法、 技术及应用系统。 换句话说, 人工智能是计算机科学的一个分支, 它企图了解智能 的实质, 并生产出一种新的能以人类智能相似的方式作出反应的智能机器。 人工智能也就 是研究各种智能机器的设计原理与实现方法, 使机器具有感知、 推理与决策的功能。 人工智 能领域的研究包括机器人, 自然语言处理, 计算机视觉, 决策与推理, 人机交互, 推荐与搜 索, AI基础理论等。 0003 例如, 在计算机视觉相关的应用场景中, 以机器学习方式训练的神经网络可用于 完成目标分类/。
23、检测/识别/分割/预测等多种任务。 在很多应用场景下, 训练样本和测试样 本很可能来自不同的域, 这会为神经网络的实际应用带来问题。 例如, 在车辆检测的应用场 景下, 源域数据可能是晴天拍摄的交通场景图像, 而目标域数据却是雾天拍摄的交通场景 图像。 此时使用源域数据训练得到的目标检测模型就很难在目标域数据场景下取得好的效 果。 为了解决这种由于训练样本和测试样本之间的域偏差所带来的模型应用问题, 域自适 应(domain adaptation, DA)学习作为机器学习的重要研究领域在近几年受到了广泛的关 注。 0004 域自适应学习通常使用分布对齐的方法来对齐源域和目标域的数据之间的概率 。
24、分布, 以缓解域偏差对域自适应学习任务带来的不利影响。 由于这种分布对齐的过程只是 在整体特征表示层面进行的, 使得域自适应学习任务不可避免受到不同领域的特定特征的 影响, 因此, 训练出的神经网络仍然存在迁移性能差的问题。 发明内容 0005 本申请提供一种神经网络的训练方法、 数据获取方法和装置, 能够更好地提升神 经网络在不同领域之间的迁移性能。 0006 第一方面, 提供了一种神经网络的训练方法, 包括: 获取训练数据; 使用所述训练 数据对神经网络进行训练, 使得所述神经网络从所述训练数据中学习分解域不变特征和域 特定特征; 其中, 所述域特定特征为表征所述训练数据所属的领域的特征,。
25、 所述域不变特征 为与所述训练数据所属领域无关的特征。 0007 通过从训练数据中分解域不变特征和域特定特征, 使得域不变特征能够与域特定 特征解耦。 由于本申请的训练方法得到的神经网络使用域不变特征来执行任务, 这样避免 了域特定特征对于神经网络的影响, 从而提升了神经网络在不同领域之间的迁移性能。 0008 结合本申请的第一方面, 在一种可能的实现方式中, 所述使用所述训练数据对神 说明书 1/26 页 7 CN 111898635 A 7 经网络进行训练包括: 从所述训练数据中分解出域不变特征和域特定特征; 使用所述域不 变特征执行任务, 得到任务损失, 并计算所述域不变特征和所述域特定。
26、特征之间的互信息 损失, 所述任务损失用于表征使用所述域不变特征执行任务所得到的结果与任务标签之间 的差距, 所述互信息损失用于表示所述域不变特征和所述域特定特征之间的差异; 根据所 述任务损失和所述互信息损失, 训练所述神经网络。 0009 通过根据任务损失和互信息损失来训练神经网络, 不仅可使得分解出的域不变特 征更加精准的与实例对应, 还可在训练的过程中减少域不变特征和域特定特征之间的互信 息损失, 以促进域不变特征和域特定特征的完全解耦, 进一步降低域特定特征对域不变特 征的影响。 0010 结合本申请的第一方面, 在一种可能的实现方式中, 所述方法还包括: 使用所述域 特定特征进行域。
27、分类, 得到域分类损失; 其中, 所述根据所述任务损失和所述互信息损失, 训练所述神经网络, 包括: 根据所述任务损失、 所述互信息损失和所述域分类损失训练所述 神经网络。 0011 通过引入域分类损失, 有助于从训练数据的特征中提取域不变特征。 0012 结合本申请的第一方面, 在一种可能的实现方式中, 所述从所述训练数据中分解 出域不变特征和域特定特征, 包括: 从所述训练数据中提取初始特征; 将所述初始特征分解 成所述域不变特征和所述域特定特征, 其中, 所述方法还包括: 训练所述神经网络, 以减小 所述初始特征所包含的信息与所述域不变特征和所述域特定特征共同包含的信息之间的 差异。 0。
28、013 通过减小初始特征所包含的信息与域不变特征和域特定特征共同包含的信息之 间的差异, 可使得解耦出的域不变特征和域特定特征能够包含训练数据的全部特征信息, 以提高特征解耦的完整性和合理性。 0014 结合本申请的第一方面, 在一种可能的实现方式中, 在所述训练所述神经网络, 以 减小所述初始特征所包含的信息与所述域不变特征和所述域特定特征共同包含的信息之 间的差异之前, 所述方法还包括: 使用所述域不变特征和所述域特定特征对所述初始特征 进行重建, 得到重建特征; 比较所述初始特征和所述重建特征, 以确定所述初始特征所包含 的信息与所述域不变特征和所述域特定特征共同包含的信息之间的差异。 。
29、0015 使用该重建损失来训练神经网络, 可使得解耦出的域不变特征和域特定特征能够 包含训练数据的全部特征信息, 以提高特征解耦的完整性和合理性。 0016 结合本申请的第一方面, 在一种可能的实现方式中, 所述方法还包括: 使用所述域 不变特征和所述域特定特征对初始特征进行重建, 得到重建特征, 其中所述域不变特征和 所述域特定特征是从所述初始特征中分解出的特征; 比较所述初始特征和所述重建特征以 获取重建损失, 所述重建损失用于表征所述初始特征所包含的信息与所述域不变特征和所 述域特定特征共同包含的信息之间的差异, 其中, 所述根据所述任务损失和所述互信息损 失, 训练所述神经网络, 包括。
30、: 根据所述任务损失, 对所述神经网络进行第一阶段的训练; 根 据所述互信息损失, 对所述神经网络进行第二阶段的训练, 其中, 所述方法还包括: 根据所 述重建损失, 对所述神经网络进行第三阶段的训练。 0017 将神经网络的训练过程分阶段进行, 可以简化每个阶段的训练量, 加快神经网络 的参数的收敛速度。 说明书 2/26 页 8 CN 111898635 A 8 0018 结合本申请的第一方面, 在一种可能的实现方式中, 所述神经网络包括第一解耦 器和第二解耦器, 所述从所述训练数据中分解出域不变特征和域特定特征, 包括: 从所述训 练数据中提取所述训练数据的第一特征; 采用所述第一解耦器。
31、从所述第一特征中提取初步 域不变特征和初步域特定特征; 将所述初步域不变特征与所述第一特征融合, 得到第二特 征; 从所述第二特征中提取所述训练数据的第三特征; 采用第二解耦器从所述第三特征中 提取所述域不变特征和所述域特定特征。 0019 通过先获取第一特征, 并基于第一解耦器解耦出初步域不变特征, 将该初步域不 变特征与第一特征融合以获取第二特征, 使得域不变特征信息在第一特征的层面上得到了 增加。 然后再使用该第二特征基于第二解耦器解耦出域不变特征, 域不变特征的解耦精度 得到进一步增强, 可使得训练出的神经网络的任务执行性能更强, 域适应能力也更优。 0020 结合本申请的第一方面, 。
32、在一种可能的实现方式中, 所述方法还包括: 训练所述神 经网络, 以减小所述第三特征所包含的信息与所述域不变特征和所述域特定特征共同包含 的信息之间的差异。 0021 通过减小第三特征所包含的信息与域不变特征和域特定特征共同包含的信息之 间的差异, 可进一步促使解耦出的域不变特征和域特定特征能够包含训练数据的全部特征 信息, 以提高特征解耦的完整性和合理性。 0022 结合本申请的第一方面, 在一种可能的实现方式中, 所述神经网络用于进行域自 适应学习, 所述训练数据包括不同领域的图像数据。 0023 通过提取不同领域的图像数据的域不变特征和域特定特征, 并基于使用域不变特 征执行任务得到的任。
33、务损失对神经网络进行训练, 使得域不变特征能够与域特定特征解 耦。 由于使用域不变特征来执行任务, 本申请的训练方法得到的神经网络可通过域自适应 学习来自行适应对于多种不同领域图像的处理任务, 从而实现对不同领域的图像数据的自 适应处理。 0024 第二方面, 提供了一种数据获取方法, 包括: 获取源域的数据和/或目标域的数据; 将所述源域的数据和/或所述目标域的数据输入神经网络进行训练, 以获取损失函数的梯 度信息; 根据所述梯度信息, 对所述源域的数据和/或所述目标域的数据进行扰动, 得到中 间域的数据; 其中, 所述源域和所述目标域为数据特征存在差异的两个领域, 所述中间域与 所述源域和。
34、所述目标域中的任一领域之间的数据特征的差异小于所述源域和所述目标域 之间的数据特征的差异。 0025 源域和目标域之间的方向信息的引入使得训练数据的扰动更有针对性, 通过扰动 获得的中间域的训练数据能够填补源域和目标域之间的 “领域鸿沟” , 缓解源域的训练数据 和目标域的训练数据的分布差异大的问题。 0026 结合本申请的第二个面, 在一种可能的实现方式中, 所述将所述源域的数据和/或 所述目标域的数据输入神经网络进行训练, 以获取损失函数的梯度信息, 包括: 将所述源域 的带有标签的数据输入第一神经网络, 进行训练, 得到第一梯度信息, 其中, 所述第一神经 网络是基于所述目标域的带有标签。
35、的数据训练生成的。 0027 第一神经网络是由目标域的带有标签的数据训练生成的, 因此, 将源域的带有标 签的数据输入该第一神经网络之后得到的所述第一梯度信息可以很好地衡量从源域到目 标域的方向。 说明书 3/26 页 9 CN 111898635 A 9 0028 结合本申请的第二方面, 在一种可能的实现方式中, 所述将所述源域的数据和/或 所述目标域的数据输入神经网络进行训练, 以获取损失函数的梯度信息, 包括: 将所述目标 域的没有标签的数据输入第二神经网络, 以虚拟对抗训练的方式进行训练, 得到第二梯度 信息, 其中, 所述第二神经网络是基于带有标签的数据训练生成的。 0029 第二神。
36、经网络是由源域的带有标签的数据训练生成的, 因此, 将目标域的没有标 签的数据输入该第二神经网络之后经过虚拟对抗训练得到的所述第二梯度信息可以很好 地衡量从目标域到源域的方向。 0030 第三方面, 提供了一种神经网络的训练装置, 包括: 用于执行第一方面的模块计算 模块。 0031 第四方面, 提供了一种数据获取装置, 包括: 用于执行第二方面所述的方法的模块 计算模块。 0032 第五方面, 提供了一种神经网络的训练装置, 包括: 存储器, 用于存储程序; 处理 器, 用于执行所述存储器存储的程序, 当所述存储器存储的程序被执行时, 所述处理器用于 执行第一方面或第二方面所述的方法。 00。
37、33 第六方面, 提供了一种神经网络, 包括: 第一特征提取层, 用于基于输入数据提取 第一特征; 第一域不变特征解耦层, 用于基于所述第一特征提取第一域不变特征; 特征融合 层, 用于融合所述第一特征和所述第一域不变特征, 以获取第二特征; 第二特征提取层, 用 于基于所述第二特征提取第三特征; 第二域不变特征解耦层, 用于基于所述第三特征提取 第二域不变特征; 其中, 所述第一域不变特征和所述第二域不变特征分别为表征所述输入 数据所属的领域的特征, 所述第一域特定特征和所述第二域特定特征分别为与所述输入数 据所属领域无关的特征。 0034 第七方面, 提供了一种数据处理系统, 包括: 数据。
38、获取网络, 用于基于第一数据获 取损失函数的梯度信息, 并根据所述梯度信息对所述第一数据进行扰动以获取第二数据; 特征解耦网络, 用于使用包括所述第二数据的训练数据对神经网络进行训练, 使得所述神 经网络从所述训练数据中学习分解域不变特征和域特定特征; 其中, 所述域特定特征为表 征所述训练数据所属的领域的特征, 所述域不变特征为与所述训练数据所属领域无关的特 征。 0035 结合本申请的第七方面, 在一种可能的实现方式中, 所述特征解耦网络包括: 第一 特征提取层, 用于基于所述训练数据提取第一特征; 第一域不变特征提取层, 用于基于所述 第一特征提取第一域不变特征; 第一域特定特征提取层,。
39、 用于基于所述第一特征提取第一 域特定特征; 第一互信息损失获取层, 用于基于所述第一域不变特征和所述第一域特定特 征获取第一互信息损失; 特征融合层, 用于融合所述第一特征和所述第一域不变特征, 以获 取第二特征; 第二特征提取层, 用于基于所述第二特征提取第三特征; 第二域不变特征解耦 层, 用于基于所述第三特征提取第二域不变特征; 第二域特定特征提取层, 用于基于所述第 三特征提取第二域特定特征; 第二互信息损失获取层, 用于基于所述第二域不变特征和所 述第二域特定特征获取第二互信息损失; 任务损失获取层, 用于使用所述第二域不变特征 执行任务以获取任务损失。 0036 结合本申请的第七。
40、方面, 在一种可能的实现方式中, 所述数据处理系统进一步包 括: 第一域分类器, 用于基于所述第一域特定特征执行分类任务以获取第一分类损失; 第一 说明书 4/26 页 10 CN 111898635 A 10 梯度反转层, 用于将所述第一分类损失的梯度信息取反; 和/或, 第二域分类器, 用于基于所 述第二域特定特征执行分类任务以获取第二分类损失; 第二梯度反转层, 于将所述第二分 类损失的梯度信息取反。 0037 结合本申请的第七方面, 在一种可能的实现方式中, 所述数据处理系统进一步包 括: 重建损失获取层, 用于使用所述第二域不变特征和所述第二域特定特征对所述第三特 征进行重建, 得到。
41、重建特征; 比较所述第三特征和所述重建特征, 以获取重建损失。 0038 结合本申请的第七方面, 在一种可能的实现方式中, 所述第一数据包括源域的数 据和/或目标域的数据, 其中, 所述数据获取网络包括: 基于所述目标域的带有标签的数据 训练生成的第一训练网络; 和/或, 基于带有标签的数据训练生成的第二训练网络。 0039 第八方面, 提供了一种安防设备, 包括第六方面所述的神经网络。 0040 第九方面, 提供了一种计算机可读存储介质, 所述计算机可读存储介质上存储有 计算机程序指令, 所述计算机程序指令在被处理器运行时使得所述处理器执行第一方面或 第二方面所述的方法。 0041 第十方面。
42、, 提供了一种计算机程序产品, 包括计算机程序指令, 所述计算机程序指 令在被处理器运行时使得处理器执行第一方面或第二方面所述的方法。 0042 第十一方面, 提供一种芯片, 所述芯片包括处理器与数据接口, 所述处理器通过所 述数据接口读取存储器上存储的指令, 执行第一方面或第二方面所述的方法。 0043 可选地, 作为一种实现方式, 所述芯片还可以包括存储器, 所述存储器中存储有指 令, 所述处理器用于执行所述存储器上存储的指令, 当所述指令被执行时, 所述处理器用于 执行第一方面或第二方面所述的方法。 附图说明 0044 图1为一种人工智能主体框架示意图。 0045 图2为本申请一实施例提。
43、供的一种系统架构。 0046 图3为本申请一实施例提供的芯片硬件结构图。 0047 图4为本申请一实施例提供的一种系统架构。 0048 图5为本申请一实施例提供的一种神经网络的训练方法的流程示意图。 0049 图6为本申请一实施例提供的一种神经网络的训练方法的流程示意图。 0050 图7为本申请一实施例提供的神经网络的结构示意图。 0051 图8为本申请一实施例提供的特征解耦原理示意图。 0052 图9为本申请另一实施例提供的神经网络的结构示意图。 0053 图10为本申请一实施例提供的神经网络的结构示意图。 0054 图11为基于图10所示神经网络架构的提取域不变特征和域特定特征的流程示意 。
44、图。 0055 图12为本申请一实施例提供的训练过程的原理示意图。 0056 图13所示为本申请一实施例提供的一种神经网络的结构示意图。 0057 图14为本申请一实施例提供的获取中间域的数据的流程示意图。 0058 图15为本申请一实施例提供的神经网络的结构示意图。 0059 图16为本申请另一实施例提供的双向对抗训练的示意图。 说明书 5/26 页 11 CN 111898635 A 11 0060 图17为本申请一实施例提供的一种数据处理系统的结构示意图。 0061 图18为本申请一实施例提供的神经网络的训练装置的结构示意图。 0062 图19为本申请另一实施例提供的数据获取装置的结构示。
45、意图。 0063 图20为本申请一实施例提供的神经网络的训练装置的硬件结构示意图。 具体实施方式 0064 下面将结合附图, 对本申请中的技术方案进行描述。 0065 图1为一种人工智能主体框架示意图。 该主体框架描述了人工智能系统总体工作 流程, 适用于通用的人工智能领域需求。 0066 下面从 “智能信息链” (水平轴)和 “IT价值链” (垂直轴)两个维度对上述人工智能 主题框架进行阐述。 0067 “智能信息链” 反映从数据的获取到处理的一列过程。 举例来说, 可以是智能信息 感知、 智能信息表示与形成、 智能推理、 智能决策、 智能执行与输出的一般过程。 在这个过程 中, 数据经历了。
46、 “数据-信息-知识-智慧” 的凝练过程。 0068 “IT价值链” 从人智能的低层基础设施、 信息(提供和处理技术实现)到系统的产业 生态过程, 反映人工智能为信息技术产业带来的价值。 0069 (1)基础设施: 0070 基础设施为人工智能系统提供计算能力支持, 实现与外部世界的沟通, 并通过基 础平台实现支撑。 通过传感器与外部沟通; 计算能力由智能芯片(CPU、 NPU、 GPU、 ASIC、 FPGA 等硬件加速芯片)提供; 基础平台包括分布式计算框架及网络等相关的平台保障和支持, 可 以包括云存储和计算、 互联互通网络等。 举例来说, 传感器和外部沟通获取数据, 这些数据 提供给基。
47、础平台提供的分布式计算系统中的智能芯片进行计算。 0071 (2)数据 0072 基础设施的上一层的数据用于表示人工智能领域的数据来源。 数据涉及到图形、 图像、 语音、 文本, 还涉及到传统设备的物联网数据, 包括已有系统的业务数据以及力、 位 移、 液位、 温度、 湿度等感知数据。 0073 (3)数据处理 0074 数据处理通常包括数据训练, 机器学习, 深度学习, 搜索, 推理, 决策等方式。 0075 其中, 机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、 抽 取、 预处理、 训练等。 0076 推理是指在计算机或智能系统中, 模拟人类的智能推理方式, 依据推理控制策。
48、略, 利用形式化的信息进行机器思维和求解问题的过程, 典型的功能是搜索与匹配。 0077 决策是指智能信息经过推理后进行决策的过程, 通常提供分类、 排序、 预测等功 能。 0078 (4)通用能力 0079 对数据经过上面提到的数据处理后, 进一步基于数据处理的结果可以形成一些通 用的能力, 比如可以是算法或者一个通用系统, 例如, 翻译, 文本的分析, 计算机视觉的处 理, 语音识别, 图像的识别等等。 0080 (5)智能产品及行业应用 说明书 6/26 页 12 CN 111898635 A 12 0081 智能产品及行业应用指人工智能系统在各领域的产品和应用, 是对人工智能整体 解决。
49、方案的封装, 将智能信息决策产品化、 实现落地应用, 其应用领域主要包括: 智能制造、 智能交通、 智能家居、 智能医疗、 智能安防、 自动驾驶, 平安城市, 智能终端等。 0082 如前所述, 对于域自适应学习任务, 由于源域和目标域之间存在分布差异, 源域上 表现较好的模型如果直接应用在目标域的场景下会导致性能受限。 在训练神经网络模型以 进行域自适应学习时, 采用的是分布对齐的策略, 即将源域的数据和目标域的数据在特征 表示的层面上对齐。 由于这种分布对齐的过程只是在整体特征表示层面进行的, 使得域自 适应学习任务不可避免受到不同领域的特定特征的影响, 因此, 训练出的神经网络模型仍 然。
50、存在迁移性能差的问题。 0083 针对上述技术问题, 本申请提出一种训练神经网络模型的方式, 能够在训练的过 程中将域不变特征(域不变特征可以理解为与域无关的实例层面的特征)从数据的特征中 解耦出来, 使得域自适应学习任务可以不受不同领域的特定特征的影响, 从而可以提高神 经网络模型的迁移性能。 0084 应当理解, 本申请实施例所训练的神经网络模型可以应用在各种不同的应用场 景, 根据具体的应用场景不同, 神经网络模型也可有着不同的结构。 例如, 在图像分类应用 场景下(例如车辆识别、 人脸识别等), 该神经网络模型可以为卷积神经网络模型, 而在回归 预测应用场景下(例如工业生产线的能耗预测。
- 内容关键字: 神经网络 训练 方法 数据 获取 装置
一体式安全吊钳.pdf
漂浮电缆.pdf
线缆托架.pdf
防腐防潮的海洋监测设备固定装置.pdf
超声波布面预湿分解设备.pdf
道路边坡结构.pdf
多工位伺服系统.pdf
智慧采油装备.pdf
油气分离滤芯.pdf
公路裂缝修补装置.pdf
电解槽的极距测量装置.pdf
混凝土抗裂检测装置.pdf
多相流泵.pdf
高电压高倍率球形锰酸锂球磨混料机.pdf
卷扬机卷筒结构.pdf
防尘防砂式排气嘴结构.pdf
外科临床管路固定装置.pdf
免维护激振器.pdf
流延机自动对刀装置.pdf
全氢强对流罩式炉.pdf
表演机器人模型控制系统.pdf
亚跨超声速流场可控喷管的设计方法、装置、设备和介质.pdf
区块链协助搜索的物联网数据共享方法.pdf
油侧膜头装置及隔膜式压缩机.pdf
自动化PCB板测试系统.pdf
海洋藻类污染治理作业装备.pdf
抗鸡PML单克隆抗体及其应用.pdf
矿用液压油缸的定时养护装置.pdf
射频复电容率测量装置及方法.pdf
便携式一体化海水淡化器.pdf
快速定位及自动退料的冲压模具.pdf
基于灰水足迹的减污降碳协同度分析方法.pdf
自适应调整湿度的开关柜.pdf
一种电池均衡控制电路及检测方法.pdf
飘挂物清除设备.pdf
一种架空输电线路巡检车以及输电线路巡检系统.pdf
一种输电线防护机器人.pdf
一种变电站巡检系统.pdf
一种用于线上作业的飞车.pdf
一种架空输电线路巡检车以及输电线路巡检系统.pdf
一种多功能间隔棒拆装工具及拆装方法.pdf
一种输电线路巡检机器人轮夹复合机构.pdf
一种用于输电线路不停电架线的剪刀式自展跨越系统.pdf
一种配网带电作业绝缘电动断线钳.pdf
一种线缆支撑装置及挖掘设备.pdf
用于高铁智能防护电缆的护套加工装置.pdf
一种带电作业机器人金属氧化物避雷器更换方法.pdf
一种带电更换特高压同塔双回耐张绝缘子的组合工具.pdf
一种对弯曲管路进行穿入或抽出线缆的装置.pdf
线绳类飘挂物可回转燃烧器.pdf
带电线路清理工具.pdf