用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf

上传人:七月 文档编号:9226884 上传时间:2021-05-10 格式:PDF 页数:27 大小:736.58KB
收藏 版权申诉 举报 下载
用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf_第1页
第1页 / 共27页
用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf_第2页
第2页 / 共27页
用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf_第3页
第3页 / 共27页
文档描述:

《用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf》由会员分享,可在线阅读,更多相关《用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf(27页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010009567.0 (22)申请日 2020.01.06 (30)优先权数据 16/244,240 2019.01.10 US (71)申请人 维萨国际服务协会 地址 美国加利福尼亚州 (72)发明人 王亮董晓博 罗伯特克里斯坦森苟良张维 仰颢 (74)专利代理机构 北京天昊联合知识产权代理 有限公司 11112 代理人 张娜顾丽波 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 用于将来自更复杂模型。

2、的知识融入更简单 模型中的系统、 方法和计算机程序产品 (57)摘要 本发明提供一种用于将来自更复杂模型的 知识融入更简单模型中的系统、 方法和计算机程 序产品。 方法可包括获得与第一组特征相关联的 第一训练数据以及与不同于所述第一组特征的 第二组特征相关联的第二训练数据; 基于所述第 一训练数据和所述第二训练数据来训练第一模 型; 以及基于所述第二训练数据而使用损失函数 来训练第二模型, 所述损失函数取决于所述第一 模型的中间层的输出和所述第二模型的输出。 权利要求书3页 说明书18页 附图5页 CN 111428872 A 2020.07.17 CN 111428872 A 1.一种计算机。

3、实施的方法, 包括: 通过至少一个处理器获得与第一组特征相关联的第一训练数据以及与不同于所述第 一组特征的第二组特征相关联的第二训练数据; 通过至少一个处理器基于所述第一训练数据和所述第二训练数据来训练第一模型; 以 及 通过至少一个处理器基于所述第二训练数据而使用损失函数来训练第二模型, 所述损 失函数取决于所述第一模型的中间层的输出和所述第二模型的输出。 2.根据权利要求1所述的计算机实施的方法, 其中所述第二模型包括至少一个第一层 和至少一个第二层, 其中所述第二模型的所述输出包括所述至少一个第一层的输出, 并且 其中训练所述第二模型还包括: 使用取决于所述第一模型的所述中间层的所述输出。

4、和所述第二模型的包括所述第一 层的所述输出的所述输出的所述损失函数来修改所述第二模型的所述至少一个第一层的 一个或多个参数; 以及 基于所述至少一个第一层的所述输出来训练所述至少一个第二层。 3.根据权利要求2所述的计算机实施的方法, 其中所述第一模型包括以下至少一项: 深 度神经网络、 循环神经网络、 多个神经网络的集成, 或其任何组合, 其中所述第二模型的所 述第一层包括回归神经网络, 并且其中所述第二模型的所述第二层包括逻辑回归模型。 4.根据权利要求1所述的计算机实施的方法, 还包括: 通过至少一个处理器确定所述第一模型的多个中间层的多个信息值; 以及 通过至少一个处理器基于所述多个信。

5、息值而从所述多个中间层中选择所述中间层。 5.根据权利要求1所述的计算机实施的方法, 其中所述第一组特征包括复杂特征, 并且 其中所述第二组特征包括可解释特征。 6.根据权利要求1所述的计算机实施的方法, 其中所述第一模型包括比所述第二模型 多的参数数目。 7.根据权利要求1所述的计算机实施的方法, 还包括: 通过至少一个处理器提供经过训练的第二模型; 通过至少一个处理器获得与至少一个交易相关联的输入数据; 以及 通过至少一个处理器并且使用经过训练的第二模型来处理所述输入数据以生成输出 数据, 其中所述输出数据包括所述至少一个交易是否是欺诈交易的预测。 8.一种计算系统, 包括: 至少一个处理。

6、器, 其被编程和/或配置成: 获得与第一组特征相关联的第一训练数据以及与不同于所述第一组特征的第二组特 征相关联的第二训练数据; 基于所述第一训练数据和所述第二训练数据来训练第一模型; 以及 基于所述第二训练数据而使用损失函数来训练第二模型, 所述损失函数取决于所述第 一模型的中间层的输出和所述第二模型的输出。 9.根据权利要求8所述的计算系统, 其中所述第二模型包括至少一个第一层和至少一 个第二层, 其中所述第二模型的所述输出包括所述至少一个第一层的输出, 并且其中所述 至少一个处理器进一步被编程和/或配置成通过以下方式来训练所述第二模型: 权利要求书 1/3 页 2 CN 11142887。

7、2 A 2 使用取决于所述第一模型的所述中间层的所述输出和所述第二模型的包括所述第一 层的所述输出的所述输出的所述损失函数来修改所述第二模型的所述至少一个第一层的 一个或多个参数; 以及 基于所述至少一个第一层的所述输出来训练所述至少一个第二层。 10.根据权利要求9所述的计算系统, 其中所述第一模型包括以下至少一项: 深度神经 网络、 循环神经网络、 多个神经网络的集成, 或其任何组合, 其中所述第二模型的所述第一 层包括回归神经网络, 并且其中所述第二模型的所述第二层包括逻辑回归模型。 11.根据权利要求8所述的计算系统, 其中所述至少一个处理器进一步被编程和/或配 置成: 确定所述第一模。

8、型的多个中间层的多个信息值; 以及 基于所述多个信息值而从所述多个中间层中选择所述中间层。 12.根据权利要求8所述的计算系统, 其中所述第一组特征包括复杂特征, 并且其中所 述第二组特征包括可解释特征。 13.根据权利要求8所述的计算系统, 其中所述第一模型包括比所述第二模型多的参数 数目。 14.根据权利要求8所述的计算系统, 其中所述至少一个处理器进一步被编程和/或配 置成: 提供经过训练的第二模型; 获得与至少一个交易相关联的输入数据; 以及 使用经过训练的第二模型来处理所述输入数据以生成输出数据, 其中所述输出数据包 括所述至少一个交易是否是欺诈交易的预测。 15.一种包括至少一个非。

9、瞬态计算机可读介质的计算机程序产品, 所述至少一个非瞬 态计算机可读介质包括程序指令, 所述程序指令在由至少一个处理器执行时使所述至少一 个处理器: 获得与第一组特征相关联的第一训练数据以及与不同于所述第一组特征的第二组特 征相关联的第二训练数据; 基于所述第一训练数据和所述第二训练数据来训练第一模型; 以及 基于所述第二训练数据而使用损失函数来训练第二模型, 所述损失函数取决于所述第 一模型的中间层的输出和所述第二模型的输出。 16.根据权利要求15所述的计算机程序产品, 其中所述第二模型包括至少一个第一层 和至少一个第二层, 其中所述第二模型的所述输出包括所述至少一个第一层的输出, 并且 。

10、其中所述指令还使所述至少一个处理器通过以下方式来训练所述第二模型: 使用取决于所述第一模型的所述中间层的所述输出和所述第二模型的包括所述第一 层的所述输出的所述输出的所述损失函数来修改所述第二模型的所述至少一个第一层的 一个或多个参数; 以及 基于所述至少一个第一层的所述输出来训练所述至少一个第二层。 17.根据权利要求15所述的计算机程序产品, 其中所述指令还使所述至少一个处理器: 确定所述第一模型的多个中间层的多个信息值; 以及 基于所述多个信息值而从所述多个中间层中选择所述中间层。 权利要求书 2/3 页 3 CN 111428872 A 3 18.根据权利要求15所述的计算机程序产品,。

11、 其中所述第一组特征包括复杂特征, 并且 其中所述第二组特征包括可解释特征。 19.根据权利要求15所述的计算机程序产品, 其中所述第一模型包括比所述第二模型 多的参数数目。 20.根据权利要求15所述的计算机程序产品, 其中所述指令还使所述至少一个处理器: 提供经过训练的第二模型; 获得与至少一个交易相关联的输入数据; 以及 使用经过训练的第二模型来处理所述输入数据以生成输出数据, 其中所述输出数据包 括所述至少一个交易是否是欺诈交易的预测。 权利要求书 3/3 页 4 CN 111428872 A 4 用于将来自更复杂模型的知识融入更简单模型中的系统、 方 法和计算机程序产品 技术领域 0。

12、001 本公开总体上涉及将来自更复杂模型的知识融入更简单模型中, 并且在一些实施 例或方面中, 涉及用于训练、 提供和/或使用融合来自更复杂模型的知识的预测模型的系 统、 方法和计算机程序产品。 背景技术 0002 在支付行业中使用的现有风险或欺诈检测模型使用相对较简单的模型, 例如逻辑 回归、 决策树、 前馈神经网络和/或其类似者。 例如, 由数据分析公司FICO开发并通过全球支 付数据处理器和发行银行部署的欺诈检测模型使用前馈神经网络, 该前馈神经网 络提供聚焦于效率、 低时延和低存储器占用的相对简单的分析模型架构。 0003 与更复杂模型相比, 现有更简单模型可能更容易训练和/或维护。 。

13、例如, 经过训练 后, 现有更简单模型通常会在运行时间使用更小存储器占用量以及更少的计算资源, 这使 此类现有更简单模型非常适合部署到可能对时延和计算资源使用率要求更为严格的大量 用户。 例如, 时延和计算资源使用率要求在支付行业中可能尤其严格, 在支付行业中, 预测 模型会影响数百万消费者并用于作出实时决策。 0004 比起更复杂模型, 现有更简单模型还可能更容易解释。 例如, 模型可解释性可用于 评定与模型的预测相关联的信任。 支付行业中部署的现有风险或欺诈检测模型可能使用融 合了多年来采集的领域专家知识的许多手工特征。 这些现有风险或欺诈检测模型通常相对 容易解释并被用户充分接受。 例如。

14、, 基于来自模型的预测而采取动作可能会成为涉及消费 者权利的例如信用评估、 风险评估和/或其类似者的金融决策中的倾向, 并且模型的可解释 性可能会影响模型是否用于此类金融决策。 例如, 欧盟发布的 通用数据保护条例 (GDPR) 中可看到模型可解释性的效应, 该条例于2018年5月在欧盟范围内作为法律生效, 并创造了 “解释权” , 由此消费者可要求解释关于消费者的算法决策。 0005 然而, 现有更简单模型可能有固有限制。 例如, 由于对时延和计算资源的更严格要 求, 现有更简单模型可能不会使用过多特征和/或复杂特征, 不论此类特征是否可能是风险 或欺诈的良好指标。 此外, 现有更简单模型的。

15、结构具有比更复杂模型更有限的容量, 这会减 弱现有更简单模型的泛化能力。 以此方式, 现有更简单模型可能无法捕捉潜在的和更复杂 的风险模式, 和/或错误地拒绝合法交易, 这可能导致收益损失和/或不良的消费者体验。 例 如, 尽管主要数据处理器和发行银行已部署欺诈检测模型, 例如欺诈检测 模型, 以便保护消费者的交易, 但因欺诈交易和错误拒绝的交易所致的损失相对较大。 例 如, 平均来说, 在支付行业中, 每$10,000的被批准交易中可存在$9的欺诈交易和$520的被 拒绝交易, 而$520的被拒绝交易中的很大部分可能是错误拒绝。 0006 尤其是在其中使用了包括多个层的深度神经网络的计算机视。

16、觉和语音辨识领域 中, 深度学习对广泛多种应用已产生相对大的影响。 这些现有深度学习模型可包括数百万 个参数并且可使用数十亿个示例进行训练, 这可提供现有更简单模型望尘莫及的更大容量 说明书 1/18 页 5 CN 111428872 A 5 和更好的泛化性能。 将一组现有模型组合以进行预测的现有集成方法(ensemble method) 也可产生具有相对更强泛化能力的更复杂现有模型。 0007 然而, 虽具有相对更强泛化性能, 但现有更复杂模型并不十分适合用于对时延和 计算资源使用率有更严格要求的应用。 例如, 现有更复杂模型可能无法实时生成决策。 例 如, Netflix因将公司的推荐引擎。

17、准确率增大10的集成模型而在2009年奖励开发人员团 队100万美元的奖金, 但Netflix的工程博客在2012年披露, Netflix从未在生产系统中部署 过优胜的集成模型, 因为优胜的改进所提供的准确率增大 “似乎未能证明有必要付出工程 努力来将改进引入生产环境” 。 0008 现有更复杂模型的可解释性也可能减小。 由于决策中涉及更复杂模型, 用户更难 以感知通过更复杂模型产生决策的基础推理过程。 然而, 模型解释很可能在未来几年仍然 是支付行业中的重要问题, 因为如果用户不信任模型或其决策, 则用户将不会实施模型或 其决策。 0009 因此, 所属领域中需要改进模型的泛化能力, 同时维。

18、持模型的易于部署和可解释 性。 发明内容 0010 因此, 提供系统、 方法和计算机程序产品以用于通过将来自更复杂模型的知识融 入更简单模型中来提高模型的泛化能力, 同时维持模型的易于部署和可解释性。 0011 根据一些非限制性实施例或方面, 提供一种计算机实施的方法, 包括: 通过至少一 个处理器获得与第一组特征相关联的第一训练数据以及与不同于第一组特征的第二组特 征相关联的第二训练数据; 通过至少一个处理器基于第一训练数据和第二训练数据来训练 第一模型; 以及通过至少一个处理器基于第二训练数据而使用损失函数来训练第二模型, 所述损失函数取决于第一模型的中间层的输出和第二模型的输出。 001。

19、2 在一些非限制性实施例或方面, 第二模型包括至少一个第一层和至少一个第二 层, 第二模型的输出包括所述至少一个第一层的输出, 并且训练第二模型还包括: 使用取决 于第一模型的中间层的输出和第二模型的包括第一层的输出的输出的损失函数来修改第 二模型的所述至少一个第一层的一个或多个参数; 以及基于所述至少一个第一层的输出来 训练所述至少一个第二层。 0013 在一些非限制性实施例或方面, 第一模型包括以下至少一项: 深度神经网络、 循环 神经网络、 多个神经网络的集成, 或其任何组合; 第二模型的第一层包括回归神经网络, 并 且第二模型的第二层包括逻辑回归模型。 0014 在一些非限制性实施例或。

20、方面, 所述方法还包括: 通过至少一个处理器确定第一 模型的多个中间层的多个信息值; 以及通过至少一个处理器基于所述多个信息值而从所述 多个中间层中选择中间层。 0015 在一些非限制性实施例或方面, 第一组特征包括复杂特征, 并且第二组特征包括 可解释特征。 0016 在一些非限制性实施例或方面, 第一模型包括比第二模型多的参数数目。 0017 在一些非限制性实施例或方面, 所述方法还包括: 通过至少一个处理器提供经过 训练的第二模型; 通过至少一个处理器获得与至少一个交易相关联的输入数据; 以及通过 说明书 2/18 页 6 CN 111428872 A 6 至少一个处理器并且使用经过训练。

21、的第二模型来处理所述输入数据以生成输出数据, 所述 输出数据包括所述至少一个交易是否是欺诈交易的预测。 0018 根据一些非限制性实施例或方面, 提供一种包括至少一个处理器的计算系统, 所 述至少一个处理器被编程和/或配置成: 获得与第一组特征相关联的第一训练数据以及与 不同于第一组特征的第二组特征相关联的第二训练数据; 基于第一训练数据和第二训练数 据来训练第一模型; 以及基于第二训练数据而使用损失函数来训练第二模型, 所述损失函 数取决于第一模型的中间层的输出和第二模型的输出。 0019 在一些非限制性实施例或方面, 第二模型包括至少一个第一层和至少一个第二 层, 第二模型的输出包括所述至。

22、少一个第一层的输出, 并且所述至少一个处理器进一步被 编程和/或配置成通过以下方式训练第二模型: 使用取决于第一模型的中间层的输出和第 二模型的包括第一层的输出的输出的损失函数来修改第二模型的所述至少一个第一层的 一个或多个参数; 以及基于所述至少一个第一层的输出来训练所述至少一个第二层。 0020 在一些非限制性实施例或方面, 第一模型包括以下至少一项: 深度神经网络、 循环 神经网络、 多个神经网络的集成, 或其任何组合; 第二模型的第一层包括回归神经网络, 并 且第二模型的第二层包括逻辑回归模型。 0021 在一些非限制性实施例或方面, 所述至少一个处理器进一步被编程和/或配置成: 确定。

23、第一模型的多个中间层的多个信息值; 以及基于所述多个信息值而从所述多个中间层 中选择中间层。 0022 在一些非限制性实施例或方面, 第一组特征包括复杂特征, 并且第二组特征包括 可解释特征。 0023 在一些非限制性实施例或方面, 第一模型包括比第二模型多的参数数目。 0024 在一些非限制性实施例或方面, 所述至少一个处理器进一步被编程和/或配置成: 提供经过训练的第二模型; 获得与至少一个交易相关联的输入数据; 以及使用经过训练的 第二模型处理所述输入数据以生成输出数据, 所述输出数据包括所述至少一个交易是否是 欺诈交易的预测。 0025 根据一些非限制性实施例或方面, 提供一种包括至少。

24、一个非瞬态计算机可读介质 的计算机程序产品, 所述至少一个非瞬态计算机可读介质包括程序指令, 所述程序指令在 由至少一个处理器执行时使所述至少一个处理器: 获得与第一组特征相关联的第一训练数 据以及与不同于第一组特征的第二组特征相关联的第二训练数据; 基于第一训练数据和第 二训练数据来训练第一模型; 以及基于第二训练数据而使用损失函数来训练第二模型, 所 述损失函数取决于第一模型的中间层的输出和第二模型的输出。 0026 在一些非限制性实施例或方面, 第二模型包括至少一个第一层和至少一个第二 层, 第二模型的输出包括所述至少一个第一层的输出, 并且所述指令还使所述至少一个处 理器通过以下方式训。

25、练第二模型: 使用取决于第一模型的中间层的输出和第二模型的包括 第一层的输出的输出的损失函数来修改第二模型的所述至少一个第一层的一个或多个参 数; 以及基于所述至少一个第一层的输出来训练所述至少一个第二层。 0027 在一些非限制性实施例或方面, 所述指令还使所述至少一个处理器: 确定第一模 型的多个中间层的多个信息值; 以及基于所述多个信息值而从所述多个中间层中选择中间 层。 说明书 3/18 页 7 CN 111428872 A 7 0028 在一些非限制性实施例或方面, 第一组特征包括复杂特征, 并且第二组特征包括 可解释特征。 0029 在一些非限制性实施例或方面, 第一模型包括比第二。

26、模型多的参数数目。 0030 在一些非限制性实施例或方面, 所述指令还使所述至少一个处理器: 提供经过训 练的第二模型; 获得与至少一个交易相关联的输入数据; 以及使用经过训练的第二模型处 理所述输入数据以生成输出数据, 所述输出数据包括所述至少一个交易是否是欺诈交易的 预测。 0031 在以下编号条项中阐述其它实施例或方面: 0032 第1条一种计算机实施的方法, 包括: 通过至少一个处理器获得与第一组特征相关 联的第一训练数据以及与不同于第一组特征的第二组特征相关联的第二训练数据; 通过至 少一个处理器基于第一训练数据和第二训练数据来训练第一模型; 以及通过至少一个处理 器基于第二训练数据。

27、而使用损失函数来训练第二模型, 所述损失函数取决于第一模型的中 间层的输出和第二模型的输出。 0033 第2条根据第1条所述的计算机实施的方法, 其中第二模型包括至少一个第一层和 至少一个第二层, 其中第二模型的输出包括所述至少一个第一层的输出, 并且其中训练第 二模型还包括: 使用取决于第一模型的中间层的输出和第二模型的包括第一层的输出的输 出的损失函数来修改第二模型的所述至少一个第一层的一个或多个参数; 以及基于所述至 少一个第一层的输出来训练所述至少一个第二层。 0034 第3条根据第1条或第2条所述的计算机实施的方法, 其中第一模型包括以下至少 一项: 深度神经网络、 循环神经网络、 。

28、多个神经网络的集成, 或其任何组合, 其中第二模型的 第一层包括回归神经网络, 并且其中第二模型的第二层包括逻辑回归模型。 0035 第4条根据第1至3条中的任一条所述的计算机实施的方法, 还包括: 通过至少一个 处理器确定第一模型的多个中间层的多个信息值; 以及通过至少一个处理器基于所述多个 信息值而从所述多个中间层中选择中间层。 0036 第5条根据第1至4条中的任一条所述的计算机实施的方法, 其中第一组特征包括 复杂特征, 并且其中第二组特征包括可解释特征。 0037 第6条根据第1至5条中的任一条所述的计算机实施的方法, 其中第一模型包括比 第二模型多的参数数目。 0038 第7条根据。

29、第1至6条中的任一条所述的计算机实施的方法, 还包括: 通过至少一个 处理器提供经过训练的第二模型; 通过至少一个处理器获得与至少一个交易相关联的输入 数据; 以及通过至少一个处理器并且使用经过训练的第二模型来处理所述输入数据以生成 输出数据, 其中所述输出数据包括所述至少一个交易是否是欺诈交易的预测。 0039 第8条一种包括至少一个处理器的计算系统, 所述至少一个处理器被编程和/或配 置成: 获得与第一组特征相关联的第一训练数据以及与不同于第一组特征的第二组特征相 关联的第二训练数据; 基于第一训练数据和第二训练数据来训练第一模型; 以及基于第二 训练数据而使用损失函数来训练第二模型, 所。

30、述损失函数取决于第一模型的中间层的输出 和第二模型的输出。 0040 第9条根据第8条所述的计算系统, 其中第二模型包括至少一个第一层和至少一个 第二层, 其中第二模型的输出包括所述至少一个第一层的输出, 并且其中所述至少一个处 说明书 4/18 页 8 CN 111428872 A 8 理器进一步被编程和/或配置成通过以下方式训练第二模型: 使用取决于第一模型的中间 层的输出和第二模型的包括第一层的输出的输出的损失函数来修改第二模型的所述至少 一个第一层的一个或多个参数; 以及基于所述至少一个第一层的输出来训练所述至少一个 第二层。 0041 第10条根据第8条或第9条所述的计算系统, 其中。

31、第一模型包括以下至少一项: 深 度神经网络、 循环神经网络、 多个神经网络的集成, 或其任何组合, 其中第二模型的第一层 包括回归神经网络, 并且其中第二模型的第二层包括逻辑回归模型。 0042 第11条根据第8至10条中的任一条所述的计算系统, 其中所述至少一个处理器进 一步被编程和/或配置成: 确定第一模型的多个中间层的多个信息值; 以及基于所述多个信 息值而从所述多个中间层中选择中间层。 0043 第12条根据第8至11条中的任一条所述的计算系统, 其中第一组特征包括复杂特 征, 并且其中第二组特征包括可解释特征。 0044 第13条根据第8至12条中的任一条所述的计算系统, 其中第一模。

32、型包括比第二模 型多的参数数目。 0045 第14条根据第8至13条中的任一条所述的计算系统, 其中所述至少一个处理器进 一步被编程和/或配置成: 提供经过训练的第二模型; 获得与至少一个交易相关联的输入数 据; 以及使用经过训练的第二模型处理所述输入数据以生成输出数据, 其中所述输出数据 包括所述至少一个交易是否是欺诈交易的预测。 0046 第15条一种包括至少一个非瞬态计算机可读介质的计算机程序产品, 所述至少一 个非瞬态计算机可读介质包括程序指令, 所述程序指令在由至少一个处理器执行时使所述 至少一个处理器: 获得与第一组特征相关联的第一训练数据以及与不同于第一组特征的第 二组特征相关联。

33、的第二训练数据; 基于第一训练数据和第二训练数据来训练第一模型; 以 及基于第二训练数据而使用损失函数来训练第二模型, 所述损失函数取决于第一模型的中 间层的输出和第二模型的输出。 0047 第16条根据第15条所述的计算机程序产品, 其中第二模型包括至少一个第一层和 至少一个第二层, 其中第二模型的输出包括所述至少一个第一层的输出, 并且其中所述指 令还使所述至少一个处理器通过以下方式训练第二模型: 使用取决于第一模型的中间层的 输出和第二模型的包括第一层的输出的输出的损失函数来修改第二模型的所述至少一个 第一层的一个或多个参数; 以及基于所述至少一个第一层的输出来训练所述至少一个第二 层。。

34、 0048 第17条根据第15条或第16条所述的计算机程序产品, 其中所述指令还使所述至少 一个处理器: 确定第一模型的多个中间层的多个信息值; 以及基于所述多个信息值而从所 述多个中间层中选择中间层。 0049 第18条根据第15至17条中的任一条所述的计算机程序产品, 其中第一组特征包括 复杂特征, 并且其中第二组特征包括可解释特征。 0050 第19条根据第15至18条中的任一条所述的计算机程序产品, 其中第一模型包括比 第二模型多的参数数目。 0051 第20条根据第15至19条中的任一条所述的计算机程序产品, 其中所述指令还使所 述至少一个处理器: 提供经过训练的第二模型; 获得与至。

35、少一个交易相关联的输入数据; 以 说明书 5/18 页 9 CN 111428872 A 9 及使用经过训练的第二模型处理所述输入数据以生成输出数据, 其中所述输出数据包括所 述至少一个交易是否是欺诈交易的预测。 0052 在参考附图考虑以下描述和所附权利要求书之后, 本公开的这些和其它特征和特 性以及相关结构元件和各部分的组合的操作方法和功能以及制造经济性将变得更加显而 易见, 所有这些形成本说明书的部分, 其中相似附图标号在各图中标示对应部分。 然而, 应 明确地理解, 各图仅用于说明和描述目的, 并非旨在作为对限制的定义。 如在说明书中和权 利要求书中所用, 除非上下文另外明确规定, 否。

36、则单数形式 “一” 和 “所述” 包括复数指示物。 附图说明 0053 下文参考所附示意图中示出的示范性实施例更详细地解释非限制性实施例或方 面的额外优势和细节, 图中: 0054 图1是其中可实施本文所描述的系统、 装置、 产品、 设备和/或方法的环境的非限制 性实施例或方面的图; 0055 图2是图1的一个或多个装置和/或一个或多个系统的部件的非限制性实施例或方 面的图; 0056 图3是示出训练、 提供和/或使用融合来自更复杂模型的知识的预测模型的过程的 非限制性实施例或方面的流程图; 0057 图4是本文公开的训练、 提供和/或使用融合来自更复杂模型的知识的预测模型的 过程的非限制性实。

37、施例或方面的实施方案的图; 0058 图5A是本文公开的训练、 提供和/或使用融合来自更复杂模型的知识的预测模型 的过程的非限制性实施例或方面的实施方案的图; 以及 0059 图5B是如图5A中所示的训练、 提供和/或使用融合来自更复杂模型的知识的预测 模型的过程的非限制性实施例或方面的实施方案的信息值的图。 具体实施方式 0060 应理解, 除了明确指定为相反的情况之外, 本公开可采用各种替代变化和步骤顺 序。 还应理解, 附图中所示的以及在以下说明书中描述的特定装置和过程仅仅是示范性和 非限制性实施例或方面。 因此, 与本文公开的实施例或方面有关的特定维度和其它物理特 性不应被视为限制。 。

38、0061 本文所用的方面、 部件、 元件、 结构、 动作、 步骤、 功能、 指令和/或其类似者都不应 当被理解为关键的或必要的, 除非明确地如此描述。 另外, 如本文所使用, 冠词 “一” 旨在包 括一个或多个项目, 并且可与 “一个或多个” 和 “至少一个” 互换使用。 此外, 如本文所使用, 术语 “组” 旨在包括一个或多个项目(例如, 相关项目、 不相关项目、 相关项目与不相关项目 的组合等), 并且可与 “一个或多个” 或 “至少一个” 互换使用。 在既定仅有一个项目的情况 下, 使用术语 “一个” 或类似语言。 另外, 如本文所使用, 术语 “具有” 或类似者旨在作为开放 式术语。 。

39、此外, 除非另外明确陈述, 否则短语 “基于” 旨在意指 “至少部分地基于” 。 0062 为了进行以下描述, 术语 “端” 、“上” 、“下” 、“右” 、“左” 、“竖直” 、“水平” 、“顶部” 、 “底部” 、“橫向” 、“纵向” 和其派生词应如其在附图中的定向那样与非限制性实施例或方面 相关。 然而, 应理解, 除了明确指定为相反的情况之外, 非限制性实施例或方面可采用各种 说明书 6/18 页 10 CN 111428872 A 10 替代变化和步骤顺序。 还应理解, 附图中所示的以及在以下说明书中描述的特定装置和过 程仅仅是示范性实施例或方面。 因此, 除非另有指示, 否则与本文。

40、公开的实施例或实施例的 方面相关的特定维度和其它物理特性不应被视为限制。 0063 如本文所使用, 术语 “通信” 和 “传达” 可指信息(例如, 数据、 信号、 消息、 指令、 命令 和/或其类似者)的接收、 接纳、 传输、 传送、 提供和/或其类似者。 一个单元(例如, 装置、 系 统、 装置或系统的部件、 其组合和/或其类似者)与另一单元通信意指所述一个单元能够直 接或间接地从所述另一单元接收信息和/或向所述另一单元传输信息。 这可指在本质上有 线和/或无线的直接或间接连接(例如, 直接通信连接、 间接通信连接和/或其类似者)。 另 外, 即使传输的信息可能在第一单元与第二单元之间被修改。

41、、 处理、 中继和/或路由, 这两个 单元也可彼此通信。 例如, 即使第一单元被动地接收信息并且不会主动地将信息传输给第 二单元, 第一单元也可与第二单元通信。 作为另一示例, 如果至少一个中间单元(例如, 位于 第一单元与第二单元之间的第三单元)处理从第一单元接收的信息并将处理后的信息传达 给第二单元, 则第一单元可与第二单元通信。 在一些非限制性实施例中, 消息可指包括数据 的网络包(例如, 数据包和/或其类似者)。 应了解, 可能有许多其它布置。 0064 本文中结合阈值描述一些非限制性实施例或方面。 如本文中所使用, 满足阈值可 指大于阈值、 多于阈值、 高于阈值、 大于或等于阈值、 。

42、小于阈值、 少于阈值、 低于阈值、 小于或 等于阈值、 等于阈值等的值。 0065 如本文所使用, 术语 “交易服务提供商” 可指从商家或其它实体接收交易授权请求 并且在一些情况下通过交易服务提供商与发行方机构之间的协定来提供支付保证的实体。 例如, 交易服务提供商可包括支付网络, 例如或处理交易的任何其它实体。 术语 “交 易处理系统” 可指由交易服务提供商或代表交易服务提供商操作的一个或多个计算机系 统, 例如执行一个或多个软件应用程序的交易处理服务器。 交易处理服务器可包括一个或 多个处理器, 并且在一些非限制性实施例中, 可由交易服务提供商或代表交易服务提供商 操作。 0066 如本文。

43、所使用, 术语 “发行方机构” 可指例如银行的一个或多个实体, 其向客户提 供账户以进行交易(例如支付交易), 例如发起信用和/或借记支付。 例如, 发行方机构可向 客户提供唯一地标识与该客户相关联的一个或多个账户的账户标识符, 例如主账号(PAN)。 账户标识符可在例如支付卡的实体金融工具等便携式金融装置上实施, 和/或可以是电子 的并且用于电子支付。 术语 “发行方系统” 是指由发行方机构或代表发行方机构操作的一个 或多个计算机系统, 例如执行一个或多个软件应用程序的服务器计算机。 例如, 发行方系统 可包括用于授权交易的一个或多个授权服务器。 0067 如本文所使用, 术语 “收单方机构。

44、” 可指由交易服务提供商授权和/或批准以使用 与交易服务提供商相关联的便携式金融装置发起交易(例如支付交易)的实体。 收单方机构 可发起的交易可包括支付交易(例如购买、 原始信用证交易(OCT)、 账户资金交易(AFT)和/ 或其类似者)。 在一些非限制性实施例中, 收单方机构可以是金融机构, 例如银行。 如本文所 使用, 术语 “收单方系统” 可指由收单方机构或代表收单方机构操作的一个或多个计算机系 统、 计算机装置、 软件应用程序和/或其类似者。 0068 如本文所使用, 术语 “账户标识符” 可包括一个或多个PAN、 令牌, 或与客户账户相 关联的其它标识符。 术语 “令牌” 可指用作P。

45、AN等原始账户标识符的取代或替代标识符的标 说明书 7/18 页 11 CN 111428872 A 11 识符。 账户标识符可以是文字数字的, 或是字符和/或符号的任何组合。 令牌可与一个或多 个数据结构(例如一个或多个数据库和/或其类似者)中的PAN或另一原始账户标识符相关 联, 使得令牌可用于进行交易而无需直接使用原始账户标识符。 在一些示例中, 原始账户标 识符, 例如PAN, 可与用于不同个人或目的的多个令牌相关联。 如本文所使用, 术语 “账户数 据” 是指关于一个或多个用户的一个或多个账户的任何数据。 账户数据可包括例如一个或 多个账户标识符、 用户标识符、 交易历史、 余额、 。

46、信用额度、 发行方机构标识符和/或其类似 者。 0069 如本文所使用, 术语 “商家” 可指基于支付交易等交易向客户提供商品和/或服务 或对商品和/或服务的使用权的个人或实体。 术语 “商家” 或 “商家系统” 还可指由商家或代 表商家操作的一个或多个计算机系统, 例如执行一个或多个软件应用程序的服务器计算 机。 如本文所使用的 “销售点(POS)系统” 可指由商家用来与客户进行支付交易的一个或多 个计算机和/或外围装置, 包括一个或多个读卡器、 近场通信(NFC)接收器、 RFID接收器和/ 或其它非接触收发器或接收器、 基于接触的接收器、 支付终端、 计算机、 服务器、 输入装置 和/或。

47、可用于发起支付交易的其它类似装置。 0070 如本文所使用, 术语 “移动装置” 可指被配置成与一个或多个网络通信的一个或多 个便携式电子装置。 例如, 移动装置可包括蜂窝电话(例如, 智能电话或标准蜂窝电话)、 便 携式计算机(例如, 平板电脑、 笔记本电脑等)、 可穿戴装置(例如, 手表、 眼镜、 镜片、 衣服和/ 或其类似者)、 个人数字助理(PDA)和/或其它类似装置。 如本文所使用, 术语 “客户端装置” 和 “用户装置” 是指被配置成与一个或多个服务器或远程装置和/或系统通信的任何电子装 置。 客户端装置或用户装置可包括移动装置、 支持网络的设备(例如支持网络的电视、 冰箱、 恒温。

48、器和/或其类似者)、 计算机、 POS系统和/或能够与网络通信的任何其它装置或系统。 0071 如本文所使用, 术语 “计算装置” 可指被配置成直接或间接地与一个或多个网络通 信或在一个或多个网络上通信的一个或多个电子装置。 计算装置可以是移动装置、 台式计 算机等等。 此外, 术语 “计算机” 可指包括用以接收、 处理和输出数据的必要部件且通常包括 显示器、 处理器、 存储器、 输入装置和网络接口的任何计算装置。“应用程序” 或 “应用程序编 程接口” (API)是指计算机代码或在计算机可读介质上排序的其它数据, 其可由处理器执行 以促进软件部件之间的交互, 例如客户端侧前端和/或服务器侧后。

49、端以用于从客户端接收 数据。“界面” 是指生成的显示, 例如用户可直接或间接(例如通过键盘、 鼠标触摸屏等)与之 交互的一个或多个图形用户界面(GUI)。 0072 如本文所使用, 术语 “电子钱包” 和 “电子钱包应用程序” 是指被配置成发起和/或 进行支付交易的一个或多个电子装置和/或软件应用程序。 例如, 电子钱包可包括执行电子 钱包应用程序的移动装置, 并且还可包括用于维护并提供交易数据给移动装置的服务器侧 软件和/或数据库。“电子钱包提供商” 可包括为客户提供和/或维护电子钱包的实体, 例如 Google WalletTM、 Android AppleSamsung和/或其它类似电子。

50、支付系 统。 在一些非限制性示例中, 发行方银行可以是电子钱包提供商。 0073 如本文所使用, 术语 “便携式金融装置” 可指支付卡(例如信用卡或借记卡)、 礼品 卡、 智能卡、 智能介质、 工资卡、 医疗保健卡、 腕带、 含有账户信息的机器可读介质、 钥匙链装 置或挂扣、 RFID应答器、 零售商折扣卡或忠诚卡、 蜂窝电话、 电子钱包移动应用程序、 个人数 字助理(PDA)、 安全卡、 计算机、 通行卡、 无线终端和/或应答器, 和/或其类似者。 在一些非限 说明书 8/18 页 12 CN 111428872 A 12 制性实施例中, 便携式金融装置可包括易失性或非易失性存储器以存储信息。

展开阅读全文
内容关键字: 用于 将来 复杂 模型 知识 融入 简单 中的 系统 方法 计算机 程序 产品
关于本文
本文标题:用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9226884.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1