对推荐模型的训练样本进行样本域转换的方法及装置.pdf

上传人:Ameli****keyy 文档编号:9225840 上传时间:2021-05-10 格式:PDF 页数:20 大小:735.87KB
收藏 版权申诉 举报 下载
对推荐模型的训练样本进行样本域转换的方法及装置.pdf_第1页
第1页 / 共20页
对推荐模型的训练样本进行样本域转换的方法及装置.pdf_第2页
第2页 / 共20页
对推荐模型的训练样本进行样本域转换的方法及装置.pdf_第3页
第3页 / 共20页
文档描述:

《对推荐模型的训练样本进行样本域转换的方法及装置.pdf》由会员分享,可在线阅读,更多相关《对推荐模型的训练样本进行样本域转换的方法及装置.pdf(20页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010205866.1 (22)申请日 2020.03.23 (71)申请人 支付宝 (杭州) 信息技术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-11 (72)发明人 王冠楠 (74)专利代理机构 北京永新同创知识产权代理 有限公司 11376 代理人 林锦辉刘景峰 (51)Int.Cl. G06K 9/62(2006.01) G06N 20/00(2019.01) (54)发明名称 对推荐模型的训练样本进行样本域转换的 方法及装置 (。

2、57)摘要 本说明书实施例提供了一种用于对训练样 本进行样本域转换的方法及装置, 在该方法中, 获取第一样本域下的第一训练样本和第二样本 域下的第二训练样本, 使用第一样本迁移转换过 程将第二训练样本迁移转换成第三训练样本, 其 中, 第一样本迁移转换过程是使用机器学习方法 来在第一约束条件下实现的。 在满足第一约束条 件时将第三训练样本确定为第一样本域下的训 练样本。 权利要求书3页 说明书12页 附图4页 CN 111428783 A 2020.07.17 CN 111428783 A 1.一种对推荐模型的训练样本进行样本域转换的方法, 包括: 获取第一样本域下的第一训练样本和第二样本域下。

3、的第二训练样本; 其中, 所述第一 样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型, 所述第二样本域下 的训练样本被用来训练用于推荐第二类商品的第二推荐模型, 所述第一训练样本包括针对 所述第一类商品的样本, 所述第二训练样本包括针对所述第二类商品的样本; 使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本; 以及 将所述第三训练样本确定为所述第一样本域下的训练样本, 以使得基于所确定的训练 样本来训练所述第一推荐模型, 其中, 所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的, 所述第一约束条件包括: 当前迁移转换的分布式距离与上一次迁移转换的。

4、分布式距离之间 的差值小于第一阈值, 其中, 每次迁移转换的分布式距离为该次迁移转换得到的第三训练 样本与所述第一训练样本之间的分布式距离。 2.如权利要求1所述的方法, 其中, 所述第一训练样本和所述第二训练样本是有监督训 练样本, 以及 所述第一约束条件还包括: 所述第三训练样本的训练误差小于第二阈值, 以及所述第 一训练样本的预测误差小于第三阈值, 其中, 所述第一训练样本的预测值是使用第一预测模型预测的, 所述第一预测模型是 利用所述第三训练样本训练出的。 3.如权利要求1或2所述的方法, 还包括: 使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本, 其中, 所述第二。

5、样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的; 以及 将所述第三训练样本确定为所述第一样本域下的训练样本包括: 当所述第四训练样本满足第三约束条件时, 将所述第三训练样本确定为所述第一样本 域下的训练样本, 其中, 所述第三约束条件包括: 所述第四训练样本与所述第二训练样本之间的分布式 距离小于第四阈值。 4.如权利要求3所述的方法, 其中, 所述第二训练样本和所述第四训练样本是有监督训 练样本, 以及 所述第三约束条件还包括: 所述第四训练样本的训练误差小于第五阈值, 以及所述第 二训练样本的预测误差小于第六阈值, 其中, 所述第二训练样本的预测值是使用第二预测模型预测的, 所。

6、述第二预测模型是 利用所述第四训练样本训练出的。 5.如权利要求3所述的方法, 还包括: 当所述第四训练样本不满足第三约束条件时, 将所述第四训练样本确定为第二样本域 下的第二训练样本, 并返回执行使用第一样本迁移转换过程来将第二训练样本迁移转换为 第三训练样本的操作。 6.如权利要求3所述的方法, 其中, 所述第二约束条件包括: 循环次数, 或者 当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈 权利要求书 1/3 页 2 CN 111428783 A 2 值, 其中, 每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与所述第二训 练样本之间的分布式距离。 7。

7、.如权利要求1所述的方法, 其中, 所述第一样本域是与少样本场景对应的样本域, 以 及所述第二样本域是与多样本场景对应的样本域。 8.如权利要求6任一项所述的方法, 其中, 分布式距离包括以下中的至少一种: 欧式距离; KL散度; JS散度; 和 EM距离。 9.一种对推荐模型的训练样本进行样本域转换的装置, 包括: 训练样本获取单元, 获取第一样本域下的第一训练样本和第二样本域下的第二训练样 本; 其中, 所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型, 所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型, 所述第一 训练样本包括针对所述第一类商品的样。

8、本, 所述第二训练样本包括针对所述第二类商品的 样本; 第一样本迁移转换单元, 使用第一样本迁移转换过程来将所述第二训练样本迁移转换 为第三训练样本; 以及 第一训练样本确定单元, 将所述第三训练样本确定为所述第一样本域下的训练样本, 以使得基于所确定的训练样本来训练所述第一推荐模型, 其中, 所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的, 所述第一约束条件包括: 当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间 的差值小于第一阈值, 其中, 每次迁移转换的分布式距离为该次迁移转换得到的第三训练 样本与所述第一训练样本之间的分布式距离。 10.如权利要求9所述的装。

9、置, 其中, 所述第一训练样本和所述第二训练样本是有监督 训练样本, 以及 所述第一约束条件还包括: 所述第三训练样本的训练误差小于第二阈值, 以及所述第 一训练样本的预测误差小于第三阈值, 其中, 所述第一训练样本的预测值是使用第一预测模型预测的, 所述第一预测模型是 利用所述第三训练样本训练出的。 11.如权利要求9或10所述的装置, 还包括: 第二样本迁移转换单元, 使用第二样本迁移转换过程来将所述第三训练样本迁移转换 为第四训练样本, 其中, 所述第二样本迁移转换过程是使用机器学习方法来在第二约束条 件下实现的; 以及 所述第一训练样本确定单元: 当所述第四训练样本满足第三约束条件时,。

10、 将所述第三训练样本确定为所述第一样本 域下的训练样本, 其中, 所述第三约束条件包括: 所述第四训练样本与所述第二训练样本之间的分布式 距离小于第四阈值。 12.如权利要求11所述的装置, 其中, 所述第二训练样本和所述第四训练样本是有监督 权利要求书 2/3 页 3 CN 111428783 A 3 训练样本, 以及 所述第三约束条件还包括: 所述第四训练样本的训练误差小于第五阈值, 以及所述第 二训练样本的预测误差小于第六阈值, 其中, 所述第二训练样本的预测值是使用第二预测模型预测的, 所述第二预测模型是 利用所述第四训练样本训练出的。 13.如权利要求11所述的装置, 还包括: 第二。

11、训练样本确定单元, 当所述第四训练样本不满足第三约束条件时, 将所述第四训 练样本确定为第二样本域下的第二训练样本, 并触发所述第一样本迁移转换单元执行使用 第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。 14.如权利要求11所述的装置, 其中, 所述第二约束条件包括: 循环次数, 或者 当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈 值, 其中, 每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与所述第二训 练样本之间的分布式距离。 15.一种电子设备, 包括: 至少一个处理器, 以及 与所述至少一个处理器耦合的存储器, 所述存储器存储指。

12、令, 当所述指令被所述至少 一个处理器执行时, 使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。 16.一种机器可读存储介质, 其存储有可执行指令, 所述指令当被执行时使得所述机器 执行如权利要求1到8中任一所述的方法。 权利要求书 3/3 页 4 CN 111428783 A 4 对推荐模型的训练样本进行样本域转换的方法及装置 技术领域 0001 本说明书实施例涉及机器学习技术领域, 具体地, 涉及对推荐模型的训练样本进 行样本域转换的方法及装置。 背景技术 0002 每个场景下的样本可以反映出该场景的业务特点, 基于此, 不同的场景下的样本 会存在差异。 例如, 新零售时代推出。

13、的以适应大众的购物需求的 “双十一” 、“手机节” 等各种 业务模式, 每种业务模式即是一种场景, 不同的业务模式有不同的业务特点, 比如, 针对的 消费群体、 商品类型等不同, 因此, 不同的业务模式冷启动所需的样本会不同, 比如,“手机 节” 场景下的样本主要是手机, 而 “双十一” 场景下的样本主要是服装等。 0003 对于较成熟的场景, 样本的数量较丰富。 而对于新场景来说, 相应的样本数量会较 少, 甚至样本的数量达不到冷启动的要求。 此时, 需要增加新场景中的样本, 一种增加方式 是利用成熟场景中的样本来增加新场景中的样本。 发明内容 0004 鉴于上述, 本说明书实施例提供了一种。

14、对推荐模型的训练样本进行样本域转换的 方法及装置。 在该方法中, 在获取第一样本域下的第一训练样本和第二样本域下的第二训 练样本后, 使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下的第三训 练样本, 其中, 第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。 通 过上述方法, 第一约束条件使得第三训练样本可以适用于第一样本域的场景, 由此扩充了 第一样本域下的训练样本, 再利用扩充后的第一样本域下的训练样本可以训练出相应的推 荐模型。 0005 根据本说明书实施例的一个方面, 提供了一种对推荐模型的训练样本进行样本域 转换的方法, 包括: 获取第一样本域下的第一训练。

15、样本和第二样本域下的第二训练样本; 其 中, 所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型, 所述 第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型, 所述第一训练 样本包括针对所述第一类商品的样本, 所述第二训练样本包括针对所述第二类商品的样 本; 使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本; 以及将 所述第三训练样本确定为所述第一样本域下的训练样本, 以使得基于所确定的训练样本来 训练所述第一推荐模型, 其中, 所述第一样本迁移转换过程是使用机器学习方法来在第一 约束条件下实现的, 所述第一约束条件包括: 当前迁移转换的分布式。

16、距离与上一次迁移转 换的分布式距离之间的差值小于第一阈值, 其中, 每次迁移转换的分布式距离为该次迁移 转换得到的第三训练样本与所述第一训练样本之间的分布式距离。 0006 可选地, 在上述方面的一个示例中, 所述第一训练样本和所述第二训练样本是有 监督训练样本, 以及所述第一约束条件还包括: 所述第三训练样本的训练误差小于第二阈 值, 以及所述第一训练样本的预测误差小于第三阈值, 其中, 所述第一训练样本的预测值是 说明书 1/12 页 5 CN 111428783 A 5 使用第一预测模型预测的, 所述第一预测模型是利用所述第三训练样本训练出的。 0007 可选地, 在上述方面的一个示例中。

17、, 还包括: 使用第二样本迁移转换过程来将所述 第三训练样本迁移转换为第四训练样本, 其中, 所述第二样本迁移转换过程是使用机器学 习方法来在第二约束条件下实现的; 以及将所述第三训练样本确定为所述第一样本域下的 训练样本包括: 当所述第四训练样本满足第三约束条件时, 将所述第三训练样本确定为所 述第一样本域下的训练样本, 其中, 所述第三约束条件包括: 所述第四训练样本与所述第二 训练样本之间的分布式距离小于第四阈值。 0008 可选地, 在上述方面的一个示例中, 所述第二训练样本和所述第四训练样本是有 监督训练样本, 以及所述第三约束条件还包括: 所述第四训练样本的训练误差小于第五阈 值,。

18、 以及所述第二训练样本的预测误差小于第六阈值, 其中, 所述第二训练样本的预测值是 使用第二预测模型预测的, 所述第二预测模型是利用所述第四训练样本训练出的。 0009 可选地, 在上述方面的一个示例中, 还包括: 当所述第四训练样本不满足第三约束 条件时, 将所述第四训练样本确定为第二样本域下的第二训练样本, 并返回执行使用第一 样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。 0010 可选地, 在上述方面的一个示例中, 所述第二约束条件包括: 循环次数, 或者当前 迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值, 其中, 每次迁移转换的分布式距离为该。

19、次迁移转换得到的第四训练样本与所述第二训练样本之 间的分布式距离。 0011 可选地, 在上述方面的一个示例中, 所述第一样本域是与少样本场景对应的样本 域, 以及所述第二样本域是与多样本场景对应的样本域。 0012 可选地, 在上述方面的一个示例中, 分布式距离包括以下中的至少一种: 欧式距 离; KL散度; JS散度; 和EM距离。 0013 根据本说明书实施例的另一方面, 还提供一种对推荐模型的训练样本进行样本域 转换的装置, 包括: 训练样本获取单元获取第一样本域下的第一训练样本和第二样本域下 的第二训练样本; 其中, 所述第一样本域下的训练样本被用来训练用于推荐第一类商品的 第一推荐。

20、模型, 所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐 模型, 所述第一训练样本包括针对所述第一类商品的样本, 所述第二训练样本包括针对所 述第二类商品的样本; 第一样本迁移转换单元使用第一样本迁移转换过程来将所述第二训 练样本迁移转换为第三训练样本; 以及第一训练样本确定单元将所述第三训练样本确定为 所述第一样本域下的训练样本, 以使得基于所确定的训练样本来训练所述第一推荐模型, 其中, 所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的, 所述 第一约束条件包括: 当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差 值小于第一阈值, 其中, 每次。

21、迁移转换的分布式距离为该次迁移转换得到的第三训练样本 与所述第一训练样本之间的分布式距离。 0014 可选地, 在上述方面的一个示例中, 所述第一训练样本和所述第二训练样本是有 监督训练样本, 以及所述第一约束条件还包括: 所述第三训练样本的训练误差小于第二阈 值, 以及所述第一训练样本的预测误差小于第三阈值, 其中, 所述第一训练样本的预测值是 使用第一预测模型预测的, 所述第一预测模型是利用所述第三训练样本训练出的。 0015 可选地, 在上述方面的一个示例中, 还包括: 第二样本迁移转换单元使用第二样本 说明书 2/12 页 6 CN 111428783 A 6 迁移转换过程来将所述第三。

22、训练样本迁移转换为第四训练样本, 其中, 所述第二样本迁移 转换过程是使用机器学习方法来在第二约束条件下实现的; 以及所述第一训练样本确定单 元: 当所述第四训练样本满足第三约束条件时, 将所述第三训练样本确定为所述第一样本 域下的训练样本, 其中, 所述第三约束条件包括: 所述第四训练样本与所述第二训练样本之 间的分布式距离小于第四阈值。 0016 可选地, 在上述方面的一个示例中, 所述第二训练样本和所述第四训练样本是有 监督训练样本, 以及所述第三约束条件还包括: 所述第四训练样本的训练误差小于第五阈 值, 以及所述第二训练样本的预测误差小于第六阈值, 其中, 所述第二训练样本的预测值是。

23、 使用第二预测模型预测的, 所述第二预测模型是利用所述第四训练样本训练出的。 0017 可选地, 在上述方面的一个示例中, 还包括: 第二训练样本确定单元, 当所述第四 训练样本不满足第三约束条件时, 将所述第四训练样本确定为第二样本域下的第二训练样 本, 并触发所述第一样本迁移转换单元执行使用第一样本迁移转换过程来将第二训练样本 迁移转换为第三训练样本的操作。 0018 可选地, 在上述方面的一个示例中, 所述第二约束条件包括: 循环次数, 或者当前 迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值, 其中, 每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与所。

24、述第二训练样本之 间的分布式距离。 0019 根据本说明书实施例的另一方面, 还提供一种电子设备, 包括: 至少一个处理器; 以及存储器, 所述存储器存储指令, 当所述指令被所述至少一个处理器执行时, 使得所述至 少一个处理器执行如上所述的用于对训练样本进行样本域转换的方法。 0020 根据本说明书实施例的另一方面, 还提供一种机器可读存储介质, 其存储有可执 行指令, 所述指令当被执行时使得所述机器执行如上所述的用于对训练样本进行样本域转 换的方法。 附图说明 0021 通过参照下面的附图, 可以实现对于本说明书内容的本质和优点的进一步理解。 在附图中, 类似组件或特征可以具有相同的附图标记。

25、。 附图是用来提供对本发明实施例的 进一步理解, 并且构成说明书的一部分, 与下面的具体实施方式一起用于解释本说明书的 实施例, 但并不构成对本说明书的实施例的限制。 在附图中: 0022 图1示出了本说明书的实施例的用于对训练样本进行样本域转换的方法的流程 图; 0023 图2示出了本说明书的实施例的第一样本迁移转换过程的一个示例的流程图; 0024 图3示出了本说明书的另一实施例的用于对训练样本进行样本域转换的方法的流 程图; 0025 图4示出了本说明书的另一实施例的第二样本迁移转换过程的一个示例的流程 图; 0026 图5示出了本说明书的实施例的用于对训练样本进行样本域转换的装置的方框。

26、 图; 0027 图6示出了本说明书的另一实施例的用于对训练样本进行样本域转换的装置的方 说明书 3/12 页 7 CN 111428783 A 7 框图; 和 0028 图7示出了本说明书的实施例的用于对训练样本进行样本域转换的电子设备的方 框图。 具体实施方式 0029 以下将参考示例实施方式讨论本文描述的主题。 应该理解, 讨论这些实施方式只 是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题, 并非是对权利要求 书中所阐述的保护范围、 适用性或者示例的限制。 可以在不脱离本说明书内容的保护范围 的情况下, 对所讨论的元素的功能和排列进行改变。 各个示例可以根据需要, 省略、 。

27、替代或 者添加各种过程或组件。 另外, 相对一些示例所描述的特征在其它例子中也可以进行组合。 0030 如本文中使用的, 术语 “包括” 及其变型表示开放的术语, 含义是 “包括但不限于” 。 术语 “基于” 表示 “至少部分地基于” 。 术语 “一个实施例” 和 “一实施例” 表示 “至少一个实施 例” 。 术语 “另一个实施例” 表示 “至少一个其他实施例” 。 术语 “第一” 、“第二” 等可以指代不 同的或相同的对象。 下面可以包括其他的定义, 无论是明确的还是隐含的。 除非上下文中明 确地指明, 否则一个术语的定义在整个说明书中是一致的。 0031 每个场景下的样本可以反映出该场景的。

28、业务特点, 基于此, 不同的场景下的样本 会存在差异。 例如, 新零售时代推出的以适应大众的购物需求的 “双十一” 、“手机节” 等各种 业务模式, 每种业务模式即是一种场景, 不同的业务模式有不同的业务特点, 比如, 针对的 消费群体、 商品类型等不同, 因此, 不同的业务模式冷启动所需的样本会不同, 比如,“手机 节” 场景下的样本主要是手机, 而 “双十一” 场景下的样本主要是服装等。 0032 对于较成熟的场景, 样本的数量较丰富。 而对于新场景来说, 相应的样本数量会较 少, 甚至样本的数量达不到冷启动的要求。 此时, 需要增加新场景中的样本。 目前, 一种增加 方式是依赖于人工经验。

29、, 即依靠具有丰富产品经验的专家选取适于新场景的样本。 另一种 增加方式是直接将成熟场景下的样本作为新场景中的样本。 0033 然而, 第一种方式依赖人工经验, 导致人力资源的浪费, 并且人工经验无法进行量 化评估而导致所选取的样本不适用于新场景。 第二种方式中会因为新场景和成熟场景的业 务特点不同而导致成熟场景下的样本不适用于新场景。 0034 为了解决上述问题, 本说明书实施例提供了一种对推荐模型的训练样本进行样本 域转换的方法及装置。 在该方法中, 在获取第一样本域下的第一训练样本和第二样本域下 的第二训练样本后, 使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下 的第三训练。

30、样本, 其中, 第一样本迁移转换过程是使用机器学习方法来在第一约束条件下 实现的。 通过上述方法, 将第二样本域下的训练样本迁移转换成第一样本域下的第三训练 样本, 第一约束条件使得第三训练样本可以适用于第一样本域的场景, 由此扩充了第一样 本域下的训练样本, 再利用扩充后的第一样本域下的训练样本可以训练出相应的推荐模 型。 0035 下面将结合附图来详细描述根据本说明书实施例的对推荐模型的训练样本进行 样本域转换的方法及装置。 0036 图1示出了本说明书的实施例的对推荐模型的训练样本进行样本域转换的方法的 流程图。 说明书 4/12 页 8 CN 111428783 A 8 0037 如图。

31、1所示, 在块110, 获取第一样本域下的第一训练样本和第二样本域下的第二 训练样本。 0038 在本说明书实施例中, 第一样本域和第二样本域包括有多个训练样本, 属于同一 个样本域的训练样本是针对同一类商品的。 第一训练样本包括针对第一类商品的样本, 第 二训练样本包括针对第二类商品的样本。 其中, 第一类商品和第二类商品所包括的商品不 同。 在一个示例中, 第一类商品和第二类商品可以包括相同的商品。 例如, 双十一的应用场 景对应第一类商品, 3C数码节的应用场景对应第二类商品, 因为双十一是针对全类商品, 3C 数码节仅针对3C数码产品, 因此第二类商品和第一类商品都包括有3C数码产品。。

32、 0039 在本说明书实施例中, 第一样本域下的训练样本被用来训练用于推荐第一类商品 的第一推荐模型, 第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模 型。 0040 第一样本域对应至少一个应用场景(比如第一应用场景), 第二样本域对应至少一 个应用场景(比如第二应用场景)。 第一推荐模型应用于第一应用场景中, 第二推荐模型应 用于第二应用场景。 0041 例如, 第一样本域对应的第一应用场景是 “男装节” 场景, 该场景下的第一类商品 是男装, 第一样本域下的训练样本(比如第一训练样本)都是针对男装的, 比如, 各种类型、 各种款式以及各种品牌的男装等。 第二样本域对应的第二。

33、应用场景是 “手机节” 场景, 该场 景下的第二类商品是手机, 第二样本域下的第二训练样本都是针对手机的, 比如各种品牌、 各种功能以及各种类型的手机等。 0042 在本说明书实施例中, 训练样本可以用不同维度的变量来表示, 因此, 每个训练样 本可以是由多个维度的变量组成的, 比如, 商品销量、 退货率、 价位以及未退转换率等。 第一 训练样本的变量与第二训练样本的变量存在相同的变量。 在一个示例中, 第一训练样本的 变量与第二训练样本的变量相同, 比如, 第一训练样本和第二训练样本的变量都由商品销 量、 退货率、 价位以及未退转换率组成。 每个训练样本可以表示为: (X1, X2, , X。

34、n), 其中, X1, X2, , Xn表示n个特征变量, n可以是指定的。 0043 在本说明书实施例的一个示例中, 第一样本域是与少样本场景对应的样本域, 第 二样本域是与多样本场景对应的样本域。 少样本场景对应的样本域下的样本数量较少, 甚 至不足以作为训练样本用来训练少样本场景的预测模型; 多样本场景对应的样本域下的样 本数量较多。 0044 在一个示例中, 少样本场景可以是新场景, 多样本场景可以是已经多次应用了的 成熟场景。 例如, 成熟场景是已经成熟应用了的 “双十一” 促销活动, 而新场景是还未推广应 用的另一个促销活动。 0045 通过上述示例, 多样本场景对应有较多数量的训。

35、练样本, 利用多样本场景下的训 练样本来增加少样本场景对应的样本域下的训练样本, 这样, 在需要训练针对少样本场景 下的预测模型时该少样本场景对应的样本域可以提供足够数量的训练样本。 0046 在块120, 使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样 本。 0047 在本说明书实施例中, 第一样本迁移转换过程是使用机器学习方法来在第一约束 条件下实现的, 该机器学习方法中第二训练样本是输入, 第三训练样本是输出。 说明书 5/12 页 9 CN 111428783 A 9 0048 图2示出了本说明书的实施例的第一样本迁移转换过程的一个示例的流程图。 如 图2所示, 在块12。

36、1, 将第二训练样本迁移转换为第三训练样本, 在每次转换得到第三训练样 本后, 在块123, 判断当前是否满足第一约束条件, 若满足, 则流程进行到块125, 结束第一样 本迁移转换过程。 若不满足, 则流程进行到块127, 调整机器学习模型的参数, 并流程返回至 块121, 即利用调整后的机器学习模型将第二训练样本迁移转换为第三训练样本。 0049 在块127, 参数调整是在机器学习模型的当前参数的基础上进行的, 并且使得调整 后的机器学习模型所转换得到的第三训练样本能够满足于第一约束条件, 或者更接近于满 足于第一约束条件。 在一个示例中, 机器学习模型可以是第一转换函数, 该第一转换函数。

37、可 以用于将第二训练样本迁移转换为第三训练样本。 0050 在本说明书实施例中, 第一样本迁移转换过程是一个循环过程, 循环的控制条件 是第一约束条件。 在每一次循环过程中, 可以转换得到该次对应的第三训练样本, 基于该第 三训练样本可以得到该次第一样本迁移转换的分布式距离, 即该第三训练样本与第一训练 样本之间的分布式距离, 分布式距离可以用以下公式表示: 0051 |S (X1, X2, , Xn), T(X1, X2, , Xn)| 0052 其中, S 表示第三训练样本, X1, X2, , Xn表示第三训练样本的特征变量, T表示 第一训练样本, X1, X2, , Xn表示第一训练。

38、样本的特征变量, 符号 “|” 表示分布间距离。 0053 第三训练样本和第一训练样本之间的分布式距离可以表示该第三训练样本与第 一训练样本的数据间分布差异, 分布式距离越大, 表示数据间分布差异越大, 迁移转换效果 越不好; 分布式距离越小, 表示数据间分布差异越小, 迁移转换效果越好。 当分布式距离为0 时, 表示第三训练样本和第一训练样本相同。 0054 在本说明书实施例的一个示例中, 分布式距离可以包括以下中的至少一种: 欧式 距离, KL散度(Kullback-Leibler divergence), JS散度(Jensen-Shannon divergence)以 及EM(Eart。

39、h-Mover)距离。 分布式距离除了上述四种以外还可以用其他类型信息来表征。 下 面以欧式距离为例进行说明。 0055 第一样本域下有M个第一训练样本, 每个训练样本的特征变量维度是n, 则M个第一 训练样本用矩阵形式可以表示为: 0056 0057 其中, P1表示包括有M个第一训练样本的矩阵, aji表示第j个第一训练样本中的第i 个特征变量。 0058 迁移转换得到的第三训练样本有N个, 每个训练样本的特征变量维度是n, 则N个第 三训练样本用矩阵形式可以表示为: 0059 0060 其中, P2表示包括有N个第三训练样本的矩阵, bji表示第j个第三训练样本中的第i 个特征变量。 0。

40、061 N个第三训练样本与M个第一训练样本之间的欧式距离为: 说明书 6/12 页 10 CN 111428783 A 10 0062 0063 其中, |Aj|2aj12+aji2+ajn2, |Bj|2bj12+bji2+bjn2。 P2T表示P2的 转置矩阵。 0064 在本说明书实施例中, 第一约束条件包括: 当前第一样本迁移转换的分布式距离 与上一次第一样本迁移转换的分布式距离之间的差值小于第一阈值。 其中, 第一阈值可以 是指定的。 0065 例如, 当前迁移转换是第一样本迁移转换过程中循环的第三次迁移转换过程, 则 可以计算出该第三次迁移转换的分布式距离, 再计算该第三次迁移转换。

41、的分布式距离与第 二次迁移转换的分布式距离的差值, 并判断该差值是否小于第一阈值。 0066 基于第一约束条件, 每一次迁移转换过程得到的分布式距离会比上一次得到的分 布式距离小, 相邻两次的分布式距离之间的差值也会逐渐减小, 这样, 第二训练样本迁移转 换成第三训练样本的效果越好, 迁移转换得到的第三训练样本越接近于第一样本域下的第 一训练样本。 0067 在块130, 将第三训练样本确定为第一样本域下的训练样本。 0068 在本说明书实施例中, 被确定的第三训练样本是在满足第一约束条件时迁移转换 所得到的。 例如, 在第二次迁移转换得到的第三训练样本, 且该第三训练样本满足第一约束 条件,。

42、 则该第三训练样本被确定为第一样本域下的训练样本。 0069 在本说明书实施例的一个示例中, 第三训练样本和第一训练样本是针对第一类商 品的训练样本, 可以用来训练用于推荐第一类商品的第一推荐模型。 在另一个示例中, 还可 以只用第三训练样本来训练用于推荐第一类商品的第一推荐模型。 例如, 第一推荐模型应 用于 “手机节” 的场景时, 通过训练好的第一推荐模型可以向消费者推荐手机。 0070 在本说明书实施例的一个示例中, 第一训练样本和第二训练样本是有监督训练样 本。 每个训练样本中的变量包括特征变量和标签变量, 标签变量即作为有监督训练中的标 签。 0071 有监督训练样本用于训练的模型可。

43、以是预测模型, 预测模型的输入为特征变量, 输出为标签变量对应的预测值, 该预测值与训练样本中的标签变量进行比较。 每个训练样 本可以表示为: (X1, X2, , Xn; Y), 其中, X1, X2, , Xn表示n个特征变量, Y表示标签变量。 标签 变量是可以指定的。 0072 例如, 每个训练样本由商品销量、 退货率、 价位和未退转换率组成, 其中, 商品销 量、 退货率和价位是特征变量, 未退转换率是标签变量, 这样, 由训练样本训练得到的预测 模型可以根据商品的商品销量、 退货率和价位三个特征变量来预测该商品的未退转换率。 0073 第一约束条件还可以包括: 第三训练样本的训练误。

44、差小于第二阈值, 以及第一训 练样本的预测误差小于第三阈值。 其中, 第二阈值和第三阈值都可以是指定的。 0074 第三训练样本是由第二训练样本迁移转换得到的, 第三训练样本也是有监督训练 样本。 利用第三训练样本可以训练得到第一预测模型, 该第一预测模型可以根据特征变量 说明书 7/12 页 11 CN 111428783 A 11 来预测标签变量的预测值。 例如, 第一预测模型可以用yg1(x)来表示, x表示第一预测模 型的输入, y表示第一预测模型的输出(即标签变量对应的预测值), 进一步地, 第一预测模 型还可以表示为: 标签变量g1(特征变量)。 0075 第三训练样本的训练误差是。

45、针对第一预测模型的训练误差, 可以表示为: |Y3-g1 (S (X1, X2, , Xn)|, 其中, Y3表示第三训练样本中标签变量对应的值, X1, X2, , Xn 表示第三训练样本中的特征变量, S (X1, X2, , Xn)表示第三训练样本。 0076 在利用第三训练样本训练出第一预测模型后, 可以使用第一预测模型来预测第一 训练样本的预测值。 第一训练样本的预测值可以表示为: g1(T(X1, X2, , Xn), 其中, T(X1, X2, , Xn)表示第一训练样本, X1, X2, , Xn表示第一训练样本的特征变量。 0077 第一训练样本的预测误差是第一预测模型对第一。

46、训练样本进行预测的误差, 可以 表示为: |Y1-g(T(X1, X2, , Xn)|, 其中, Y1表示第一训练样本中的特征变量对应的值。 0078 在该示例中, 满足第一约束条件需要同时满足以下三个条件: 当前迁移转换的分 布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值, 第三训练样本的训练 误差小于第二阈值, 以及第一训练样本的预测误差小于第三阈值。 0079 通过上述示例, 第一训练样本的预测误差可以反映出第一样本迁移转换过程的迁 移转换效果, 若迁移转换效果越好, 即第三训练样本越接近第一训练样本, 则利用第三训练 样本训练出的第一预测模型对第一训练样本进行预测的预测误差。

47、会越小。 因此, 将第一训 练样本的预测误差作为第一约束条件中的其中一个约束条件, 可以提高第一样本迁移转换 的迁移转换效果, 第三训练样本更接近于第一训练样本。 0080 图3示出了本说明书的另一实施例的用于对训练样本进行样本域转换的方法的流 程图。 图3中所示的实施例是上述图1示出的实施例的修改实施例。 0081 在图3中示出的实施例中, 块310、 块320以及块350的操作分别与图1中的块110、 块 120以及块130相同, 在此不再描述。 下面仅仅对不同之处进行详细描述。 0082 在块320之后, 接着, 在块330, 使用第二样本迁移转换过程来将第三训练样本迁移 转换为第四训练。

48、样本。 0083 在本说明书的实施例中, 第二样本迁移转换过程是使用机器学习方法来在第二约 束条件下实现的。 该机器学习方法中第三训练样本是输入, 第四训练样本是输出。 0084 图4示出了本说明书的实施例的第二样本迁移转换过程的一个示例的流程图。 如 图4所示, 在块331, 将第三训练样本迁移转换为第四训练样本, 在每次转换得到第四训练样 本后, 在块333, 判断当前是否满足第二约束条件, 若满足, 则流程进行到块335, 结束第二样 本迁移转换过程。 若不满足, 则流程进行到块337, 调整机器学习模型的参数, 并流程返回至 块331, 即利用调整后的机器学习模型将第三训练样本迁移转换。

49、为第四训练样本。 0085 在块337, 参数调整是在机器学习模型的当前参数的基础上进行的, 并且使得调整 后的机器学习模型所转换得到的第四训练样本能够满足于第二约束条件, 或者更接近于满 足于第二约束条件。 在一个示例中, 机器学习模型可以是第二转换函数, 该第二转换函数可 以用于将第三训练样本迁移转换为第四训练样本。 0086 在本说明书实施例的一个示例中, 可以用CYCLE-GAN模型来实现第一样本迁移转 换过程和第二样本迁移转换过程。 0087 在本说明书实施例的一个示例中, 第二约束条件可以包括: 循环次数, 或者当前迁 说明书 8/12 页 12 CN 111428783 A 12。

50、 移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值。 0088 在该示例中, 循环次数是针对第二样本迁移转换过程中第三训练样本迁移转换成 第四训练样本的次数, 该循环次数可以是指定的。 0089 在该示例中, 第七阈值可以是指定的。 第二样本迁移转换过程是一个循环过程, 循 环的控制条件是第二约束条件。 在每一次循环过程中, 每次迁移转换的分布式距离为该次 迁移转换得到的第四训练样本与第二训练样本之间的分布式距离, 可以表示为: 0090 |S (X1, X2, , Xn), S(X1, X2, , Xn)| 0091 其中, S 表示第四训练样本, X1, X2, , X。

展开阅读全文
内容关键字: 推荐 模型 训练 样本 进行 转换 方法 装置
关于本文
本文标题:对推荐模型的训练样本进行样本域转换的方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9225840.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1