数据推荐方法、装置、计算机设备以及存储介质.pdf
《数据推荐方法、装置、计算机设备以及存储介质.pdf》由会员分享,可在线阅读,更多相关《数据推荐方法、装置、计算机设备以及存储介质.pdf(37页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010885140.7 (22)申请日 2020.08.28 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 郝晓波葛凯凯刘雨丹唐琳瑶 张旭谢若冰林乐宇 (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 熊永强杜维 (51)Int.Cl. G06F 16/9535(2019.01) (54)发明名称 数据推荐方法、 装置、 计算机设备以及存储 介质 (57)摘要 本。
2、申请实施例公开了一种数据推荐方法、 装 置、 计算机设备以及存储介质, 数据推荐方法可 以应用于精准推荐, 数据推荐方法包括: 响应于 在目标领域下针对目标用户的数据推荐请求, 获 取在多个领域下与目标用户具有关联关系的业 务对象集合; 对多个领域和业务对象集合进行跨 领域交叉编码处理, 得到目标用户在目标领域下 的目标领域兴趣特征; 获取目标领域下的多个待 推荐业务对象的待推荐业务对象特征; 从多个待 推荐业务对象特征中获取与目标领域兴趣特征 匹配的目标推荐业务对象特征, 输出目标推荐业 务对象特征对应的目标推荐业务对象。 采用本申 请, 可以提高内容推荐的准确率。 权利要求书3页 说明书2。
3、1页 附图12页 CN 112035743 A 2020.12.04 CN 112035743 A 1.一种数据推荐方法, 其特征在于, 包括: 响应于在目标领域下针对目标用户的数据推荐请求, 获取在多个领域下与所述目标用 户具有关联关系的业务对象集合; 所述业务对象集合包括在每个领域下与所述目标用户具 有关联关系的业务对象, 所述多个领域包括所述目标领域; 对所述多个领域和所述业务对象集合进行编码处理, 得到所述目标用户在所述目标领 域下的目标领域兴趣特征; 获取所述目标领域下的多个待推荐业务对象的待推荐业务对象特征; 从多个待推荐业务对象特征中获取与所述目标领域兴趣特征匹配的目标推荐业务对。
4、 象特征, 输出所述目标推荐业务对象特征对应的目标推荐业务对象。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述多个领域和所述业务对象集合 进行编码处理, 得到所述目标用户在所述目标领域下的目标领域兴趣特征, 包括: 调用跨领域推荐模型对所述多个领域和所述业务对象集合进行交叉编码处理, 得到所 述目标用户的通用兴趣特征; 获取在目标领域下与所述目标用户具有关联关系的目标业务对象; 调用跨领域推荐模型对所述通用兴趣特征、 所述目标领域和所述目标业务对象进行交 叉编码处理, 得到所述目标领域兴趣特征。 3.根据权利要求2所述的方法, 其特征在于, 所述跨领域推荐模型包括领域编码器、 对 。
5、象编码器和领域对象交叉编码器; 所述调用跨领域推荐模型对所述多个领域和所述业务对象集合进行交叉编码处理, 得 到所述目标用户的通用兴趣特征, 包括: 获取每个领域的原始领域特征, 调用所述领域编码器将所有原始领域特征编码为领域 特征; 获取所述业务对象集合中每个业务对象的原始对象特征, 调用所述对象编码器将所有 原始对象特征编码为对象特征; 调用所述领域对象交叉编码器将所述领域特征和所述对象特征交叉编码为所述目标 用户的通用兴趣特征。 4.根据权利要求3所述的方法, 其特征在于, 所述领域编码器包括域内领域编码器和域 间领域转换器; 所述调用所述领域编码器将所有原始领域特征编码为领域特征, 包。
6、括: 将所有原始领域特征组合为原始领域特征序列; 调用所述域内领域编码器, 对所述原始领域特征序列进行自注意力循环编码, 得到第 一编码向量序列; 将所述第一编码向量序列进行池化处理, 得到第二编码向量; 调用所述域间领域转换器, 对所述第二编码向量进行多注意力编码, 得到所述领域特 征。 5.根据权利要求3所述的方法, 其特征在于, 所述对象编码器包括域内对象编码器; 所述调用跨领域推荐模型对所述通用兴趣特征、 所述目标领域和所述目标业务对象进 行交叉编码处理, 得到所述目标领域兴趣特征, 包括: 获取所述目标领域的目标领域特征; 权利要求书 1/3 页 2 CN 112035743 A 2。
7、 调用所述域内对象编码器将所述目标业务对象编码为目标对象特征; 将所述目标领域特征和所述目标对象特征拼接为目标领域对象特征; 调用所述领域对象交叉编码器将所述通用兴趣特征和所述目标领域对象特征交叉编 码为所述目标领域兴趣特征。 6.根据权利要求2所述的方法, 其特征在于, 所述目标业务对象的数量为多个, 多个目 标业务对象均是非实体目标业务对象, 或者多个目标业务对象包括实体目标业务对象和非 实体目标业务对象, 所述实体目标业务对象属于所述多个待推荐业务对象。 7.根据权利要求1所述的方法, 其特征在于, 所述获取在多个领域下与所述目标用户具 有关联关系的业务对象集合, 包括: 获取在每个领域。
8、下已向所述目标用户曝光的已曝光业务对象; 若任一领域下的已曝光业务对象的数量等于数量阈值, 则将所述任一领域下的已曝光 业务对象组合为所述任一领域下的单位业务对象集合; 若任一领域下的已曝光业务对象的数量小于所述数量阈值, 则获取非实体业务对象, 将所述任一领域下的已曝光业务对象和所述非实体业务对象组合为所述任一领域下的单 位业务对象集合; 将每个领域下的单位业务对象集合组合为与所述目标用户具有关联关系的业务对象 集合。 8.根据权利要求1所述的方法, 其特征在于, 所述从多个待推荐业务对象特征中获取与 所述目标领域兴趣特征匹配的目标推荐业务对象特征, 包括: 确定所述目标领域兴趣特征与每个待。
9、推荐业务对象特征之间的特征距离; 根据所述特征距离, 从所述多个待推荐业务对象特征中确定所述目标推荐业务对象特 征。 9.根据权利要求2所述的方法, 其特征在于, 还包括: 获取在每个领域下与样本用户具有关联关系的样本单位业务对象集合; 生成每个领域的随机领域特征, 以及生成多个样本单位业务对象集合中每个样本业务 对象的随机对象特征; 调用样本跨领域推荐模型将所有随机领域特征和所有随机对象特征进行跨领域交叉 编码处理, 得到所述样本用户在样本领域下的预测兴趣特征; 所述样本领域是所述多个领 域中的任一领域; 确定所述预测兴趣特征和所述样本领域的随机对象特征之间的特征相似度, 获取所述 样本领域。
10、的随机对象特征的行为标签; 根据所述行为标签和所述特征相似度确定预测误差, 基于所述预测误差训练所述样本 跨领域推荐模型, 得到所述跨领域推荐模型。 10.根据权利要求9所述的方法, 其特征在于, 所述获取在每个领域下与样本用户具有 关联关系的样本单位业务对象集合, 包括: 获取所述样本用户的样本知识图谱三元组集合, 所述样本知识图谱三元组集合包括多 个样本知识图谱三元组, 任一样本知识图谱三元组包括所述样本用户的用户标识、 多个领 域中任一领域的领域标识以及在所述任一领域下已向所述样本用户曝光的样本业务对象 的对象标识; 权利要求书 2/3 页 3 CN 112035743 A 3 从所述样。
11、本知识图谱三元组集合中确定在每个领域下与所述样本用户具有关联关系 的样本单位业务对象集合。 11.根据权利要求9所述的方法, 其特征在于, 所述基于所述预测误差训练所述样本跨 领域推荐模型, 得到所述跨领域推荐模型, 包括: 基于所述预测误差调整所述样本跨领域推荐模型、 每个领域的随机领域特征以及多个 样本单位业务对象集合中每个样本业务对象的随机对象特征; 当调整后的样本跨领域推荐模型满足模型收敛条件时, 将调整后的样本跨领域推荐模 型作为所述跨领域推荐模型, 将每个领域调整后的随机领域特征均作为原始领域特征, 将 多个样本单位业务对象集合中每个样本业务对象调整后的随机对象特征均作为原始对象 。
12、特征。 12.根据权利要求9所述的方法, 其特征在于, 所述调用样本跨领域推荐模型将所有随 机领域特征和所有随机对象特征进行跨领域交叉编码处理, 得到所述样本用户在样本领域 下的预测兴趣特征, 包括: 调用样本跨领域推荐模型将所有随机领域特征和所有随机对象特征进行交叉编码处 理, 得到所述样本用户的样本通用兴趣特征; 从所述多个领域中确定样本领域, 调用样本跨领域推荐模型将所述样本通用兴趣特 征、 所述样本领域的随机领域特征和所述样本领域的随机对象特征进行交叉编码处理, 得 到所述预测兴趣特征。 13.一种数据推荐装置, 其特征在于, 包括: 获取模块, 用于响应于在目标领域下针对目标用户的数。
13、据推荐请求, 获取在多个领域 下与所述目标用户具有关联关系的业务对象集合; 所述业务对象集合包括在每个领域下与 所述目标用户具有关联关系的业务对象, 所述多个领域包括所述目标领域; 编码模块, 用于对所述多个领域和所述业务对象集合进行编码处理, 得到所述目标用 户在所述目标领域下的目标领域兴趣特征; 所述获取模块, 还用于获取所述目标领域下的多个待推荐业务对象的待推荐业务对象 特征; 确定模块, 用于从多个待推荐业务对象特征中获取与所述目标领域兴趣特征匹配的目 标推荐业务对象特征; 输出模块, 用于输出所述目标推荐业务对象特征对应的目标推荐业务对象。 14.一种计算机设备, 其特征在于, 包括。
14、存储器和处理器, 所述存储器存储有计算机程 序, 所述计算机程序被所述处理器执行时, 使得所述处理器执行权利要求1-12中任一项所 述方法的步骤。 15.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有计算机程序, 所述 计算机程序包括程序指令, 所述程序指令被处理器执行时, 执行权利要求1-12任一项所述 的方法。 权利要求书 3/3 页 4 CN 112035743 A 4 数据推荐方法、 装置、 计算机设备以及存储介质 技术领域 0001 本申请涉及计算机技术领域, 尤其涉及一种数据推荐方法、 装置、 计算机设备以及 存储介质。 背景技术 0002 近年来, 互联网技术的日益。
15、发展和普及给用户带来了大量的信息, 满足了用户对 信息的需求。 但随着信息呈指数级增长, 使得用户难以从海量的数据中筛选出自己真正想 要的信息。 在这种情况下, 推荐系统应运而生, 推荐系统用于精准推荐, 即向用户提供精准 的推荐内容和服务。 0003 目前, 推荐系统根据最近的热点事件筛选出待推荐业务内容, 再向所有用户推送 筛选出来的待推荐业务内容。 可见, 向所有用户推荐相同的内容难以满足不同用户的个性 化推荐需求, 降低内容推荐的准确性。 发明内容 0004 本申请实施例提供一种数据推荐方法、 装置、 计算设备以及存储介质, 可以提高内 容推荐的准确率。 0005 本申请实施例一方面提。
16、供了一种数据推荐方法, 包括: 0006 响应于在目标领域下针对目标用户的数据推荐请求, 获取在多个领域下与所述目 标用户具有关联关系的业务对象集合; 所述业务对象集合包括在每个领域下与所述目标用 户具有关联关系的业务对象, 所述多个领域包括所述目标领域; 0007 对所述多个领域和所述业务对象集合进行编码处理, 得到所述目标用户在所述目 标领域下的目标领域兴趣特征; 0008 获取所述目标领域下的多个待推荐业务对象的待推荐业务对象特征; 0009 从多个待推荐业务对象特征中获取与所述目标领域兴趣特征匹配的目标推荐业 务对象特征, 输出所述目标推荐业务对象特征对应的目标推荐业务对象。 0010。
17、 本申请实施例一方面提供了一种数据推荐装置, 包括: 0011 获取模块, 用于响应于在目标领域下针对目标用户的数据推荐请求, 获取在多个 领域下与所述目标用户具有关联关系的业务对象集合; 所述业务对象集合包括在每个领域 下与所述目标用户具有关联关系的业务对象, 所述多个领域包括所述目标领域; 0012 编码模块, 用于对所述多个领域和所述业务对象集合进行编码处理, 得到所述目 标用户在所述目标领域下的目标领域兴趣特征; 0013 所述获取模块, 还用于获取所述目标领域下的多个待推荐业务对象的待推荐业务 对象特征; 0014 确定模块, 用于从多个待推荐业务对象特征中获取与所述目标领域兴趣特征。
18、匹配 的目标推荐业务对象特征; 0015 输出模块, 用于输出所述目标推荐业务对象特征对应的目标推荐业务对象。 说明书 1/21 页 5 CN 112035743 A 5 0016 本申请实施例一方面提供了一种计算机设备, 包括存储器和处理器, 存储器存储 有计算机程序, 计算机程序被处理器执行时, 使得处理器执行上述各实施例中的方法。 0017 本申请实施例一方面提供了一种计算机存储介质, 计算机存储介质存储有计算机 程序, 计算机程序包括程序指令, 程序指令当被处理器执行时, 执行上述各实施例中的方 法。 0018 本申请实施例一方面提供了一种计算机程序产品或计算机程序, 计算机程序产品 。
19、或计算机程序包括计算机指令, 计算机指令存储在计算机可读存储介质中, 计算机指令被 计算机设备的处理器执行时, 执行上述各实施例中的方法。 0019 本申请根据用户行为挖掘用户个性化偏好, 进而确定用户的推荐业务对象, 可以 根据不同的用户行为确定不同的推荐业务对象, 实现个性化内容推荐, 且依据用户行为确 定推荐业务对象, 相比根据热点事件确定推荐业务对象, 从用户需求本质出发所确定的推 荐内容即是用户真正想要的内容, 可以提高内容推荐的准确性; 再有, 通过不同领域下的用 户行为互相补充, 以确定用户在目标领域下的兴趣特征, 基于目标领域下的兴趣特征为用 户推荐目标领域下的业务对象更具有针。
20、对性, 可以进一步提高数据推荐的准确率。 附图说明 0020 为了更清楚地说明本申请实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 申请的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。 0021 图1是本申请实施例提供的一种数据推荐的系统架构图; 0022 图2a-图2d是本申请实施例提供的一种数据推荐的场景示意图; 0023 图3是本申请实施例提供的一种数据推荐的流程示意图; 0024 图4a是本申请实施例提供的一种跨领域推荐模型的示意图; 。
21、0025 图4b是本申请实施例提供的一种数据推荐的整体框架图; 0026 图5a-图5b是本申请实施例提供的一种目标推荐业务对象的示意图; 0027 图6是本申请实施例提供的一种数据推荐的流程示意图; 0028 图7是本申请实施例提供的一种样本跨领域推荐模型的示意图; 0029 图8是本申请实施例提供的一种数据推荐装置的结构示意图; 0030 图9是本发明实施例提供的一种计算机设备的结构示意图。 具体实施方式 0031 下面将结合本申请实施例中的附图, 对本申请实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本申请一部分实施例, 而不是全部的实施例。 基于 本申请中的。
22、实施例, 本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例, 都属于本申请保护的范围。 0032 云技术(Cloud technology)是基于云计算商业模式应用的网络技术、 信息技术、 整合技术、 管理平台技术、 应用技术等的总称, 可以组成资源池, 按需所用, 灵活便利。 目前, 技术网络系统的后台服务需要大量的计算、 存储资源, 如视频网站、 图片类网站和更多的门 说明书 2/21 页 6 CN 112035743 A 6 户网站。 伴随着互联网行业的高度发展和应用, 将来每个物品都有可能存在自己的识别标 志, 都需要传输到后台系统进行逻辑处理, 不同程度级别的数据。
23、将会分开处理, 各类行业数 据皆需要强大的系统后盾支撑, 只能通过云计算来实现。 0033 目前, 云技术主要分为云基础技术类以及云应用类; 云基础技术类可以进一步细 分为: 云计算、 云储存、 数据库以及大数据等; 云应用类可以进一步细分为: 医疗云、 云物联、 云安全、 云呼叫、 私有云、 公有云、 混合云、 云游戏、 云教育、 云会议、 云社交以及人工智能云 服务等。 0034 从基础技术角度来说, 本申请的数据推荐方法涉及云技术下属的云计算; 从应用 角度来说, 本申请的数据推荐方法涉及云技术下属的人工智能云服务: 0035 云计算(cloud computing)是一种计算模式, 它。
24、将计算任务分布在大量计算机构 成的资源池上, 使各种应用系统能够根据需要获取计算力、 存储空间和信息服务。 提供资源 的网络被称为 “云” 。“云” 中的资源在使用者看来是可以无限扩展的, 并且可以随时获取, 按 需使用, 随时扩展, 按使用付费。 0036 在本申请中, 对多个领域和业务对象集合进行跨领域交叉编码处理涉及大规模计 算, 需要巨大的算力和存储空间, 因此在本申请中, 可以由终端设备通过云计算技术获取足 够算力和存储空间, 进而执行本申请中所涉及的提取目标用户在目标领域下的目标领域兴 趣特征, 以及提取多个待推荐业务对象的待推荐业务对象特征。 0037 所谓人工智能云服务, 一般。
25、也被称作是AIaaS(AI as a Service, 中文为 “AI即服 务” )。 这是目前主流的一种人工智能平台的服务方式, 具体来说AIaaS平台会把几类常见的 AI服务进行拆分, 并在云端提供独立或者打包的服务。 这种服务模式类似于开了一个AI主 题商城: 所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种 人工智能服务, 部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运 维自已专属的云人工智能服务。 0038 可以将本申请涉及的数据推荐方法封装为一个人工智能服务, 且仅对外暴露一个 接口。 当在某一个业务场景下需要使用本申请所涉及的业务对象。
26、推荐功能时, 通过调用该 接口, 即可完成对业务对象的推荐。 0039 人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控 制的机器模拟、 延伸和扩展人的智能, 感知环境、 获取知识并使用知识获得最佳结果的理 论、 方法、 技术及应用系统。 换句话说, 人工智能是计算机科学的一个综合技术, 它企图了解 智能的实质, 并生产出一种新的能以人类智能相似的方式做出反应的智能机器。 人工智能 也就是研究各种智能机器的设计原理与实现方法, 使机器具有感知、 推理与决策的功能。 0040 人工智能技术是一门综合学科, 涉及领域广泛, 既有硬件层面的技术也有软。
27、件层 面的技术。 人工智能基础技术一般包括如传感器、 专用人工智能芯片、 云计算、 分布式存储、 大数据处理技术、 操作/交互系统、 机电一体化等技术。 人工智能软件技术主要包括计算机 视觉技术、 语音处理技术、 自然语言处理技术以及机器学习/深度学习等几大方向。 0041 本申请实施例提供的方案属于人工智能领域下属的机器学习/深度学习。 0042 机器学习(Machine Learning,ML)是一门多领域交叉学科, 涉及概率论、 统计学、 逼近论、 凸分析、 算法复杂度理论等多门学科。 专门研究计算机怎样模拟或实现人类的学习 行为, 以获取新的知识或技能, 重新组织已有的知识结构使之不断。
28、改善自身的性能。 机器学 说明书 3/21 页 7 CN 112035743 A 7 习是人工智能的核心, 是使计算机具有智能的根本途径, 其应用遍及人工智能的各个领域。 机器学习和深度学习通常包括人工神经网络、 置信网络、 强化学习、 迁移学习、 归纳学习、 式 教学习等技术。 0043 在本申请中, 主要涉及通过调用一个推荐模型以及基于用户在多个领域的行为数 据确定用户在特定目标领域的兴趣特征, 该兴趣特征可以用于确定用户在目标领域下待推 荐的业务对象。 0044 本申请可以应用于如下场景: 当需要向目标用户推荐目标领域下的产品时, 获取 目标用户在多个领域的行为数据, 根据多个领域的行为。
29、数据确定目标用户在目标领域的兴 趣特征, 将兴趣特征和目标领域的多个待推荐产品的产品特征进行匹配, 输出匹配的产品 特征对应的待推荐产品。 后续, 可以向用户推送匹配的待推荐产品, 以实现精准营销, 提高 推荐准确率。 0045 请参见图1, 是本申请实施例提供的一种数据推荐的系统架构图。 本申请涉及服务 器10d以及终端设备集群, 终端设备集群可以包括: 终端设备10a、 终端设备10b、 .、 终端设 备10c等。 0046 以终端设备10a为例, 终端设备10a接收到关于用户在目标领域下的数据推荐请求 时, 将该数据推荐请求发送至服务器10d。 服务器10d获取在多个领域下与目标用户具有。
30、关 联关系的业务对象集合, 服务器10d对多个领域和该业务对象集合进行跨领域交叉编码处 理, 得到目标用户在目标领域下的目标领域兴趣特征, 获取目标领域下多个待推荐业务对 象的待推荐业务对象特征, 从多个待推荐业务对象特征中确定与目标领域兴趣特征匹配的 目标推荐业务对象特征, 输出目标推荐业务对象特征对应的目标推荐业务对象。 服务器10d 可以将目标推荐业务对象发送至终端设备10a, 终端设备10a在页面上展示目标推荐业务对 象, 以向目标用户精准推荐业务对象。 0047 当然, 确定目标用户的目标领域兴趣特征和确定目标推荐业务对象也可以由终端 设备10a来执行。 0048 图1所示的服务器1。
31、0d可以是独立的物理服务器, 也可以是多个物理服务器构成的 服务器集群或者分布式系统, 还可以是提供云服务、 云数据库、 云计算、 云函数、 云存储、 网 络服务、 云通信、 中间件服务、 域名服务、 安全服务、 CDN(Content Delivery Network, 内容 分发网络)、 以及大数据和人工智能平台等基础云计算服务的云服务器。 0049 图1所示的终端设备10a、 终端设备10b、 终端设备10c等可以是手机、 平板电脑、 笔 记本电脑、 掌上电脑、 移动互联网设备(MID, mobile internet device)、 可穿戴设备等智能 设备。 终端设备集群与服务器10。
32、d可以通过有线或无线通信方式进行直接或间接地连接, 本 申请在此不做限制。 0050 下述以服务器10d如何确定目标用户的目标推荐文本为例进行详细说明: 0051 请参见图2a-图2d, 其是本申请实施例提供的一种数据推荐的场景示意图。 如图2a 所示, 当服务器10d接收到目标用户在文本领域的数据推荐请求时, 服务器10d获取在多个 领域与目标用户具有关联关系的业务对象, 其中多个领域包括文本领域, 假设多个领域分 别是文本领域, 视频领域和购物领域, 与目标用户具有关联关系的业务对象是指向目标用 户曝光过/目标用户点击过的业务对象。 服务器10d获取文本领域中与目标用户具有关联关 系文本集。
33、合20a, 如图2a所示文本集合20a为空, 此时说明目标用户还未阅览过任何文本。 服 说明书 4/21 页 8 CN 112035743 A 8 务器10d获取视频领域中与目标用户具有关联关系的视频集合20b, 视频集合20b包括视频 1、 视频2和视频3, 说明目标用户曾经阅览过/点击过视频1, 视频2和视频3。 服务器10d获取 购物领域中与目标用户具有关联关系的商品集合20c, 商品集合20c包括商品1、 商品2和商 品3, 说明目标用户曾经阅览过/点击过/购买过商品1, 商品2和商品3。 0052 如图2b所示, 服务器10d获取文本领域对应的文本领域特征, 视频领域对应的视频 领域。
34、特征和购物领域对应的购物领域特征, 将这3个领域特征输入第一编码器Encoder, 第 一编码器将这3个领域特征编码为领域特征向量, 再将该领域特征向量输入第二编码器 Transformer, 第二编码器将领域特征向量编码为特征向量20d。 0053 服务器10d获取空文本对应的文本特征, 空文本对应的文本特征可以是全0向量, 或者全1向量。 将这3个文本特征输入第一编码器Encoder, 第一编码器将这3个文本特征编 码为文本特征向量。 0054 服务器10d获取视频1对应的视频特征, 视频2对应的视频特征, 视频3对应的视频 特征。 将这3个视频特征输入第一编码器Encoder, 第一编码。
35、器将这3个视频特征编码为视频 特征向量。 0055 服务器10d获取商品1对应的商品特征, 商品2对应的商品特征, 商品3对应的商品 特征。 将这3个商品特征输入第一编码器Encoder, 第一编码器将这3个商品特征编码为商品 特征向量。 0056 服务器10d将前述文本特征向量、 视频特征向量和商品特征向量输入第二编码器 Transformer, 第二编码器将文本特征向量、 视频特征向量和商品特征向量编码为特征向量 20e。 0057 服务器10d再将特征向量20d和特征向量20e交叉卷积为特征向量20f, 其中特征向 量20f也表示目标用户的通用兴趣特征。 0058 由于目标领域是文本领域。
36、, 还需要引入目标领域的知识信息, 当作领域偏置, 用于 转换兴趣空间, 用于学习目标用户在文本领域的文本领域兴趣向量。 具体过程为: 服务器 10d再将第一编码器Encoder输出的文本特征向量以及文本领域对应的文本领域特征拼接 为特征向量20g, 将特征向量20f和特征向量20g交叉卷积为特征向量20h, 其中特征向量20h 也表示目标用户在文本领域的文本领域兴趣特征。 0059 至此, 服务器10d就确定了目标用户在文本领域的文本领域兴趣特征20h。 该文本 领域兴趣特征20h可以用于预测目标用户在文本领域的偏好。 0060 确定了目标用户在文本领域的文本领域兴趣特征后, 可以进行预测。。
37、 如图2c所示, 服务器10d获取5个待推荐文本的文本特征, 其中这5个文本特征是在训练第一编码器 Encoder和第二编码器Transformer时确定的。 服务器10a计算文本领域兴趣特征20h和每个 文本特征之间的特征距离, 将特征距离最小的2个文本特征对应的文本作为推荐文本, 假设 5个文本特征中, 文本1的文本特征和文本3的文本特征是与文本领域兴趣特征20h最接近的 文本特征。 0061 服务器将文本1和文本3下发至终端设备, 终端设备将文本1的摘要、 文本3的摘要、 文本1的封面图像、 文本3的封面图像、 文本1的标题、 文本3的标题以及视频封面(视频封面 是其余服务器根据其余的推。
38、荐请求下发下来的)组合为推荐页面20j, 用户可以在推荐页面 20j中阅览文本1和文本3的部分信息, 用户还可以点击文本或者视频, 以及详细阅览文本内 说明书 5/21 页 9 CN 112035743 A 9 容或者观看视频内容。 0062 其中, 获取在多个领域(如上述实施例中的文本领域, 视频领域和购物领域)下与 目标用户具有关联关系的业务对象集合(如上述实施例中的文本集合20a、 视频集合20b以 及商品集合20c), 获取目标领域兴趣特征(如上述实施例中的文本领域兴趣特征20h)以及 多个待推荐业务对象特征(如上述实施例中的5个文本的文本特征), 确定目标推荐业务对 象(如上述实施例。
39、中的文本1和文本3)的具体过程可以参见下述图3-图7对应的实施例。 0063 请参见图3, 是本申请实施例提供的一种数据推荐的流程示意图, 下述实施例以服 务器为执行主体描述如何确定目标用户的目标推荐业务对象, 数据推荐方法可以包括如下 步骤: 0064 步骤S101, 响应于在目标领域下针对目标用户的数据推荐请求, 获取在多个领域 下与所述目标用户具有关联关系的业务对象集合。 0065 具体的, 服务器(如上述图2a-图2d对应实施例中的服务器10d)响应于在目标领域 下针对目标用户的数据推荐请求, 获取在多个领域下与目标用户具有关联关系的业务对象 集合(如上述图2a-图2d对应实施例中的文。
40、本集合20a、 视频集合20b以及商品集合20c)。 0066 通俗来说, 数据推荐请求即是请求推荐目标用户在目标领域下的数据, 例如, 目标 领域是文本领域, 那么数据推荐请求就是请求向目标用户推荐文本; 目标领域是购物领域, 那么数据推荐请求就是请求向目标用户推荐商品。 0067 其中, 目标领域是多个领域中的任一领域, 与目标用户具有关联关系的业务对象 是指业务对象向用户曝光过(或者说用户阅览过这些业务对象)或者业务对象是非实体业 务对象(非实体业务对象为空, 可以用特殊字符UNK表示)。 每个领域下与目标用户具有关联 的业务对象的数量相同, 且都等于数量阈值, 业务对象可以是空(或者说。
41、业务对象可以是非 实体业务对象)。 0068 多个领域包括以下至少两种: 文本领域、 视频领域、 游戏领域、 嵌入式应用程序领 域(即小程序领域)、 购物领域等, 其中文本领域又可以细分为: 短文本领域(例如, 新闻, 公 众号文章)和长文本领域(例如, 小说), 视频领域又可以细分为: 短视频领域(例如, 1分钟以 内的短视频)和长视频领域(例如, 电影, 电视剧)。 0069 举例来说, 目标用户曾经阅览过文本1和文本2, 阅览过视频1, 若多个领域包括文 本领域和视频领域, 且每个领域下与目标用户具有关联关系的业务对象的数量为3, 那么目 标业务对象集合可以为: 文本1, 文本2, 空(。
42、UNK); 视频1, 空(UNK), 空(UNK), 此时业务对象 “文本1” 、 业务对象 “文本2” 以及业务对象 “视频1” 就是实体业务对象, 业务对象 “空(UNK)” 就是非实体业务对象。 0070 可以知道, 若在目标领域下与目标用户具有关联关系的业务对象均是空(即均是 非实体业务对象), 那么此时的推荐请求可以认为是冷启动推荐, 即目标用户在目标领域下 没有任何行为数据, 需要基于目标用户在其他领域的行为数据为目标用户推荐目标领域下 的业务对象。 0071 业务对象集合属于待推荐业务对象集合, 待推荐业务对象集合包括多个领域下的 多个待推荐业务对象, 待推荐业务对象集合是训练跨。
43、领域推荐模型时确定的。 0072 举例来说, 待推荐业务对象集合包括文本领域下的文本1、 文本2和文本3以及视频 领域下的视频1、 视频2和视频3, 若目标用户曾经阅览过文本1、 文本4和视频4, 那么与目标 说明书 6/21 页 10 CN 112035743 A 10 用户具有关联关系的业务对象包括文本领域下的文本1、 空、 空, 以及视频领域下的空、 空、 空。 0073 获取在多个领域下与目标用户具有关联关系的业务对象集合的具体过程如下: 获 取在每个领域下已向目标用户曝光过的业务对象(称为已曝光业务对象, 已曝光业务对象 也属于待推荐业务对象集合)。 对任一领域来说, 若该领域下已曝。
44、光业务对象的数量等于数 量阈值(该数量阈值即是跨领域推荐模型的输入数量阈值), 则将已曝光业务对象组合为该 领域下的单位业务对象集合。 若该领域下已曝光业务对象的数量小于数量阈值, 则将已曝 光业务对象和非实体业务对象组合为该领域下的单位业务对象集合。 每个领域下的单位业 务对象集合包含的业务对象的数量都等于数量阈值, 将每个领域下的单位业务对象集合组 合为与目标用户具有关联关系的业务对象集合。 0074 其中, 获取已曝光业务对象可以是通过目标用户的知识图谱三元组确定的, 目标 用户的知识图谱三元组包括目标用户的用户标识, 目标用户涉及的领域的领域标识(目标 用户涉及的领域属于多个领域, 且。
45、目标用户涉及的领域即是已向目标用户曝光的业务对象 所属的领域), 以及在目标用户涉及的领域下已向目标用户曝光的业务对象。 因此知识图谱 三元组可以表示为(用户, 领域, 业务对象)。 0075 步骤S102, 对所述多个领域和所述业务对象集合进行编码处理, 得到所述目标用 户在所述目标领域下的目标领域兴趣特征。 0076 具体的, 调用训练好的跨领域推荐模型对多个领域和目标用户的业务对象集合进 行交叉编码处理, 得到目标用户的通用兴趣特征(如上述图2a-图2d对应实施例中的特征向 量20f)。 其中, 通用兴趣特征是一个一维向量。 0077 确定了通用兴趣特征后, 还需要引入目标领域知识信息,。
46、 当作领域偏置, 转换用户 兴趣空间, 用于学习目标用户在目标领域下的目标领域兴趣特征(如上述图2a-图2d对应实 施例中的文本领域兴趣特征20h), 后续可以基于目标领域兴趣特征对目标用户在目标领域 下可能喜欢的业务对象进行预测。 确定目标领域兴趣特征的过程如下: 0078 服务器从业务对象集合中获取目标领域下与目标用户具有关联关系的业务对象 (称为目标业务对象, 如上述图2a-图2d对应实施例中的文本集合20a包含的3个空文本)。 0079 调用跨领域推荐模型对通用兴趣特征、 目标领域以及目标业务对象进行交叉编码 处理, 得到目标用户在目标领域下的目标领域兴趣特征, 其中目标领域兴趣特征也。
47、是一个 一维向量。 0080 下面对跨领域推荐模型如何将多个领域和业务对象集合交叉编码为通用兴趣特 征进行详细说明: 0081 跨领域推荐模型包括领域编码器、 对象编码器以及领域对象交叉编码器, 其中, 领 域编码器是用于对多个领域进行编码, 对象编码器是用于对业务对象集合进行编码, 领域 对象交叉编码器是用于将多个领域编码后的向量和业务对象集合编码后的向量再编码为 目标用户的通用兴趣特征。 领域编码器是Encoder+Transformer, Encoder是attention机制 的RNN结构, Transformer包括n个编码器(不包含解码器), 将领域编码器中的Encoder称为 域。
48、内领域编码器, 将领域编码器中的Transformer称为域间领域转换器。 服务器获取每个领 域的原始领域特征(每个领域的原始领域特征是训练跨领域推荐模型时所确定的), 假设领 域数量为k, 每个原始领域特征的维度是n1, 那个k个原始领域特征可以是表示为kn1, 将k 说明书 7/21 页 11 CN 112035743 A 11 个原始领域特征kn1作为原始领域特征序列输入领域编码器中的Encoder, 领域编码器中 的Encoder对k个原始领域特征kn1进行自注意循环编码处理后, 输出k个第一编码向量, 每个第一编码向量的维度可以是n2。 k个第一编码向量可以组合为矩阵kn2(该矩阵也。
49、可 以称为第一编码向量序列), 对该矩阵进行平均池化, 得到维度为k1的第二编码向量。 再 将第二编码向量k1输入领域编码器中的Transformer, 领域编码器中的Transformer对第 二编码向量k1进行多注意力编码处理后, 输出维度为k1的领域特征, 其中, n1可以等于 512, n2可以等于8, Transformer的输出数据维度和输入数据维度相同。 通过多个领域交叉 学习, 可以表达出稠密的领域特征, 解决领域特征稀疏问题。 其中, 平均池化是指将一行(或 者一列)的数值的平均值作为这一行(或者这一列)特征表达。 0082 其中, 平均池化可以用下述公式(1)表示: 008。
50、3 fiAverage_pooling(Xi) (1) 0084 其中, Xi表示特征输入。 0085 对象编码器包括多个域内对象编码器(Encoder)和一个域间对象转换器 (Transformer), 域内对象编码器的数量与领域数量相同, 每个域内对象编码器都用于对同 一领域下的业务对象(也即是单位业务对象集合)进行编码, 域间对象转换器用于对多个域 内对象编码器输出的多个编码向量再编码。 业务对象集合包括多个单位业务对象集合, 每 个单位业务对象集合对应一个领域, 每个域内对象编码器(Encoder)是attention机制的 RNN结构, 域间对象转换器(Transformer)包括n。
- 内容关键字: 数据 推荐 方法 装置 计算机 设备 以及 存储 介质
电子债权凭证数据信息安全存储方法.pdf
玄武岩管道弯曲性能检测装置及方法.pdf
板仓感应装置.pdf
软土地基用防渗塑钢板桩.pdf
瓶盖及灌装产品.pdf
汽车仪表饰条总成.pdf
基于光伏顶棚的不停车充电车道.pdf
具有泄漏气体回收功能的甲醛储罐.pdf
自动开蛋机.pdf
高稳定性管道焊接机器人.pdf
陶瓷纤维保温结构.pdf
快速对接的管道连接机构.pdf
自动化磁体振动研磨清洗生产连接线.pdf
土地测绘用具有定位结构的测绘支架.pdf
用于监测土壤滑坡的监测球及系统.pdf
自清洗型乳化液过滤器.pdf
按摩垫滚轮导电结构.pdf
铁塔钢材表面防腐涂层的喷涂装置.pdf
高容量低成本层状钠离子电池正极材料烧结用匣钵.pdf
集成模块化电源.pdf
精度可控制调节输出装置.pdf
输液杆的集中供电结构.pdf
桥式起重机吊钩.pdf
活塞止转销自动定位安装装置.pdf
超疏水表面减阻测量装置.pdf
电池链接护罩.pdf
城市地下空间拖曳式时频联合电磁探测系统及方法.pdf
基于区块链的电动自行车智能计时方法及系统.pdf
高精密减速器的磨损检测装置.pdf
T型气密检测装置.pdf
环形钢桁架地面散件拼装高空胎架组装施工工艺.pdf
杂化改性高吸油树脂及其制备方法与应用.pdf
一种二豆酊.pdf
一种治疗口臭的中药组合物.pdf
医院专用护理床.pdf
一种带有拉钩的普外科医疗专用床.pdf
一种烧伤患儿用救护床.pdf
新型胸外科术后恢复理疗床.pdf
智能医药篮子.pdf
一种治疗颈椎病的中药配方.pdf
一种治疗新生儿溶血病的中药配方.pdf
一种方便糖尿病人检查消除下肢浮肿多功能电动推车.pdf
一种具有体重测量功能的电动轮椅车.pdf
一种治疗呕吐的中药配方.pdf
一种治疗慢性腹泻的脐灸中药组合物及其制备方法和应用.pdf
一种总皂苷成分的中药提取物及其制备方法.pdf
一种治疗百日咳的中药配方.pdf
一种治疗饮食积滞型消化不良的中药配方.pdf
一种治疗禽流感的中药配方.pdf
一种黄耆当归汤的中药配方.pdf
回族中药虫草血癌康口服液及其制备方法.pdf