用户画像生成方法、装置、设备及存储介质.pdf

上传人:xia****o6 文档编号:10212398 上传时间:2021-06-11 格式:PDF 页数:18 大小:804.69KB
收藏 版权申诉 举报 下载
用户画像生成方法、装置、设备及存储介质.pdf_第1页
第1页 / 共18页
用户画像生成方法、装置、设备及存储介质.pdf_第2页
第2页 / 共18页
用户画像生成方法、装置、设备及存储介质.pdf_第3页
第3页 / 共18页
文档描述:

《用户画像生成方法、装置、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《用户画像生成方法、装置、设备及存储介质.pdf(18页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010885050.8 (22)申请日 2020.08.28 (71)申请人 康键信息技术 (深圳) 有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书有限公司) (72)发明人 茅旭峰 (74)专利代理机构 北京市京大律师事务所 11321 代理人 姚维 (51)Int.Cl. G06F 16/9535(2019.01) G06Q 30/02(2012.01) G06Q 30/06(2012.01) G06N 2。

2、0/00(2019.01) (54)发明名称 用户画像生成方法、 装置、 设备及存储介质 (57)摘要 本发明涉及大数据技术领域, 公开了一种用 户画像生成方法、 装置、 设备及存储介质, 用于提 高用户行为画像的准确性。 用户画像生成方法包 括: 从预设应用服务中实时获取用户行为数据和 用户标识数据, 用户行为数据包括用户操作行为 数据和用户浏览行为数据; 通过已训练的意图识 别模型对用户操作行为数据和用户浏览行为数 据进行分析处理, 得到用户意图标签数据; 按照 用户意图标签数据查询预设标签规则表, 得到对 应的标签更新规则; 采用用户标识数据获取初始 用户画像, 并利用对应的标签更新规则。

3、将用户意 图标签数据更新至初始用户画像中, 得到目标用 户画像。 此外, 本发明还涉及区块链技术, 目标用 户画像可存储于区块链节点中。 权利要求书2页 说明书11页 附图4页 CN 112035742 A 2020.12.04 CN 112035742 A 1.一种用户画像生成方法, 其特征在于, 所述用户画像生成方法包括: 从预设应用服务中实时获取用户行为数据和用户标识数据, 所述用户行为数据包括用 户操作行为数据和用户浏览行为数据; 通过已训练的意图识别模型对所述用户操作行为数据和所述用户浏览行为数据进行 分析处理, 得到用户意图标签数据; 按照所述用户意图标签数据查询预设标签规则表, 。

4、得到对应的标签更新规则, 所述对 应的标签更新规则用于指示添加标签和/或删除标签; 采用所述用户标识数据获取初始用户画像, 并利用所述对应的标签更新规则将用户意 图标签数据更新至所述初始用户画像中, 得到目标用户画像。 2.根据权利要求1所述的用户画像生成方法, 其特征在于, 所述从预设应用服务中实时 获取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为数据和用户浏览 行为数据, 包括: 通过预设埋点方式从预设应用服务中采集用户行为数据和用户标识数据, 所述用户行 为数据包括用户操作行为数据和用户浏览行为数据; 将所述用户行为数据和所述用户标识数据组装成待处理消息, 并通过预设消。

5、息中间件 将所述待处理消息存储至预设数据库中。 3.根据权利要求2所述的用户画像生成方法, 其特征在于, 所述通过已训练的意图识别 模型对所述用户操作行为数据和所述用户浏览行为数据进行分析处理, 得到用户意图标签 数据, 包括: 从所述预设数据库中获取所述用户操作行为数据和所述用户浏览行为数据; 将所述用户操作行为数据和所述用户浏览行为数据输入至已训练的意图识别模型中, 并通过所述已训练的意图识别模型提取特征, 得到用户操作特征和用户浏览特征; 对所述用户操作特征和所述用户浏览特征依次进行语义相似度计算与意图识别处理, 得到初始意图标签数据和对应的意图标签置信度值; 当所述对应的意图标签置信度。

6、值大于或等于预设意图阈值时, 确定所述初始意图标签 数据为用户意图标签数据。 4.根据权利要求1所述的用户画像生成方法, 其特征在于, 所述按照所述用户意图标签 数据查询预设标签规则表, 得到对应的标签更新规则, 所述对应的标签更新规则用于指示 添加标签和/或删除标签, 包括: 采用结构化查询语言语法规则、 所述用户意图标签数据和预设标签规则表生成第一查 询语句; 执行所述第一查询语句, 得到查询结果; 当所述查询结果不为空值时, 从所述查询结果中读取对应的标签更新规则, 所述对应 的标签更新规则用于指示添加标签和/或删除标签。 5.根据权利要求4所述的用户画像生成方法, 其特征在于, 所述采。

7、用所述用户标识数据 获取初始用户画像, 并利用所述对应的标签更新规则将用户意图标签数据更新至所述初始 用户画像中, 得到目标用户画像, 包括: 采用所述结构化查询语言语法规则、 所述用户标识数据和预设画像数据库生成第二查 询语句; 权利要求书 1/2 页 2 CN 112035742 A 2 执行所述第二查询语句, 得到初始用户画像; 判断所述初始用户画像中是否存在所述用户意图标签数据; 当所述初始用户画像中不存在所述用户意图标签数据时, 按照所述对应的标签更新规 则对所述用户意图标签数据与所述初始用户画像进行标签数据融合, 得到目标用户画像。 6.根据权利要求1-5中任意一项所述的用户画像生。

8、成方法, 其特征在于, 在所述从预设 应用服务中实时获取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为 数据和用户浏览行为数据之前, 所述用户画像生成方法还包括: 接收导入用户标签数据请求, 解析所述导入用户标签数据请求, 得到离线用户行为标 签数据集和待导入用户标识数据; 按照所述待导入用户标识数据将所述离线用户行为标签数据集导入至预设画像数据 库中, 得到初始用户画像。 7.根据权利要求1-5中任意一项所述的用户画像生成方法, 其特征在于, 在所述采用所 述用户标识数据获取初始用户画像, 并利用所述对应的标签更新规则将用户意图标签数据 更新至所述初始用户画像中, 得到目标用。

9、户画像之后, 所述用户画像生成方法还包括: 从预设数据库中获取待推荐对象信息, 对所述目标用户画像与所述待推荐对象信息进 行特征匹配, 得到匹配结果, 所述待推荐对象信息用于指示按照用户健康状况信息或者疾 病预防信息设置的属性特征; 按照所述匹配结果对目标用户个性化推荐健康饮食信息或者药品信息。 8.一种用户画像生成装置, 其特征在于, 所述用户画像生成装置包括: 获取模块, 用于从预设应用服务中实时获取用户行为数据和用户标识数据, 所述用户 行为数据包括用户操作行为数据和用户浏览行为数据; 分析模块, 用于通过已训练的意图识别模型对所述用户操作行为数据和所述用户浏览 行为数据进行分析处理, 。

10、得到用户意图标签数据; 查询模块, 用于按照所述用户意图标签数据查询预设标签规则表, 得到对应的标签更 新规则, 所述对应的标签更新规则用于指示添加标签和/或删除标签; 更新模块, 用于采用所述用户标识数据获取初始用户画像, 并利用所述对应的标签更 新规则将用户意图标签数据更新至所述初始用户画像中, 得到目标用户画像。 9.一种用户画像生成设备, 其特征在于, 所述用户画像生成设备包括: 存储器和至少一 个处理器, 所述存储器中存储有指令; 所述至少一个处理器调用所述存储器中的所述指令, 以使得所述用户画像生成设备执 行如权利要求1-7中任意一项所述的用户画像生成方法。 10.一种计算机可读存。

11、储介质, 其上存储有指令, 其特征在于, 所述指令被处理器执行 时实现如权利要求1-7中任意一项所述的用户画像生成方法。 权利要求书 2/2 页 3 CN 112035742 A 3 用户画像生成方法、 装置、 设备及存储介质 技术领域 0001 本发明涉及大数据技术的用户行为画像领域, 尤其涉及一种用户画像生成方法、 装置、 设备及存储介质。 背景技术 0002 互联网领域的页面呈现、 数据引流、 广告展示、 内容推荐都依赖于用户画像技术。 根据用户的访问行为和动作轨迹, 画像系统为用户生成画像标签。 上层的业务系统、 广告或 者推荐系统, 根据用户画像, 更精准的向用户展示其可能感兴趣的信。

12、息, 引导用户沉浸式浏 览、 访问, 或者发生购物行为, 或者推送广告商的广告, 产生后续经济效益。 0003 目前用户画像的生成, 一般基于离线大数据的处理。 用户行为通过行为日志上报 到数据仓库中, 数据仓库每天定时统计并分析当天的日志数据, 得到新的用户画像数据, 进 一步同步到实时画像服务系统。 整个用户画像生成过程可能涉及太字节TB级别的数据, 包 括数据存储、 计算和传输, 均需要一定的处理时长, 例如, 在1天以后确定用户画像, 为此时 用户可能不再使用对应的业务应用, 精准的画像数据也无法为业务提供有效服务。 另一方 面, 相对于存量数据, 每天的用户行为数据, 从量级上小很多。

13、, 每天运行全量数据以及批量 更新, 也会造成计算和存储资源的浪费。 所以离线批量生成用户画像的方案, 存在资源利用 率低和实时性差的问题。 发明内容 0004 本发明的主要目的在于解决现有的离线批量生成用户画像的方案, 存在资源利用 率低和实时性差的问题。 0005 为实现上述目的, 本发明第一方面提供了一种用户画像生成方法, 包括: 从预设应 用服务中实时获取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为数 据和用户浏览行为数据; 通过已训练的意图识别模型对所述用户操作行为数据和所述用户 浏览行为数据进行分析处理, 得到用户意图标签数据; 按照所述用户意图标签数据查询预 设。

14、标签规则表, 得到对应的标签更新规则, 所述对应的标签更新规则用于指示添加标签和/ 或删除标签; 采用所述用户标识数据获取初始用户画像, 并利用所述对应的标签更新规则 将用户意图标签数据更新至所述初始用户画像中, 得到目标用户画像。 0006 可选的, 在本发明第一方面的第一种实现方式中, 所述从预设应用服务中实时获 取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为数据和用户浏览行 为数据, 包括: 通过预设埋点方式从预设应用服务中采集用户行为数据和用户标识数据, 所 述用户行为数据包括用户操作行为数据和用户浏览行为数据; 将所述用户行为数据和所述 用户标识数据组装成待处理消息。

15、, 并通过预设消息中间件将所述待处理消息存储至预设数 据库中。 0007 可选的, 在本发明第一方面的第二种实现方式中, 所述通过已训练的意图识别模 型对所述用户操作行为数据和所述用户浏览行为数据进行分析处理, 得到用户意图标签数 说明书 1/11 页 4 CN 112035742 A 4 据, 包括: 从所述预设数据库中获取所述用户操作行为数据和所述用户浏览行为数据; 将所 述用户操作行为数据和所述用户浏览行为数据输入至已训练的意图识别模型中, 并通过所 述已训练的意图识别模型提取特征, 得到用户操作特征和用户浏览特征; 对所述用户操作 特征和所述用户浏览特征依次进行语义相似度计算与意图识别。

16、处理, 得到初始意图标签数 据和对应的意图标签置信度值; 当所述对应的意图标签置信度值大于或等于预设意图阈值 时, 确定所述初始意图标签数据为用户意图标签数据。 0008 可选的, 在本发明第一方面的第三种实现方式中, 所述按照所述用户意图标签数 据查询预设标签规则表, 得到对应的标签更新规则, 所述对应的标签更新规则用于指示添 加标签和/或删除标签, 包括: 采用结构化查询语言语法规则、 所述用户意图标签数据和预 设标签规则表生成第一查询语句; 执行所述第一查询语句, 得到查询结果; 当所述查询结果 不为空值时, 从所述查询结果中读取对应的标签更新规则, 所述对应的标签更新规则用于 指示添加。

17、标签和/或删除标签。 0009 可选的, 在本发明第一方面的第四种实现方式中, 所述采用所述用户标识数据获 取初始用户画像, 并利用所述对应的标签更新规则将用户意图标签数据更新至所述初始用 户画像中, 得到目标用户画像, 包括: 采用所述结构化查询语言语法规则、 所述用户标识数 据和预设画像数据库生成第二查询语句; 执行所述第二查询语句, 得到初始用户画像; 判断 所述初始用户画像中是否存在所述用户意图标签数据; 当所述初始用户画像中不存在所述 用户意图标签数据时, 按照所述对应的标签更新规则对所述用户意图标签数据与所述初始 用户画像进行标签数据融合, 得到目标用户画像。 0010 可选的, 。

18、在本发明第一方面的第五种实现方式中, 在所述从预设应用服务中实时 获取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为数据和用户浏览 行为数据之前, 所述用户画像生成方法还包括: 接收导入用户标签数据请求, 解析所述导入 用户标签数据请求, 得到离线用户行为标签数据集和待导入用户标识数据; 按照所述待导 入用户标识数据将所述离线用户行为标签数据集导入至预设画像数据库中, 得到初始用户 画像。 0011 可选的, 在本发明第一方面的第六种实现方式中, 在所述采用所述用户标识数据 获取初始用户画像, 并利用所述对应的标签更新规则将用户意图标签数据更新至所述初始 用户画像中, 得到目标。

19、用户画像之后, 所述用户画像生成方法还包括: 从预设数据库中获取 待推荐对象信息, 对所述目标用户画像与所述待推荐对象信息进行特征匹配, 得到匹配结 果, 所述待推荐对象信息用于指示按照用户健康状况信息或者疾病预防信息设置的属性特 征; 按照所述匹配结果对目标用户个性化推荐健康饮食信息或者药品信息。 0012 本发明第二方面提供了一种用户画像生成装置, 包括: 获取模块, 用于从预设应用 服务中实时获取用户行为数据和用户标识数据, 所述用户行为数据包括用户操作行为数据 和用户浏览行为数据; 分析模块, 用于通过已训练的意图识别模型对所述用户操作行为数 据和所述用户浏览行为数据进行分析处理, 得。

20、到用户意图标签数据; 查询模块, 用于按照所 述用户意图标签数据查询预设标签规则表, 得到对应的标签更新规则, 所述对应的标签更 新规则用于指示添加标签和/或删除标签; 更新模块, 用于采用所述用户标识数据获取初始 用户画像, 并利用所述对应的标签更新规则将用户意图标签数据更新至所述初始用户画像 中, 得到目标用户画像。 说明书 2/11 页 5 CN 112035742 A 5 0013 可选的, 在本发明第二方面的第一种实现方式中, 所述获取模块具体用于: 通过预 设埋点方式从预设应用服务中采集用户行为数据和用户标识数据, 所述用户行为数据包括 用户操作行为数据和用户浏览行为数据; 将所述。

21、用户行为数据和所述用户标识数据组装成 待处理消息, 并通过预设消息中间件将所述待处理消息存储至预设数据库中。 0014 可选的, 在本发明第二方面的第二种实现方式中, 所述分析模块具体用于: 从所述 预设数据库中获取所述用户操作行为数据和所述用户浏览行为数据; 将所述用户操作行为 数据和所述用户浏览行为数据输入至已训练的意图识别模型中, 并通过所述已训练的意图 识别模型提取特征, 得到用户操作特征和用户浏览特征; 对所述用户操作特征和所述用户 浏览特征依次进行语义相似度计算与意图识别处理, 得到初始意图标签数据和对应的意图 标签置信度值; 当所述对应的意图标签置信度值大于或等于预设意图阈值时,。

22、 确定所述初 始意图标签数据为用户意图标签数据。 0015 可选的, 在本发明第二方面的第三种实现方式中, 所述查询模块具体用于: 采用结 构化查询语言语法规则、 所述用户意图标签数据和预设标签规则表生成第一查询语句; 执 行所述第一查询语句, 得到查询结果; 当所述查询结果不为空值时, 从所述查询结果中读取 对应的标签更新规则, 所述对应的标签更新规则用于指示添加标签和/或删除标签。 0016 可选的, 在本发明第二方面的第四种实现方式中, 所述更新模块具体用于: 采用所 述结构化查询语言语法规则、 所述用户标识数据和预设画像数据库生成第二查询语句; 执 行所述第二查询语句, 得到初始用户画。

23、像; 判断所述初始用户画像中是否存在所述用户意 图标签数据; 当所述初始用户画像中不存在所述用户意图标签数据时, 按照所述对应的标 签更新规则对所述用户意图标签数据与所述初始用户画像进行标签数据融合, 得到目标用 户画像。 0017 可选的, 在本发明第二方面的第五种实现方式中, 所述用户画像生成装置还包括: 解析模块, 用于接收导入用户标签数据请求, 解析所述导入用户标签数据请求, 得到离线用 户行为标签数据集和待导入用户标识数据; 导入模块, 用于按照所述待导入用户标识数据 将所述离线用户行为标签数据集导入至预设画像数据库中, 得到初始用户画像。 0018 可选的, 在本发明第二方面的第六。

24、种实现方式中, 所述用户画像生成装置还包括: 匹配模块, 用于从预设数据库中获取待推荐对象信息, 对所述目标用户画像与所述待推荐 对象信息进行特征匹配, 得到匹配结果, 所述待推荐对象信息用于指示按照用户健康状况 信息或者疾病预防信息设置的属性特征; 推荐模块, 用于按照所述匹配结果对目标用户个 性化推荐健康饮食信息或者药品信息。 0019 本发明第三方面提供了一种用户画像生成设备, 包括: 存储器和至少一个处理器, 所述存储器中存储有指令; 所述至少一个处理器调用所述存储器中的所述指令, 以使得所 述用户画像生成设备执行上述的用户画像生成方法。 0020 本发明的第四方面提供了一种计算机可读。

25、存储介质, 所述计算机可读存储介质中 存储有指令, 当其在计算机上运行时, 使得计算机执行上述的用户画像生成方法。 0021 本发明提供的技术方案中, 从预设应用服务中实时获取用户行为数据和用户标识 数据, 所述用户行为数据包括用户操作行为数据和用户浏览行为数据; 通过已训练的意图 识别模型对所述用户操作行为数据和所述用户浏览行为数据进行分析处理, 得到用户意图 标签数据; 按照所述用户意图标签数据查询预设标签规则表, 得到对应的标签更新规则, 所 说明书 3/11 页 6 CN 112035742 A 6 述对应的标签更新规则用于指示添加标签和/或删除标签; 采用所述用户标识数据获取初 始用。

26、户画像, 并利用所述对应的标签更新规则将用户意图标签数据更新至所述初始用户画 像中, 得到目标用户画像。 本发明实施例中, 通过从预设应用服务中实时获取用户行为数据 和用户标识数据, 采用已训练的意图识别模型对用户行为数据进行实时分析处理, 得到用 户意图标签数据, 并根据标签更新规则对用户标签和用户画像进行实时动态调整, 为上层 业务系统提供更准确和精准的用户相关信息, 提高了用户画像的准确性, 以及提高了资源 利用率。 附图说明 0022 图1为本发明实施例中用户画像生成方法的一个实施例示意图; 0023 图2为本发明实施例中用户画像生成方法的另一个实施例示意图; 0024 图3为本发明实。

27、施例中用户画像生成装置的一个实施例示意图; 0025 图4为本发明实施例中用户画像生成装置的另一个实施例示意图; 0026 图5为本发明实施例中用户画像生成设备的一个实施例示意图。 具体实施方式 0027 本发明实施例提供了一种用户画像生成方法、 装置、 设备及存储介质, 用于通过从 预设应用服务中实时获取用户行为数据和用户标识数据, 并根据标签更新规则、 用户行为 数据和用户标识数据对用户画像进行实时动态调整, 为上层业务系统提供更准确和精准的 用户相关信息, 提高用户画像的准确性, 以及提高资源利用率。 0028 本发明的说明书和权利要求书及上述附图中的术语 “第一” 、“第二” 、“第三。

28、” 、“第 四” 等(如果存在)是用于区别类似的对象, 而不必用于描述特定的顺序或先后次序。 应该理 解这样使用的数据在适当情况下可以互换, 以便这里描述的实施例能够以除了在这里图示 或描述的内容以外的顺序实施。 此外, 术语 “包括” 或 “具有” 及其任何变形, 意图在于覆盖不 排他的包含, 例如, 包含了一系列步骤或单元的过程、 方法、 系统、 产品或设备不必限于清楚 地列出的那些步骤或单元, 而是可包括没有清楚地列出的或对于这些过程、 方法、 产品或设 备固有的其它步骤或单元。 0029 为便于理解, 下面对本发明实施例的具体流程进行描述, 请参阅图1, 本发明实施 例中用户画像生成方。

29、法的一个实施例包括: 0030 101、 从预设应用服务中实时获取用户行为数据和用户标识数据, 用户行为数据包 括用户操作行为数据和用户浏览行为数据。 0031 其中, 预设应用服务可以为购物商城应用服务, 也可以为在线资讯应用服务, 还可 以为健康档案与体检报告应用服务, 具体此处不做限定。 例如, 当用户使用购物商城应用服 务购买了商品或者使用资讯社区应用服务阅读了资讯后, 以消息队列的方式向服务器发送 用户操作行为数据和用户浏览行为数据。 采用消息队列可以提高用户行为数据采集效率, 避免数据量大的时候产生数据阻塞。 0032 可以理解的是, 本发明的执行主体可以为用户画像生成装置, 还可。

30、以是终端或者 服务器, 具体此处不做限定。 本发明实施例以服务器为执行主体为例进行说明。 0033 102、 通过已训练的意图识别模型对用户操作行为数据和用户浏览行为数据进行 说明书 4/11 页 7 CN 112035742 A 7 分析处理, 得到用户意图标签数据。 0034 其中, 用户行为数据可以采用请求地址、 请求参数、 用于浏览或者操作页面的轨迹 信息、 页面跳转信息、 浏览器信息或者请求响应时长进行表示, 具体此处不做限定。 已训练 的意图识别模型可以为预先已训练好的决策树模型、 随机森林模型或者深度神经网络模 型, 具体此处不做限定。 0035 具体的, 服务器将用户操作行为数。

31、据和用户浏览行为数据输入至已训练的意图识 别模型中, 通过已训练的意图识别模型对用户操作行为数据和用户浏览行为数据依次进行 特征提取和标签分析处理, 得到用户意图标签数据。 0036 103、 按照用户意图标签数据查询预设标签规则表, 得到对应的标签更新规则, 对 应的标签更新规则用于指示添加标签和/或删除标签。 0037 其中, 预设标签规则表为预先设置的标签更新处理原则, 具体的, 服务器按照用户 意图标签数据从预设标签规则表中读取对应的标签更新规则, 对应的标签更新规则用于指 示添加标签、 删除标签以及添加和删除标签。 例如, 对应的标签更新规则为体重跟瘦身标签 的规则, 若用户的体重超。

32、过正常范围的30, 得到用户意图标签数据为超重, 则服务器确定 对应的标签更新规则为对用户关联减肥或者超重的标签, 并删除体重正常的标签。 0038 104、 采用用户标识数据获取初始用户画像, 并利用对应的标签更新规则将用户意 图标签数据更新至初始用户画像中, 得到目标用户画像。 0039 其中, 标签是细粒度的用户信息, 而用户画像(初始用户画像和目标用户画像)是 基于用户不同维度的标签综合的信息。 具体的, 服务器采用用户标识数据从预设数据库中 读取初始用户画像, 并利用对应的标签更新规则将用户意图标签数据添加和/或删除至初 始用户画像中, 得到目标用户画像。 例如, 一个用户可以具有 。

33、“中年” 、“肥胖” 、“高血压” 、“经 常熬夜” 和 “高油高脂” 的标签, 其中,“中年” 标签可以根据年龄规则关联,“肥胖” 标签可以 根据体重和身高规则关联,“高血压” 可以根据血压规则关联,“经常熬夜” 标签可以根据用 户访问预设应用服务的时间规则关联,“高油高脂” 标签可以根据用户经常看油炸食谱规则 关联。 根据这些规则, 可以刻画出一个肥胖中年的用户画像。 0040 本发明实施例中, 通过从预设应用服务中实时获取用户行为数据和用户标识数 据, 采用已训练的意图识别模型对用户行为数据进行实时分析处理, 得到用户意图标签数 据, 并根据标签更新规则对用户标签和用户画像进行实时动态调。

34、整, 为上层业务系统提供 更准确和精准的用户相关信息, 提高了用户画像的准确性, 以及提高了资源利用率。 0041 请参阅图2, 本发明实施例中用户画像生成方法的另一个实施例包括: 0042 201、 从预设应用服务中实时获取用户行为数据和用户标识数据, 用户行为数据包 括用户操作行为数据和用户浏览行为数据。 0043 其中, 预设应用服务预先安装并运行于终端中, 预设应用服务采用埋点方式进行 数据采集。 可选的, 服务器通过预设埋点方式从预设应用服务中采集用户行为数据和用户 标识数据, 用户行为数据包括用户操作行为数据和用户浏览行为数据; 服务器将用户行为 数据和用户标识数据组装成待处理消息。

35、, 并通过预设消息中间件将待处理消息存储至预设 数据库中。 0044 具体的, 服务器采集预设应用服务中预设交互页面中的用户行为数据和用户标识 数据, 用户行为数据包括用户操作行为数据和用户浏览行为数据, 用户行为数据用于指示 说明书 5/11 页 8 CN 112035742 A 8 待监听的用户交互行为。 例如, 下单、 收藏、 在线健康咨询、 观看视频各种用户行为; 服务器 将用户操作行为数据和用户浏览行为数据以用户标识数据为标识发送至消息队列; 服务器 将消息队列中用户操作行为数据和用户浏览行为数据上报至预设消息中间件; 服务器通过 预设消息中间件将具有相同用户标识数据的用户操作行为数。

36、据和用户浏览行为数据, 以用 户标识数据为关联关键词存储至预设数据库中。 其中, 预设数据库可以为数据仓库, 也可以 为关系数据库, 具体此处不做限定, 预设消息中间件可以为实时分布式消息队列, 也可以为 其他消息队列activemq、 rabbitmq、 rocketmq或者卡夫卡kafka, 具体此处不做不做限定。 采 用预设消息中间件提高了用户行为数据和用户标识数据的处理效率。 0045 202、 通过已训练的意图识别模型对用户操作行为数据和用户浏览行为数据进行 分析处理, 得到用户意图标签数据。 0046 其中, 用户浏览特征可以包括用户浏览时长特征和用户浏览数据项特征, 用户操 作特。

37、征可以包括用户购买行为特征、 用户收藏行为特征, 具体此处不做限定。 可选的, 服务 器从预设数据库中获取用户操作行为数据和用户浏览行为数据; 服务器将用户操作行为数 据和用户浏览行为数据输入至已训练的意图识别模型中, 并通过已训练的意图识别模型提 取特征, 得到用户操作特征和用户浏览特征; 服务器对用户操作特征和用户浏览特征依次 进行语义相似度计算与意图识别处理, 得到初始意图标签数据和对应的意图标签置信度 值; 当对应的意图标签置信度值大于或等于预设意图阈值时, 服务器确定初始意图标签数 据为用户意图标签数据。 0047 需要说明的是, 用户意图标签数据, 也就是计算用户最感兴趣的标签集。。

38、 对应的意 图标签置信度值为在0至1区间中的任意一个值。 进一步地, 若对应的意图标签置信度值小 于预设意图阈值, 则服务器调整预设意图阈值, 得到新的意图标签数据, 并将新的意图标签 数据设置为用户意图标签数据。 0048 203、 按照用户意图标签数据查询预设标签规则表, 得到对应的标签更新规则, 对 应的标签更新规则用于指示添加标签和/或删除标签。 0049 需要说明的是, 预设标签规则表存储了多个用户行为和意图标签的关系规则, 也 就是用户操作行为对应的标签更新规则, 并根据对应的标签更新规则更新用户与意图标签 的关系。 可选的, 服务器采用结构化查询语言语法规则、 用户意图标签数据和。

39、预设标签规则 表生成第一查询语句; 服务器执行第一查询语句, 得到查询结果; 当查询结果不为空值时, 服务器从查询结果中读取对应的标签更新规则, 对应的标签更新规则用于指示添加标签 和/或删除标签。 0050 进一步地, 当查询结果为空值时, 服务器确定查询失败, 删除用户意图标签数据, 并将用户意图标签数据进行异常日志记录, 以便于后续分析处理用户意图标签数据, 避免 存在错误删除标签数据的情况。 0051 204、 采用用户标识数据获取初始用户画像, 并利用对应的标签更新规则将用户意 图标签数据更新至初始用户画像中, 得到目标用户画像。 0052 可以理解的是, 目标用户画像包括导入的离线。

40、用户行为标签和实时采集的用户行 为标签。 可选的, 服务器采用结构化查询语言语法规则、 用户标识数据和预设画像数据库生 成第二查询语句; 服务器执行第二查询语句, 得到初始用户画像; 服务器判断初始用户画像 中是否存在用户意图标签数据; 当初始用户画像中不存在用户意图标签数据时, 服务器按 说明书 6/11 页 9 CN 112035742 A 9 照对应的标签更新规则对用户意图标签数据与初始用户画像进行标签数据融合, 得到目标 用户画像。 其中, 标签数据融合是指将用户意图标签数据与初始用户画像中已有的用户行 为标签进行合并与组合。 0053 例如, 用户收藏了代餐棒的商品, 服务器将该用户。

41、关联一个瘦身标签, 标识该用户 收藏了代餐棒商品。 用户注册使用一个预设应用服务时, 服务器设置一个新客的标签, 标识 该用户没有过任何付费行为, 并根据新客标签推荐优惠券吸引该用户购物, 相应的, 商家或 平台可能损失一些利润。 而在获取该用户下单支付操作行为数据后, 服务器也会去除新客 标签, 增加付费用户的标签, 标识该用户付费了, 因此构成了调整标签的场景。 0054 其中, 初始用户画像包括预先导入的用户行为标签集。 可选的, 服务器接收导入用 户标签数据请求, 解析导入用户标签数据请求, 得到离线用户行为标签数据集和待导入用 户标识数据; 服务器按照待导入用户标识数据将离线用户行为。

42、标签数据集导入至预设画像 数据库中, 得到初始用户画像。 0055 可以理解的是, 离线和实时用户标签关联系统, 都是通过对用户关联标签, 达到提 升内容投放的精准度的。 用户的标签和画像信息越丰富, 就可以更准确的了解用户, 进而推 荐更适合用户的内容。 离线用户行为标签数据集为存量数据, 标签信息更全面。 需要说明的 是, 离线用户行为标签数据集与实时采集的用户行为数据存在标签冲突, 比如一个用户在 凌晨12:30的在线问诊中, 自述经常失眠, 服务器可以实时将该用户关联失眠标签, 而离线 数仓任务中为睡眠正常的标签, 服务器在离线数据导入时, 设置锁定时时长, 在锁定时长 内, 离线关联。

43、系统不能对该用户和标签的关系做调整, 避免了导入离线数据时将失眠标签 覆盖掉的情形。 0056 205、 从预设数据库中获取待推荐对象信息, 对目标用户画像与待推荐对象信息进 行特征匹配, 得到匹配结果, 待推荐对象信息用于指示按照用户健康状况信息或者疾病预 防信息设置的属性特征。 0057 其中, 待推荐对象信息用于指示按照用户健康状况信息或者疾病预防信息设置的 属性特征, 相应的, 预设数据库也存储有健康饮食信息和药品信息。 具体的, 服务器接收标 签推荐请求; 服务器对接收标签推荐请求进行解析, 得到待推荐用户标识信息; 服务器从预 设数据库中查询待推荐对象信息; 服务器对目标用户画像与。

44、待推荐对象信息进行特征匹 配, 得到匹配结果, 匹配结果包括多个匹配值, 每个匹配值具有对应的权重值, 权重值的取 值范围为大于或者等于0, 并且小于或者等于1。 例如, 匹配结果包括5个匹配值A、 B、 C、 D和E, A、 B、 C、 D和E分别对应的权重值为0.95、 0.32、 0.15、 0.54和0.89。 0058 206、 按照匹配结果对目标用户个性化推荐健康饮食信息或者药品信息。 0059 可以理解的是, 服务器从目标用户画像中获取并分析用户标签信息, 服务器根据 用户标签信息中的标签词汇, 服务器遍历预设数据库, 得到与标签词汇匹配的健康饮食信 息或者药品信息, 也就是, 。

45、目标用户感兴趣的内容信息; 服务器向用户推荐健康饮食信息或 者药品信息。 具体的, 服务器从匹配结果中获取多个匹配值, 并按照匹配值的大小对待推荐 对象信息进行排序, 并按照匹配值从大到小的顺序选取预设数量的待推荐对象, 服务器根 据预设数量的待推荐对象和预设模板确定待推荐图文信息, 待推荐图文信息可以为健康饮 食信息或者药品信息; 服务器将待推荐图文信息发送至目标用户使用的终端。 其中, 预设数 量的取值范围为正整数。 说明书 7/11 页 10 CN 112035742 A 10 0060 进一步地, 服务器设置待推荐阈值, 服务器将匹配结果大于或者等于待推荐阈值 的健康饮食信息或者药品信。

46、息发送至终端中。 例如, 匹配结果包括5个匹配值A、 B、 C、 D和E, A、 B、 C、 D和E分别对应的权重值为0.95、 0.32、 0.15、 0.54和0.89, 待推荐阈值为0.50, 则服务 器确定推荐匹配结果为A、 D和E对应的健康饮食信息或者药品信息。 0061 需要说明的是, 目标用户画像中还包括用户的基本信息(例如, 身高、 体重、 性别和 年龄)、 药物过敏史信息和曾经患过的疾病信息, 服务器可根据基本信息和健康信息, 并结 合用户行为标签确定推荐的健康饮食信息或者药品信息的准确性。 0062 本发明实施例中, 通过从预设应用服务中实时获取用户行为数据和用户标识数 据。

47、, 采用已训练的意图识别模型对用户行为数据进行实时分析处理, 得到用户意图标签数 据, 并根据标签更新规则对用户标签和用户画像进行实时动态调整, 为上层业务系统提供 更准确和精准的用户相关信息, 提高了用户画像的准确性, 以及提高了资源利用率。 0063 上面对本发明实施例中用户画像生成方法进行了描述, 下面对本发明实施例中用 户画像生成装置进行描述, 请参阅图3, 本发明实施例中用户画像生成装置的一个实施例包 括: 0064 获取模块301, 用于从预设应用服务中实时获取用户行为数据和用户标识数据, 用 户行为数据包括用户操作行为数据和用户浏览行为数据; 0065 分析模块302, 用于通过。

48、已训练的意图识别模型对用户操作行为数据和用户浏览 行为数据进行分析处理, 得到用户意图标签数据; 0066 查询模块303, 用于按照用户意图标签数据查询预设标签规则表, 得到对应的标签 更新规则, 对应的标签更新规则用于指示添加标签和/或删除标签; 0067 更新模块304, 用于采用用户标识数据获取初始用户画像, 并利用对应的标签更新 规则将用户意图标签数据更新至初始用户画像中, 得到目标用户画像。 0068 进一步地, 将目标用户画像存储于区块链数据库中, 具体此处不做限定。 0069 本发明实施例中, 通过从预设应用服务中实时获取用户行为数据和用户标识数 据, 采用已训练的意图识别模型。

49、对用户行为数据进行实时分析处理, 得到用户意图标签数 据, 并根据标签更新规则对用户标签和用户画像进行实时动态调整, 为上层业务系统提供 更准确和精准的用户相关信息, 提高了用户画像的准确性, 以及提高了资源利用率。 0070 请参阅图4, 本发明实施例中用户画像生成装置的另一个实施例包括: 0071 获取模块301, 用于从预设应用服务中实时获取用户行为数据和用户标识数据, 用 户行为数据包括用户操作行为数据和用户浏览行为数据; 0072 分析模块302, 用于通过已训练的意图识别模型对用户操作行为数据和用户浏览 行为数据进行分析处理, 得到用户意图标签数据; 0073 查询模块303, 用。

50、于按照用户意图标签数据查询预设标签规则表, 得到对应的标签 更新规则, 对应的标签更新规则用于指示添加标签和/或删除标签; 0074 更新模块304, 用于采用用户标识数据获取初始用户画像, 并利用对应的标签更新 规则将用户意图标签数据更新至初始用户画像中, 得到目标用户画像。 0075 可选的, 获取模块301还可以具体用于: 0076 通过预设埋点方式从预设应用服务中采集用户行为数据和用户标识数据, 用户行 为数据包括用户操作行为数据和用户浏览行为数据; 说明书 8/11 页 11 CN 112035742 A 11 0077 将用户行为数据和用户标识数据组装成待处理消息, 并通过预设消息。

展开阅读全文
内容关键字: 用户 画像 生成 方法 装置 设备 存储 介质
关于本文
本文标题:用户画像生成方法、装置、设备及存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10212398.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1