《一种推荐业务信息的方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种推荐业务信息的方法及装置.pdf(21页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103927673 A (43)申请公布日 2014.07.16 CN 103927673 A (21)申请号 201410112690.X (22)申请日 2014.03.24 G06Q 30/02(2012.01) G06F 17/30(2006.01) (71)申请人 腾讯科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区赛格科技 园 2 栋东 403 室 (72)发明人 张京磊 (74)专利代理机构 北京三高永信知识产权代理 有限责任公司 11138 代理人 滕一斌 (54) 发明名称 一种推荐业务信息的方法及装置 (57) 摘要 本发明公开了一。
2、种推荐业务信息的方法及装 置, 属于互联网通信领域。所述方法包括 : 获取当 前时间单位内第一用户对每种信息类别的第一偏 好值和离当前时间单位最近的预设个数个时间单 位内第一用户对每种信息类别的第一偏好值 ; 根 据获取的每个时间单位内第一用户对每种信息类 别的第一偏好值和每个时间单位与当前时间单位 之间相差的时间单位数目, 计算第一用户对每种 信息类别的兴趣值 ; 根据第一用户对每种信息类 别的兴趣值, 获取业务信息并将获取的业务信息 发送给第一用户。所述装置包括 : 获取模块、 计算 模块和获取发送模块。本发明能够提高推荐业务 信息的准确性。 (51)Int.Cl. 权利要求书 3 页 说。
3、明书 14 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书14页 附图3页 (10)申请公布号 CN 103927673 A CN 103927673 A 1/3 页 2 1. 一种推荐业务信息的方法, 其特征在于, 所述方法包括 : 获取当前时间单位内第一用户对每种信息类别的第一偏好值和离所述当前时间单位 最近的预设个数个时间单位内所述第一用户对每种信息类别的第一偏好值 ; 根据获取的每个时间单位内所述第一用户对每种信息类别的第一偏好值和所述每个 时间单位与所述当前时间单位之间相差的时间单位数目, 计算所述第一用户对每种信息类 别的兴趣值。
4、 ; 根据所述第一用户对每种信息类别的兴趣值, 获取业务信息并将所述获取的业务信息 发送给所述第一用户。 2. 如权利要求 1 所述的方法, 其特征在于, 所述获取当前时间单位内第一用户对每种 信息类别的第一偏好值, 包括 : 获取当前时间单位内第一用户对每种信息类别分别进行的每种操作行为的操作次数 和所有用户对每种信息类别分别进行的每种操作行为的总操作次数 ; 根据所述第一用户对每种信息类别分别进行的每种操作行为的操作次数和所有用户 对每种信息类别分别进行的每种操作行为的总操作次数, 计算所述第一用户对每种信息类 别的第二偏好值 ; 对所述第一用户对每种信息类别的第二偏好值进行归一化处理, 。
5、得到所述当前时间单 位内所述第一用户对每种信息类别的第一偏好值。 3. 如权利要求 2 所述的方法, 其特征在于, 所述计算所述第一用户对每种信息类别的 第二偏好值, 包括 : 按如下公式计算所述第一用户对每种信息类别的第二偏好值 ; Ii=(a1*C1/A1+a2*C2/A2+an*Cn/An) *100/n 在上述公式中, Ii为所述第一用户对第 i 种信息类别的第二偏好值 ; C1、 C2、 Cn为所 述第一用户对第 i 种信息类别分别进行的第一种操作行为、 第二种操作行为、 、 第 n 种 操作行为的操作次数 ; A1、 A2、 An为所有用户对第 i 种信息类别分别进行的第一种操作 。
6、行为、 第二种操作行为、 第 n 种操作行为的总操作次数 ; a1、 a2、 an分别为第一种 操作行为、 第二种操作行为、 第 n 种操作行为对应的权重系数。 4. 如权利要求 2 所述的方法, 其特征在于, 所述对所述第一用户对每种信息类别的第 二偏好值进行归一化处理, 得到所述当前时间单位内所述第一用户对每种信息类别的第一 偏好值, 包括 : 根据所有用户中的每个用户对一种信息类别的第二偏好值, 计算平均值 ; 根据所述每个用户对所述信息类别的第二偏好值, 获取第三偏好值和第四偏好值, 在 所述所有用户中第二偏好值小于所述第三偏好值的用户数达到第一预设百分比和第二偏 好值小于所述第四偏好。
7、值的用户数达到第二预设百分比, 所述第一预设百分比小于所述第 二预设百分比 ; 根据所述平均值、 所述第三偏好值和所述第四偏好值, 获取所述第一用户对所述信息 类别的第一偏好值。 5. 如权利要求 1 所述的方法, 其特征在于, 所述计算所述第一用户对每种信息类别的 兴趣值, 包括 : 根据获取的每个时间单位与所述当前时间单位之间相差的时间单位数目, 获取所述每 权 利 要 求 书 CN 103927673 A 2 2/3 页 3 个时间单位对应的权重系数, 所述时间单位与所述当前时间单位之间相差的时间单位数目 越小, 所述时间单位对应的权重系数越大 ; 根据所述每个时间单位内所述第一用户对每。
8、种信息类别的第一偏好值和所述每个时 间单位对应的权重系数, 计算所述第一用户对每种信息类别的兴趣值。 6. 如权利要求 1 所述的方法, 其特征在于, 所述根据所述第一用户对每种信息类别的 兴趣值, 获取业务信息, 包括 : 根据所述第一用户对每种信息类别的兴趣值, 选择满足预设条件的信息类别 ; 从所述选择的信息类别包括的业务信息中获取业务信息。 7. 如权利要求 6 所述的方法, 其特征在于, 所述从所述选择的信息类别包括的业务信 息中获取业务信息, 包括 : 从所述选择的信息类别包括的业务信息中挑选热度值最大的第一预设个数个业务信 息, 所述业务信息的热度值是根据对所述业务信息进行的每种。
9、操作行为的操作次数获取 的 ; 从在最近时长为预设时长的时间段内发布的业务信息中挑选属于所述选择的信息类 别的业务信息, 以及从预设的业务信息集合中挑选属于所述选择的信息类别的业务信息 ; 根据所述挑选出的每个业务信息的热度值, 从所述挑选出的业务信息中获取预设个数 个业务信息。 8. 一种推荐业务信息的装置, 其特征在于, 所述装置包括 : 获取模块, 用于获取当前时间单位内第一用户对每种信息类别的第一偏好值和离所 述当前时间单位最近的预设个数个时间单位内所述第一用户对每种信息类别的第一偏好 值 ; 计算模块, 用于根据获取的每个时间单位内所述第一用户对每种信息类别的第一偏好 值和所述每个时。
10、间单位与所述当前时间单位之间相差的时间单位数目, 计算所述第一用户 对每种信息类别的兴趣值 ; 获取发送模块, 用于根据所述第一用户对每种信息类别的兴趣值, 获取业务信息并将 所述获取的业务信息发送给所述第一用户。 9. 如权利要求 8 所述的装置, 其特征在于, 所述获取模块包括 : 第一获取单元, 用于获取当前时间单位内第一用户对每种信息类别分别进行的每种操 作行为的操作次数和所有用户对每种信息类别分别进行的每种操作行为的总操作次数 ; 第一计算单元, 用于根据所述第一用户对每种信息类别分别进行的每种操作行为的操 作次数和所有用户对每种信息类别分别进行的每种操作行为的总操作次数, 计算所述。
11、第一 用户对每种信息类别的第二偏好值 ; 归一化单元, 用于对所述第一用户对每种信息类别的第二偏好值进行归一化处理, 得 到所述当前时间单位内所述第一用户对每种信息类别的第一偏好值。 10. 如权利要求 9 所述的装置, 其特征在于, 所述第一计算单元, 用于按如下公式计算 所述第一用户对每种信息类别的第二偏好值 ; Ii=(a1*C1/A1+a2*C2/A2+an*Cn/An) *100/n 在上述公式中, Ii为所述第一用户对第 i 种信息类别的第二偏好值 ; C1、 C2、 Cn为所 述第一用户对第 i 种信息类别分别进行的第一种操作行为、 第二种操作行为、 、 第 n 种 权 利 要 。
12、求 书 CN 103927673 A 3 3/3 页 4 操作行为的操作次数 ; A1、 A2、 An为所有用户对第 i 种信息类别分别进行的第一种操作 行为、 第二种操作行为、 第 n 种操作行为的总操作次数 ; a1、 a2、 an分别为第一种 操作行为、 第二种操作行为、 第 n 种操作行为对应的权重系数。 11. 如权利要求 9 所述的装置, 其特征在于, 所述归一化单元包括 : 计算子单元, 用于根据所有用户中的每个用户对一种信息类别的第二偏好值, 计算平 均值 ; 第一获取子单元, 用于根据所述每个用户对所述信息类别的第二偏好值, 获取第三偏 好值和第四偏好值, 在所述所有用户中第。
13、二偏好值小于所述第三偏好值的用户数达到第一 预设百分比和第二偏好值小于所述第四偏好值的用户数达到第二预设百分比, 所述第一预 设百分比小于所述第二预设百分比 ; 第二获取子单元, 用于根据所述平均值、 所述第三偏好值和所述第四偏好值, 获取所述 第一用户对所述信息类别的第一偏好值。 12. 如权利要求 8 所述的装置, 其特征在于, 所述计算模块包括 : 第二获取单元, 用于根据获取的每个时间单位与所述当前时间单位之间相差的时间单 位数目, 获取所述每个时间单位对应的权重系数, 所述时间单位与所述当前时间单位之间 相差的时间单位数目越小, 所述时间单位对应的权重系数越大 ; 第二计算单元, 用。
14、于根据所述每个时间单位内所述第一用户对每种信息类别的第一偏 好值和所述每个时间单位对应的权重系数, 计算所述第一用户对每种信息类别的兴趣值。 13. 如权利要求 8 所述的装置, 其特征在于, 所述获取发送模块包括 : 选择单元, 用于根据所述第一用户对每种信息类别的兴趣值, 选择满足预设条件的信 息类别 ; 第三获取单元, 用于从所述选择的信息类别包括的业务信息中获取业务信息。 14. 如权利要求 13 所述的装置, 其特征在于, 所述第三获取单元包括 : 第一挑选子单元, 用于从所述选择的信息类别包括的业务信息中挑选热度值最大的第 一预设个数个业务信息, 所述业务信息的热度值是根据对所述业。
15、务信息进行的每种操作行 为的操作次数获取的 ; 第二挑选子单元, 用于从在最近时长为预设时长的时间段内发布的业务信息中挑选属 于所述选择的信息类别的业务信息, 以及从预设的业务信息集合中挑选属于所述选择的信 息类别的业务信息 ; 第三获取子单元, 用于根据所述挑选出的每个业务信息的热度值, 从所述挑选出的业 务信息中获取预设个数个业务信息。 权 利 要 求 书 CN 103927673 A 4 1/14 页 5 一种推荐业务信息的方法及装置 技术领域 0001 本发明涉及互联网通信领域, 特别涉及一种推荐业务信息的方法及装置。 背景技术 0002 当前, 用户经常在网络上浏览不同类型的业务信息。
16、, 如图书、 杂志和新闻信息等, 服务器可以根据用户过去浏览的业务信息, 预测用户当前可能感兴趣的业务信息, 并将预 测的业务信息推荐给用户。 0003 目前存在一种推荐业务信息的方法, 具体为 : 当服务器推荐业务信息给第一用户 时, 服务器获取第一用户操作的每个业务信息的历史记录, 业务信息的历史记录至少包括 第一用户过去操作该业务信息的操作行为和每种操作行为的操作次数。 根据每个业务信息 的历史记录分别计算出第一用户对每个业务信息的兴趣值。 按上述相同方式获取其他每个 用户分别对每个业务信息的兴趣值, 根据第一用户对每个业务信息的兴趣值和其他每个用 户分别对每个业务信息的兴趣值, 计算第。
17、一用户与其他每个用户之间的兴趣相似度。将与 第一用户之间的兴趣相似度最高的预设个数个用户作为第一用户的邻居用户。 获取邻居用 户浏览过而第一用户没有浏览过的业务信息, 将获取的业务信息作为第一用户当前可能感 兴趣的业务信息并推荐给第一用户。 0004 在实现本发明的过程中, 发明人发现现有技术至少存在如下问题 : 0005 用户对业务信息的兴趣随时间不断变化, 根据过去的历史记录计算的兴趣值并不 能代表用户当前对业务信息的兴趣, 根据计算的兴趣值推荐的业务信息可能并不是用户当 前感兴趣的业务信息, 降低了推荐业务信息的准确性。 发明内容 0006 为了提高推荐业务信息的准确性, 本发明提供了一。
18、种推荐业务信息的方法及装 置。所述技术方案如下 : 0007 一种推荐业务信息的方法, 所述方法包括 : 0008 获取当前时间单位内第一用户对每种信息类别的第一偏好值和离所述当前时间 单位最近的预设个数个时间单位内所述第一用户对每种信息类别的第一偏好值 ; 0009 根据获取的每个时间单位内所述第一用户对每种信息类别的第一偏好值和所述 每个时间单位与所述当前时间单位之间相差的时间单位数目, 计算所述第一用户对每种信 息类别的兴趣值 ; 0010 根据所述第一用户对每种信息类别的兴趣值, 获取业务信息并将所述获取的业务 信息发送给所述第一用户。 0011 一种推荐业务信息的装置, 所述装置包括。
19、 : 0012 获取模块, 用于获取当前时间单位内第一用户对每种信息类别的第一偏好值和离 所述当前时间单位最近的预设个数个时间单位内所述第一用户对每种信息类别的第一偏 好值 ; 说 明 书 CN 103927673 A 5 2/14 页 6 0013 计算模块, 用于根据获取的每个时间单位内所述第一用户对每种信息类别的第一 偏好值和所述每个时间单位与所述当前时间单位之间相差的时间单位数目, 计算所述第一 用户对每种信息类别的兴趣值 ; 0014 获取发送模块, 用于根据所述第一用户对每种信息类别的兴趣值, 获取业务信息 并将所述获取的业务信息发送给所述第一用户。 0015 在本发明实施例中, 。
20、获取当前时间单位内第一用户对每种信息类别的第一偏好值 和离当前时间单位最近的预设个数个时间单位内第一用户对每种信息类别的第一偏好值 ; 根据获取的每个时间单位内第一用户对每种信息类别的第一偏好值和每个时间单位与当 前时间单位之间相差的时间单位数目, 计算第一用户对每种信息类别的兴趣值 ; 根据第一 用户对每种信息类别的兴趣值, 获取业务信息并将获取的业务信息发送给第一用户。由于 在计算第一用户对每种信息类别的兴趣值时, 参考了每个时间单位与当前时间单位之间相 差的时间单位数目, 因此考虑了时间因素对用户兴趣值的影响, 如此根据计算的兴趣值推 荐的业务信息更符合用户的兴趣, 提高了推荐业务信息的。
21、准确性。 附图说明 0016 图 1 是本发明实施例 1 提供的一种推荐业务信息的方法流程图 ; 0017 图 2 是本发明实施例 2 提供的一种推荐业务信息的方法流程图 ; 0018 图 3 是本发明实施例 3 提供的一种推荐业务信息的装置结构示意图。 具体实施方式 0019 为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明实施方 式作进一步地详细描述。 0020 实施例 1 0021 参见图 1, 本发明实施例提供了一种推荐业务信息的方法, 包括 : 0022 步骤 :101 : 获取当前时间单位内第一用户对每种信息类别的第一偏好值和离当 前时间单位最近的预设个数个时间。
22、单位内第一用户对每种信息类别的第一偏好值 ; 0023 步骤 102 : 根据获取的每个时间单位内第一用户对每种信息类别的第一偏好值和 每个时间单位与当前时间单位之间相差的时间单位数目, 计算第一用户对每种信息类别的 兴趣值 ; 0024 步骤 103 : 根据第一用户对每种信息类别的兴趣值, 获取业务信息并将获取的业 务信息发送给第一用户。 0025 优选地, 获取当前时间单位内第一用户对每种信息类别的第一偏好值, 包括 : 0026 获取当前时间单位内第一用户对每种信息类别分别进行的每种操作行为的操作 次数和所有用户对每种信息类别分别进行的每种操作行为的总操作次数 ; 0027 根据第一用。
23、户对每种信息类别分别进行的每种操作行为的操作次数和所有用户 对每种信息类别分别进行的每种操作行为的总操作次数, 计算第一用户对每种信息类别的 第二偏好值 ; 0028 对第一用户对每种信息类别的第二偏好值进行归一化处理, 得到当前时间单位内 第一用户对每种信息类别的第一偏好值。 说 明 书 CN 103927673 A 6 3/14 页 7 0029 优选地, 计算第一用户对每种信息类别的第二偏好值, 包括 : 0030 按如下公式计算第一用户对每种信息类别的第二偏好值 ; 0031 Ii=(a1*C1/A1+a2*C2/A2+an*Cn/An) *100/n 0032 在上述公式中, Ii为。
24、第一用户对第 i 种信息类别的第二偏好值 ; C1、 C2、 Cn为第 一用户对第 i 种信息类别分别进行的第一种操作行为、 第二种操作行为、 、 第 n 种操作 行为的操作次数 ; A1、 A2、 An为所有用户对第 i 种信息类别分别进行的第一种操作行为、 第二种操作行为、 第 n 种操作行为的总操作次数 ; a1、 a2、 an分别为第一种操作行 为、 第二种操作行为、 第 n 种操作行为对应的权重系数。 0033 优选地, 对第一用户对每种信息类别的第二偏好值进行归一化处理, 得到当前时 间单位内第一用户对每种信息类别的第一偏好值, 包括 : 0034 根据所有用户中的每个用户对一种信。
25、息类别的第二偏好值, 计算平均值 ; 0035 根据每个用户对信息类别的第二偏好值, 获取第三偏好值和第四偏好值, 在所有 用户中第二偏好值小于第三偏好值的用户数达到第一预设百分比和第二偏好值小于第四 偏好值的用户数达到第二预设百分比, 第一预设百分比小于第二预设百分比 ; 0036 根据平均值、 第三偏好值和第四偏好值, 获取第一用户对信息类别的第一偏好值。 0037 优选地, 计算第一用户对每种信息类别的兴趣值, 包括 : 0038 根据获取的每个时间单位与当前时间单位之间相差的时间单位数目, 获取每个时 间单位对应的权重系数, 时间单位与当前时间单位之间相差的时间单位数目越小, 时间单 。
26、位对应的权重系数越大 ; 0039 根据每个时间单位内第一用户对每种信息类别的第一偏好值和每个时间单位对 应的权重系数, 计算第一用户对每种信息类别的兴趣值。 0040 优选地, 根据第一用户对每种信息类别的兴趣值, 获取业务信息, 包括 : 0041 根据第一用户对每种信息类别的兴趣值, 选择满足预设条件的信息类别 ; 0042 从选择的信息类别包括的业务信息中获取业务信息。 0043 优选地, 从选择的信息类别包括的业务信息中获取业务信息, 包括 : 0044 从选择的信息类别包括的业务信息中挑选热度值最大的第一预设个数个业务信 息, 业务信息的热度值是根据对业务信息进行的每种操作行为的操。
27、作次数获取的 ; 0045 从在最近时长为预设时长的时间段内发布的业务信息中挑选属于选择的信息类 别的业务信息, 以及从预设的业务信息集合中挑选属于选择的信息类别的业务信息 ; 0046 根据挑选出的每个业务信息的热度值, 从挑选出的业务信息中获取预设个数个业 务信息。 0047 在本发明实施例中, 获取当前时间单位内第一用户对每种信息类别的第一偏好值 和离当前时间单位最近的预设个数个时间单位内第一用户对每种信息类别的第一偏好值 ; 根据获取的每个时间单位内第一用户对每种信息类别的第一偏好值和每个时间单位与当 前时间单位之间相差的时间单位数目, 计算第一用户对每种信息类别的兴趣值 ; 根据第一。
28、 用户对每种信息类别的兴趣值, 获取业务信息并将获取的业务信息发送给第一用户。由于 在计算第一用户对每种信息类别的兴趣值时, 参考了每个时间单位与当前时间单位之间相 差的时间单位数目, 因此考虑了时间因素对用户兴趣值的影响, 如此根据计算的兴趣值推 荐的业务信息更符合用户的兴趣, 提高了推荐业务信息的准确性。 说 明 书 CN 103927673 A 7 4/14 页 8 0048 实施例 2 0049 本发明实施例提供了一种推荐业务信息的方法。其中, 业务信息可以为图书或新 闻等。 业务信息可以分为不同的信息类别, 如图书可以分为武侠类图书、 言情类图书和玄幻 类图书等, 新闻可以分为社会类。
29、新闻、 娱乐类新闻和财经类新闻等。 0050 参见图 2, 该方法包括 : 0051 步骤 201 : 获取当前时间单位内第一用户对每种信息类别分别进行的每种操作行 为的操作次数 ; 0052 其中, 第一用户可以为所有用户中的任一用户。时间单位为时长为预设时长的时 间段, 如一天或一周等, 当前时间单位可以为今天或本周等。操作行为可以为购买、 收藏和 阅读等, 在此就不一一举例。 0053 其中, 服务器存储有每个用户对应的当前时间单位内的历史记录, 该历史记录包 括用户的标识、 信息类别和该信息类别对应的每种操作行为的操作次数。在当前时间单位 内, 用户访问服务器并对某种信息类别进行某种操。
30、作行为时, 服务器在该用户对应的历史 记录中将该信息类别对应的该操作行为的操作次数进行累加操作。 0054 本步骤具体为, 根据第一用户的标识, 从已存储的当前时间单位内第一用户对应 的历史记录中, 获取当前时间单位内第一用户对每种信息类别分别进行的每种操作行为的 操作次数。 0055 例如, 本实施例中以业务信息为图书为例进行说明, 假设, 图书的信息类别为包括 “武侠” 和 “言情” 两种信息类别, 对图书的操作行为包括购买、 收藏和阅读三种操作行为。根 据第一用户 A 的标识 IM1, 从已存储的如表 1 所示的当前时间单位内的历史记录中, 获取当 前时间单位内第一用户 A 对 “武侠”。
31、 类图书进行 “购买” 的购买次数为 10、 进行 “收藏” 的收 藏次数为 20 和进行 “阅读” 的阅读次数为 30, 以及对 “言情” 类图书进行 “购买” 的购买次 数为 5、 进行 “收藏” 的收藏次数为 15 和进行 “阅读” 的阅读次数为 20。 0056 表 1 0057 0058 步骤 202 : 获取当前时间单位内所有用户对每种信息类别分别进行的每种操作行 为的总操作次数 ; 0059 具体地, 对于每种信息类别和每种操作行为, 根据所有用户中的每个用户的用户 说 明 书 CN 103927673 A 8 5/14 页 9 标识, 从已存储的当前时间单位内的历史记录中获取每。
32、个用户对该信息类别进行的该操作 行为的操作次数, 将获取的操作次数相加得到当前时间单位内所有用户对该信息类别进行 该操作行为的总操作次数。 按照上述操作获取当前时间单位内所有用户对每种信息类别分 别进行的每种操作行为的总操作次数。 0060 例如, 假设所有用户包括用户 A、 B、 C、 D、 E 和 F, 用户 A、 B、 C、 D、 E 和 F 的标识分别 为 IM1、 IM2、 IM3、 IM4、 IM5 和 IM6。根据用户 A 的标识 IM1、 用户 B 的标识 IM2、 用户 C 的标 识 IM3、 用户 D 的标识 IM4、 用户 E 的标识 IM5 和用户 F 的标识 IM6,。
33、 从已存储的如表 1 所示 的当前时间单位内的历史记录中获取用户 A、 B、 C、 D、 E 和 F 对 “武侠” 类图书进行 “购买” 的购买次数分别为 10、 6、 3、 9、 8 和 4, 将获取的购买次数 10、 6、 3、 9、 8 和 4 相加得到当前时 间单位内所有用户对 “武侠” 类图书进行 “购买” 的总购买次数为 40。从已存储的如表 1 所 示的当前时间单位内的历史记录中获取用户 A、 B、 C、 D、 E 和 F 对 “武侠” 类图书进行的 “收 藏” 的收藏次数分别为 20、 11、 2、 17、 14 和 3, 将获取的收藏次数 20、 11、 2、 17、 14 。
34、和 3 相加得 到当前时间单位内所有用户对 “武侠” 类图书进行 “收藏” 的总收藏次数为 67。从已存储的 如表 1 所示的当前时间单位内的历史记录中获取用户 A、 B、 C、 D、 E 和 F 对 “武侠” 类图书进 行的 “阅读” 的阅读次数分别为 30、 12、 6、 32、 19 和 7, 将获取的阅读次数 30、 12、 6、 32、 19 和 7 相加得到当前时间单位内所有用户对 “武侠” 类图书进行 “阅读” 的总阅读次数为 106。 0061 同样按照上述方法, 从已存储的如表 1 所示的当前时间单位内的历史记录中获取 用户 A、 B、 C、 D、 E 和 F 对 “言情” 。
35、类图书进行的 “购买” 的购买次数分别为 5、 7、 15、 20、 2 和 22, 将获取的购买次数 5、 7、 15、 20、 2 和 22 相加得到当前时间单位内所有用户对 “言情” 类 图书进行 “购买” 的总购买次数为 71。从已存储的如表 1 所示的当前时间单位内的历史记 录中获取用户 A、 B、 C、 D、 E 和 F 对 “言情” 类图书进行的 “收藏” 的收藏次数分别为 15、 9、 10、 33、 1 和 15, 将获取的收藏次数 15、 9、 10、 33、 1 和 15 相加得到当前时间单位内所有用户 对 “言情” 类图书进行 “收藏” 的总收藏次数为 83。从已存储的。
36、如表 1 所示的当前时间单位 内的历史记录中获取用户 A、 B、 C、 D、 E 和 F 对 “言情” 类图书进行的 “阅读” 的阅读次数分 别为20、 15、 34、 45、 4和36, 将获取的阅读次数20、 15、 34、 45、 4和36相加得到当前时间单位 内所有用户对 “言情” 类图书进行 “阅读” 的总阅读次数为 144。 0062 步骤 203 : 根据当前时间单位内第一用户对每种信息类别分别进行的每种操作行 为的操作次数和所有用户对每种信息类别分别进行的每种操作行为的总操作次数, 计算第 一用户对每种信息类别的第二偏好值 ; 0063 具体地, 获取每种操作行为对应的预设权重。
37、系数。 对于每一种信息类别, 根据第一 用户对该信息类别分别进行的每种操作行为的操作次数和所有用户对该信息类别分别进 行的每种操作行为的总操作次数, 按如下公式计 (1) 算第一用户对该信息类别的第二偏好 值 ; 对于其他每种信息类别, 同该信息类别按照上述方法计算第一用户对其他每种信息类 别的第二偏好值。 0064 Ii=(a1*C1/A1+a2*C2/A2+an*Cn/An) *100/n(1) 0065 在公式 (1) 中, Ii为第一用户对第 i 种信息类别的第二偏好值 ; C1为第一用户对 第 i 种信息类别进行的第一种操作行为的操作次数, C2为第一用户对第 i 种信息类别进行 的。
38、第二种操作行为的操作次数, Cn为第一用户对第 i 种信息类别进行的第 n 种操作 行为的操作次数 ; A1为所有用户对第i种信息类别进行的第一种操作行为的总操作次数, A2 说 明 书 CN 103927673 A 9 6/14 页 10 为所有用户对第 i 种信息类别进行的第二种操作行为的总操作次数, An为所有用户 对第 i 种信息类别进行的第 n 种操作行为的总操作次数 ; a1为第一种操作行为对应的预设 权重系数, a2为第二种操作行为对应的预设权重系数, an为第 n 种操作行为对应的 预设权重系数。 0066 例如, 获取每种操作行为对应的预设权重系数, 假设 “购买” 操作、“。
39、收藏” 操作和 “阅读” 操作分别对应的预设权重系数为 0.5、 0.3 和 0.2。根据第一用户 A 对 “武侠” 类图书 进行 “购买” 的购买次数 10、 进行 “收藏” 的收藏次数 20 和进行 “阅读” 的阅读次数 30, 以及 所有用户对 “武侠” 类图书进行 “购买” 的总购买次数 40、 进行 “收藏” 的总收藏次数 67 和 进行 “阅读” 的总阅读次数 106, 按公式 (1) 计算第一用户 A 对 “武侠” 类图书的第二偏好值 为 9.04。 0067 I1=(a1*C1/A1+a2*C2/A2+a3*C3/A3) *100/3 0068 =(0.5*10/40+0.3*。
40、20/67+0.2*30/106) *100/3 0069 =9.04 0070 根据第一用户 A 对 “言情” 类图书进行 “购买” 的购买次数为 5、 进行 “收藏” 的收 藏次数为 15 和进行 “阅读” 的阅读次数为 20, 以及所有用户对 “言情” 类图书进行 “购买” 的总购买次数 71、 进行 “收藏” 的总收藏次数 83 和进行 “阅读” 的总阅读次数 144。按公式 (1) 计算第一用户 A 对 “言情” 类图书的第二偏好值为 3.91。 0071 I2=(a1*C1/A1+a2*C2/A2+a3*C3/A3) *100/3 0072 =(0.5*5/71+0.3*15/83。
41、+0.2*20/144) *100/3 0073 =3.91 0074 同样按照上述方法计算出所有用户中的每个用户对每种信息类别的第二偏好值, 计算的结果如表 2 所示。 0075 表 2 0076 0077 其中, 由于每种信息类别包括的业务信息的数量不同, 且用户对每种信息类别的 偏好不同, 所以计算出的第一用户对每种信息类别的第二偏好值之间相互不能直接进行比 较, 需要通过如下步骤 204-206 对第一用户对每种信息类别的第二偏好值进行归一化处理 得到第一用户对每种信息类别的第一偏好值之后才能进行比较。 说 明 书 CN 103927673 A 10 7/14 页 11 0078 步骤。
42、 204 : 对于每种信息类别, 根据所有用户中的每个用户对该信息类别的第二 偏好值, 计算平均值 ; 0079 例如, 对于 “武侠” 类图书, 根据用户 A、 B、 C、 D、 E 和 F 对 “武侠” 类图书的第二偏好 值分别为 9.04、 4.90、 1.93、 8.30、 6.62 和 2.55, 计算 “武侠” 类图书对应的平均值为 5.56。 对于 “言情” 类图书, 根据用户 A、 B、 C、 D、 E 和 F 对 “言情” 类图书的第二偏好值分别为 3.91、 3.67、 6.30、 10.75、 0.78 和 8.64, 计算 “言情” 类图书对应的平均值为 5.68。 0。
43、080 步骤 205 : 根据所有用户中的每个用户对该信息类别的第二偏好值, 获取第三偏 好值和第四偏好值 ; 0081 其中, 在所有用户中第二偏好值小于第三偏好值的用户数达到第一预设百分比和 第二偏好值小于第四偏好值的用户数达到第二预设百分比, 第一预设百分比小于第二预设 百分比。 0082 具体地, 获取第一预设百分比和第二预设百分比 ; 根据所有用户中的每个用户对 该信息类别的第二偏好值, 获取第三偏好值和第四偏好值, 使第三偏好值满足在所有用户 中第二偏好值小于第三偏好值的用户数达到第一预设百分比, 使第四偏好值满足在所有用 户中第二偏好值小于第四偏好值的用户数达到第二预设百分比。 。
44、0083 例如, 获取第一预设百分比和第二预设百分比, 假设获取的第一预设百分比为 5%, 第二预设百分比为 95%。根据用户 A、 B、 C、 D、 E 和 F 分别对 “武侠” 类图书的第二偏好值 9.04、 4.90、 1.93、 8.30、 6.62和2.55, 获取第三偏好值3.60和第四偏好值7.52, 使第三偏好 值3.60满足在所有用户中第二偏好值小于第三偏好值3.60的用户数达到第一预设百分比 5%, 使第四偏好值 7.52 满足在所有用户中第二偏好值小于第四偏好值 7.52 的用户数达到 第二预设百分比 95%。 0084 同样按照上述方法, 根据用户 A、 B、 C、 D。
45、、 E 和 F 分别对 “言情” 类图书的第二偏好 值 3.91、 3.67、 6.30、 10.75、 0.78 和 8.64, 获取第三偏好值 3.72 和第四偏好值 7.64, 使第三 偏好值3.72满足在所有用户中第二偏好值小于第三偏好值3.72的用户数达到第一预设百 分比 5%, 使第四偏好值 7.64 满足在所有用户中第二偏好值小于第四偏好值 7.64 的用户数 达到第二预设百分比 95%。 0085 步骤 206 : 根据平均值、 第三偏好值和第四偏好值, 获取第一用户对该信息类别的 第一偏好值 ; 0086 其中, 在对第一用户对该信息类别的第二偏好值进行归一化处理时, 需要将。
46、第二 偏好值归一到一个预设数值体系中, 将归一化之后第二偏好值对应的预设数值体系中的数 值作为第一用户对该信息类别的第一偏好值。预设数值体系可以为标准 10 分或标准 100 分等, 预设数值体系的数值范围在预设下限值和预设上限值之间, 以及在预设数值体系中 存在一个预设标准值, 如标准 10 分的数值范围为 0 至 10 以及预设标准值为 5, 标准 100 分 的数值范围为 0 至 100, 以及预设标准值为 50。 0087 本步骤具体为, 根据平均值、 第三偏好值和第四偏好值, 对第一用户对该信息类别 的第二偏好值进行判断 ; 0088 如果第一用户对该信息类别的第二偏好值大于 0 且。
47、小于或等于第三偏好值时, 将 第一用户对该信息类别的第一偏好值设置为预设数值体系的预设下限值。 0089 如果第一用户对该信息类别的第二偏好值大于第三偏好值且小于平均值时, 按照 说 明 书 CN 103927673 A 11 8/14 页 12 如下公式 (2) 计算第一用户对该信息类别的第一偏好值。 0090 0091 其中, 在公式 (2) 中, I i为第一用户对第 i 种信息类别的第一偏好值, Ii为第一 用户对第 i 种信息类别的第二偏好值, 为所有用户对第 i 种信息类别的第二偏好值的平 均值, I3为第三偏好值, b 为预设标准值。 0092 如果第一用户对该信息类别的第二偏好。
48、值与平均值相等时, 将第一用户对该信息 类别的第一偏好值设置为预设数值体系中的预设标准值。 0093 如果第一用户对该信息类别的第二偏好值大于平均值且小于第四偏好值时, 按照 如下公式 (3) 计算第一用户对该信息类别的第一偏好值。 0094 0095 其中, 在公式 (3) 中, I i为第一用户对第 i 种信息类别的第一偏好值, Ii为第一 用户对第i种信息类别的第二偏好值, 为所有用户对第i种信息类别的第二偏好值的平均 值, I4为第四偏好值, b 为预设标准值。 0096 如果第一用户对该信息类别的第二偏好值大于或等于第四偏好值时, 将第一用户 对该信息类别的第一偏好值设置为预设数值体。
49、系中的预设上限值。 0097 例如, 在本发明实施例中, 预设数值体系为标准 10 分, 标准 10 分的预设下限值为 0, 预设上限值为 10, 以及预设标准值为 5。对于 “武侠” 类图书, 第一用户 A 对 “武侠” 类图 书的第二偏好值为 9.04,“武侠” 类图书对应的平均值为 5.56, 第三偏好值为 3.60 和第四 偏好值为 7.52。由于第一用户 A 对 “武侠” 类图书的第二偏好值为 9.04 大于第四偏好值 7.52, 因此将第一用户 A 对 “武侠” 类图书的第一偏好值设置为标准 10 分的预设上限值 10。 0098 对于 “言情” 类图书, 第一用户 A 对 “言情” 类图书的第二偏好值为 3.91,“言情” 类 图书对应的平均值为 5.68, 第。