离散社交推荐方法及系统.pdf

上传人:姓*** 文档编号:12152891 上传时间:2021-11-24 格式:PDF 页数:11 大小:438.70KB
收藏 版权申诉 举报 下载
离散社交推荐方法及系统.pdf_第1页
第1页 / 共11页
离散社交推荐方法及系统.pdf_第2页
第2页 / 共11页
离散社交推荐方法及系统.pdf_第3页
第3页 / 共11页
文档描述:

《离散社交推荐方法及系统.pdf》由会员分享,可在线阅读,更多相关《离散社交推荐方法及系统.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910133094.2 (22)申请日 2019.02.22 (71)申请人 清华大学 地址 100084 北京市海淀区清华园 (72)发明人 朱文武王鑫 (74)专利代理机构 北京清亦华知识产权代理事 务所(普通合伙) 11201 代理人 张润 (51)Int.Cl. G06Q 30/06(2012.01) G06F 16/9535(2019.01) G06Q 50/00(2012.01) (54)发明名称 离散社交推荐方法及系统 (57)摘要 本发明公开了一种离散社交推。

2、荐方法及系 统, 其中, 该方法包括以下步骤: 获取社交关系模 型和评分关系模型; 根据社交关系模型和评分关 系模型分解得到用户间的潜在特征向量之间的 第一点积与用户和物品间的潜在特征向量之间 的第二点积; 根据第一点积和第二点积得到多个 特征向量, 并根据向量相关性进行二进制位移操 作, 以得到对多个特征向量的加减乘除运算结 果; 向用户推送根据加减乘除运算结果得到的用 户喜好确定的推荐物品。 该方法能够快速产生高 质量推荐结果的离散社交推荐模型, 从而满足社 交推荐系统在面对海量用户和物品时对快速产 生推荐结果与高推荐准确度的双重需求。 权利要求书2页 说明书6页 附图2页 CN 1098。

3、86787 A 2019.06.14 CN 109886787 A 1.一种离散社交推荐方法, 其特征在于, 包括以下步骤: 获取社交关系模型和评分关系模型; 根据所述社交关系模型和评分关系模型分解得到用户间的潜在特征向量之间的第一 点积与用户和物品间的潜在特征向量之间的第二点积; 根据所述第一点积和所述第二点积得到多个特征向量, 并根据向量相关性进行二进制 位移操作, 以得到对所述多个特征向量的加减乘除运算结果; 以及 向用户推送根据所述加减乘除运算结果得到的用户喜好确定的推荐物品。 2.根据权利要求1所述的离散社交推荐方法, 其特征在于, 所述获取社交关系模型和评 分关系模型, 包括: 采。

4、集用户与用户的社交连接关系和用户与物品的评价关系; 根据所述用户与用户的社交连接关系搭建所述社交关系模型; 根据所述用户与物品的评价关系搭建所述评分关系模型。 3.根据权利要求1所述的离散社交推荐方法, 其特征在于, 所述多个特征向量的每个特 征向量仅包含0和1。 4.根据权利要求1所述的离散社交推荐方法, 其特征在于, 所述潜在特征向量为所述社 交关系模型和所述评分关系模型在训练阶段中获得的新特征向量。 5.根据权利要求1所述的离散社交推荐方法, 其特征在于, 所述根据所述第一点积和所 述第二点积得到多个特征向量, 包括: 对所述第一点积和所述第二点积进行二值量化处理, 以根据处理结果得到所。

5、述多个特 征向量。 6.一种离散社交推荐系统, 其特征在于, 包括: 获取模块, 用于获取社交关系模型和评分关系模型; 分解模块, 用于根据所述社交关系模型和评分关系模型分解得到用户间的潜在特征向 量之间的第一点积与用户和物品间的潜在特征向量之间的第二点积; 处理模块, 用于根据所述第一点积和所述第二点积得到多个特征向量, 并根据向量相 关性进行二进制位移操作, 以得到对所述多个特征向量的加减乘除运算结果; 以及 推送模块, 用于向用户推送根据所述加减乘除运算结果得到的用户喜好确定的推荐物 品。 7.根据权利要求6所述的离散社交推荐系统, 其特征在于, 所述获取模块进一步包括: 采集单元, 用。

6、于采集用户与用户的社交连接关系和用户与物品的评价关系; 第一搭建单元, 用于根据所述用户与用户的社交连接关系搭建所述社交关系模型; 以 及 第二搭建单元, 用于根据所述用户与物品的评价关系搭建所述评分关系模型。 8.根据权利要求6所述的离散社交推荐系统, 其特征在于, 所述多个特征向量的每个特 征向量仅包含0和1。 9.根据权利要求6所述的离散社交推荐系统, 其特征在于, 所述潜在特征向量为所述社 交关系模型和所述评分关系模型在训练阶段中获得的新特征向量。 10.根据权利要求6所述的离散社交推荐系统, 其特征在于, 所述根据所述第一点积和 所述第二点积得到多个特征向量, 包括: 权利要求书 1。

7、/2 页 2 CN 109886787 A 2 对所述第一点积和所述第二点积进行二值量化处理, 以根据处理结果得到所述多个特 征向量。 权利要求书 2/2 页 3 CN 109886787 A 3 离散社交推荐方法及系统 技术领域 0001 本发明涉及信息处理技术领域, 特别涉及一种离散社交推荐方法及系统。 背景技术 0002 社会推荐旨在通过考虑社交信息来提高传统推荐系统的性能。 作为最流行的社交 推荐技巧之一, 矩阵分解通常使用连续实值向量来表示用户和物品的潜在特征。 0003 然而, 大量的用户/物品潜在特征导致了昂贵的存储和计算成本, 此问题在计算资 源非常有限的终端用户设备上显得尤其。

8、突出。 因此, 当考虑额外的社交信息时, 精确地从大 量候选者中为给定用户提取K个最相关物品时往往消耗更多的计算时间和存储空间, 这对 以高效和准确为重要性能标准的社交推荐提出了巨大的挑战。 一种比较直观的现有方法是 简单地对潜在特征(在训练阶段中获得)进行量化, 然后通过汉明距离计算相关性得分。 0004 但这种基于两步的哈希学习过程不能保留实值空间中原始数据的几何性质, 并且 可能导致严重的量化损失。 发明内容 0005 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。 0006 为此, 本发明的一个目的在于提出一种离散社交推荐方法。 0007 本发明的另一个目的在于提出一种离散社。

9、交推荐系统。 0008 为达到上述目的, 本发明一方面提出了离散社交推荐方法, 包括以下步骤: 获取社 交关系模型和评分关系模型; 根据所述社交关系模型和评分关系模型分解得到用户间的潜 在特征向量之间的第一点积与用户和物品间的潜在特征向量之间的第二点积; 根据所述第 一点积和所述第二点积得到多个特征向量, 并根据向量相关性进行二进制位移操作, 以得 到对所述多个特征向量的加减乘除运算结果; 向用户推送根据所述加减乘除运算结果得到 的用户喜好确定的推荐物品。 0009 本发明实施例的离散社交推荐方法, 考虑了大数据环境下社交推荐对兼顾精度和 效率的迫切需求, 采用端到端的统一框架对用户与物品的潜。

10、在特征向量进行二值量化, 提 出能够快速产生高质量推荐结果的离散社交推荐模型, 从而满足社交推荐系统在面对海量 用户和物品时对快速产生推荐结果与高推荐准确度的双重需求。 0010 另外, 根据本发明上述实施例的离散社交推荐方法还可以具有以下附加的技术特 征: 0011 进一步地, 在本发明的一个实施例中, 所述获取社交关系模型和评分关系模型, 包 括: 采集用户与用户的社交连接关系和用户与物品的评价关系; 根据所述用户与用户的社 交连接关系搭建所述社交关系模型; 根据所述用户与物品的评价关系搭建所述评分关系模 型。 0012 进一步地, 在本发明的一个实施例中, 所述多个特征向量的每个特征向量。

11、仅包含0 和1。 说明书 1/6 页 4 CN 109886787 A 4 0013 进一步地, 在本发明的一个实施例中, 所述潜在特征向量为所述社交关系模型和 所述评分关系模型在训练阶段中获得的新特征向量。 0014 进一步地, 在本发明的一个实施例中, 所述根据所述第一点积和所述第二点积得 到多个特征向量, 包括: 对所述第一点积和所述第二点积进行二值量化处理, 以根据处理结 果得到所述多个特征向量。 0015 为达到上述目的, 本发明另一方面提出了一种离散社交推荐系统, 包括: 获取模 块, 用于获取社交关系模型和评分关系模型; 分解模块, 用于根据所述社交关系模型和评分 关系模型分解得。

12、到用户间的潜在特征向量之间的第一点积与用户和物品间的潜在特征向 量之间的第二点积; 处理模块, 用于根据所述第一点积和所述第二点积得到多个特征向量, 并根据向量相关性进行二进制位移操作, 以得到对所述多个特征向量的加减乘除运算结 果; 推送模块, 用于向用户推送根据所述加减乘除运算结果得到的用户喜好确定的推荐物 品。 0016 本发明实施例的离散社交推荐系统, 考虑了大数据环境下社交推荐对兼顾精度和 效率的迫切需求, 采用端到端的统一框架对用户与物品的潜在特征向量进行二值量化, 提 出能够快速产生高质量推荐结果的离散社交推荐模型, 从而满足社交推荐系统在面对海量 用户和物品时对快速产生推荐结果。

13、与高推荐准确度的双重需求。 0017 另外, 根据本发明上述实施例的离散社交推荐系统还可以具有以下附加的技术特 征: 0018 进一步地, 在本发明的一个实施例中, 采集单元, 用于采集用户与用户的社交连接 关系和用户与物品的评价关系; 第一搭建单元, 用于根据所述用户与用户的社交连接关系 搭建所述社交关系模型; 第二搭建单元, 用于根据所述用户与物品的评价关系搭建所述评 分关系模型。 0019 进一步地, 在本发明的一个实施例中, 所述多个特征向量的每个特征向量仅包含0 和1。 0020 进一步地, 在本发明的一个实施例中, 所述潜在特征向量为所述社交关系模型和 所述评分关系模型在训练阶段中。

14、获得的新特征向量。 0021 进一步地, 在本发明的一个实施例中, 所述根据所述第一点积和所述第二点积得 到多个特征向量, 包括: 对所述第一点积和所述第二点积进行二值量化处理, 以根据处理结 果得到所述多个特征向量。 0022 本发明附加的方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变 得明显, 或通过本发明的实践了解到。 附图说明 0023 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得 明显和容易理解, 其中: 0024 图1为本发明一个实施例的离散社交推荐方法流程图; 0025 图2为本发明一个实施例的离散社交推荐系统结构示意图; 0026 图3为。

15、本发明一个实施例的离散社交推荐系统中采集模块的结构示意图。 说明书 2/6 页 5 CN 109886787 A 5 具体实施方式 0027 下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。 下面通过参考附 图描述的实施例是示例性的, 旨在用于解释本发明, 而不能理解为对本发明的限制。 0028 针对相关技术, 本发明实施例需要解决的问题, 如下: 0029 (1)考虑社交推荐系统对推荐精度与推荐效率的双重要求, 提出端到端的统一框 架来学习用户和物品潜在特征向量的二值量化(离散化)表示。 0030 (。

16、2)对期望学习得到的哈希量化编码进行编码均衡性和不相关性约束, 使得二进 制哈希编码在保持紧凑的同时携带的信息量尽可能大。 0031 (3)由于对满足(1)和(2)的哈希编码进行求解属于NP难问题, 因此本发明提出迭 代算法对相应的哈希编码进行近似求解。 0032 其中, NP难(NP-hard)问题, NP是指非确定性多项式, 非确定是指可用一定数量的 运算去解决多项时间内可解决的问题。 0033 下面参照附图描述根据本发明实施例提出的离散社交推荐方法及系统如何解决 上述问题, 首先将参照附图描述根据本发明实施例提出的离散社交推荐方法。 0034 图1是本发明一个实施例的离散社交推荐方法流程。

17、图。 0035 如图1所示, 该离散社交推荐方法包括以下步骤: 0036 在步骤S101中, 获取社交关系模型和评分关系模型。 0037 进一步地, 在本发明的一个实施例中, 获取社交关系模型和评分关系模型, 包括: 采集用户与用户的社交连接关系和用户与物品的评价关系; 根据用户与用户的社交连接关 系搭建社交关系模型; 根据用户与物品的评价关系搭建评分关系模型。 0038 在步骤S102中, 根据社交关系模型和评分关系模型分解得到用户间的潜在特征向 量之间的第一点积与用户和物品间的潜在特征向量之间的第二点积。 0039 进一步地, 在本发明的一个实施例中, 潜在特征向量为社交关系模型和评分关系。

18、 模型在训练阶段中获得的新特征向量。 0040 也就是说, 对用户与用户的社交连接关系以及用户与物品的评分关系进行建模, 用社交关系矩阵和评分矩阵分别表示上述两类关系, 并假设社交关系矩阵可以分解为用户 与用户的潜在特征向量之间的点积, 评分矩阵可以分解为用户与物品的潜在特征向量之间 的点积。 0041 在步骤S103中, 根据第一点积和第二点积得到多个特征向量, 并根据向量相关性 进行二进制位移操作, 以得到对多个特征向量的加减乘除运算结果。 其中, 多个特征向量的 每个特征向量仅包含0和1。 0042 进一步地, 在本发明的一个实施例中, 根据第一点积和第二点积得到多个特征向 量, 包括:。

19、 对第一点积和第二点积进行二值量化处理, 以根据处理结果得到多个特征向量。 0043 具体地, 对上述用户和物品的实值特征向量进行二值量化(离散化)处理, 使得量 化之后特征向量只含有0和1, 从而可以在汉明空间(汉明空间中的所有元素只包含0和1, 因 此可以看作是由二进制数进行表示的空间)用二进制位移操作对二值量化后的特征向量进 行加减乘除运算(较实值向量的加减乘除运算快速很多)。 对用户与物品的潜在特征向量进 行二值量化, 使得用户与用户, 用户与物品之间的相似度计算以及top-k检索的时间开销大 说明书 3/6 页 6 CN 109886787 A 6 大减少, 同时模型参数占用的存储空。

20、间也大大降低。 0044 其中, 在信息论中, 汉明距离(Hamming distance)是指两个等长字符串对应位置 的不同字符的个数。 换句话说, 它就是将一个字符串变换成另外一个字符串所需要替换的 字符个数。 top-k检索指以某搜索操作的前k个返回结果为对象进行分析。 0045 另外, 本发明实施例采用端到端的统一框架对社交推荐下用户与物品的二值离散 化潜在特征向量表征进行学习, 求得近似最优解(对完全最优解的求解属于NP难问题), 有 助于高效准确地处理大数据环境下针对海量用户与物品的社交推荐问题。 0046 在步骤S104中, 向用户推送根据加减乘除运算结果得到的用户喜好确定的推荐。

21、物 品。 0047 简单来讲, 根据用户的综合喜好来为其推荐可能感兴趣的物品。 0048 下面结合具体实施例对本发明离散社交推荐方法进一步详细描述。 0049 例如, 假设给定1千万用户和5千万物品, 则可以形成10,000,000*50,000,000的用 户-物品矩阵。 以推荐系统中最常用的矩阵分解为例, 使用实数向量来表示用户和物品的潜 在特征因子(d维)时, 如果想要得到任意用户和任意物品之间的相关度, 则理论上需要计算 10,000,000*50,000,000次d维实数向量的内积。 对考虑了用户与用户之间的社交关系的社 交推荐来说, 理论上还需要额外计算10,000,000*10,。

22、000,000次d维实数向量的内积。 由于 实数的存储一般需占用32bit, 且其乘法无法通过二进制位移操作得到, 因此上述操作会耗 费大量的空间与时间。 而本发明实施例采用二进制向量来表示用户与物品的潜在特征因 子, 其每一位非1即0。 由于二进制表示(1或0)只占用1bit空间, 且二进制向量之间的乘法可 以通过高效快速的移位操作来进行, 因此离散社交推荐方法能够在保证较高推荐精度的同 时极大地减小算法对内存和时间的消耗, 对当今需要实时对海量大数据进行计算的社交推 荐系统性能的提升具有较大意义。 0050 需要说明的是, 除传统推荐中涉及到的用户对物品的打分信息外, 本发明实施例 还考虑。

23、了用户所产生的社交信息, 旨在解决社交推荐模型同时满足高精度和高效率推荐的 难题。 在面临海量用户和物品时, 本发明实施例对社交推荐模型进行压缩, 使得模型在运行 时占用空间变小, 花费时间变小的同时, 冷启动用户的高效精准推荐, 推荐准确度基本不受 影响, 从而更好地应对大数据时代对推荐模型精度和可拓展性的双重要求。 0051 综上可知, 本发明实施例离散社交推荐方法与相关技术相比较具有以下优点和有 益效果: 0052 (1)提出一种新颖的离散社交推荐(Discrete Social Recommendation)方法, 该 方法在考虑社交信息的同时采用一种统一学习框架对用户和物品的潜在特征。

24、向量进行二 值量化(离散化)的哈希编码学习。 0053 (2)将哈希编码的平衡性和不相关性以约束条件的形式作用于模型的优化目标 上, 以确保学习得到的哈希编码能够在保持编码紧凑性的同时承载尽可能多的信息, 并采 用有效的优化算法来学习相应的模型参数。 0054 (3)对三个真实数据集, 即FilmTrust, CiaoDVD和Epinions进行的大量实验表明, 相较现有方法, 本发明实施例所描述算法的运行速度提高了近5倍, 仅消耗了现有方法内存 使用量的1/37, 而且推荐准确度几乎没有下降。 0055 根据本发明实施例提出的离散社交推荐方法, 考虑了大数据环境下社交推荐对兼 说明书 4/6。

25、 页 7 CN 109886787 A 7 顾精度和效率的迫切需求, 采用端到端的统一框架对用户与物品的潜在特征向量进行二值 量化, 提出能够快速产生高质量推荐结果的离散社交推荐模型, 从而满足社交推荐系统在 面对海量用户和物品时对快速产生推荐结果与高推荐准确度的双重需求。 0056 其次参照附图描述根据本发明实施例提出的离散社交推荐系统。 0057 图2是本发明一个实施例的离散社交推荐系统结构示意图。 0058 如图2所示, 该离散社交推荐系统10包括: 获取模块100、 分解模块200、 处理模块 300和推送模块400。 0059 其中, 获取模块100用于获取社交关系模型和评分关系模型。

26、。 分解模块200用于根 据社交关系模型和评分关系模型分解得到用户间的潜在特征向量之间的第一点积与用户 和物品间的潜在特征向量之间的第二点积。 处理模块300用于根据第一点积和第二点积得 到多个特征向量, 并根据向量相关性进行二进制位移操作, 以得到对多个特征向量的加减 乘除运算结果。 推送模块400用于向用户推送根据加减乘除运算结果得到的用户喜好确定 的推荐物品。 本发明实施例的离散社交推荐系统保证推荐精度不受影响的情况下进一步提 升训练推荐模型所需要的计算时间和存储空间。 0060 进一步地, 如图3所示, 获取模块100包括: 采集单元101用于采集用户与用户的社 交连接关系和用户与物品。

27、的评价关系。 第一搭建单元102用于根据用户与用户的社交连接 关系搭建社交关系模型。 第二搭建单元103用于根据用户与物品的评价关系搭建评分关系 模型。 0061 可选地, 在本发明的一个实施例中, 多个特征向量的每个特征向量仅包含0和1。 0062 进一步地, 在本发明的一个实施例中, 潜在特征向量为社交关系模型和评分关系 模型在训练阶段中获得的新特征向量。 0063 进一步地, 在本发明的一个实施例中, 根据第一点积和第二点积得到多个特征向 量, 包括: 对第一点积和第二点积进行二值量化处理, 以根据处理结果得到多个特征向量。 0064 需要说明的是, 前述对离散社交推荐方法实施例的解释说。

28、明也适用于该系统, 此 处不再赘述。 0065 根据本发明实施例提出的离散社交推荐系统, 考虑了大数据环境下社交推荐对兼 顾精度和效率的迫切需求, 采用端到端的统一框架对用户与物品的潜在特征向量进行二值 量化, 提出能够快速产生高质量推荐结果的离散社交推荐模型, 从而满足社交推荐系统在 面对海量用户和物品时对快速产生推荐结果与高推荐准确度的双重需求。 0066 此外, 术语 “第一” 、“第二” 仅用于描述目的, 而不能理解为指示或暗示相对重要性 或者隐含指明所指示的技术特征的数量。 由此, 限定有 “第一” 、“第二” 的特征可以明示或者 隐含地包括至少一个该特征。 在本发明的描述中,“多个。

29、” 的含义是至少两个, 例如两个, 三 个等, 除非另有明确具体的限定。 0067 在本发明中, 除非另有明确的规定和限定, 术语 “安装” 、“相连” 、“连接” 、“固定” 等 术语应做广义理解, 例如, 可以是固定连接, 也可以是可拆卸连接, 或成一体; 可以是机械连 接, 也可以是电连接; 可以是直接相连, 也可以通过中间媒介间接相连, 可以是两个元件内 部的连通或两个元件的相互作用关系, 除非另有明确的限定。 对于本领域的普通技术人员 而言, 可以根据具体情况理解上述术语在本发明中的具体含义。 0068 在本发明中, 除非另有明确的规定和限定, 第一特征在第二特征 “上” 或 “下”。

30、 可以 说明书 5/6 页 8 CN 109886787 A 8 是第一和第二特征直接接触, 或第一和第二特征通过中间媒介间接接触。 而且, 第一特征在 第二特征 “之上” 、“上方” 和 “上面” 可是第一特征在第二特征正上方或斜上方, 或仅仅表示 第一特征水平高度高于第二特征。 第一特征在第二特征 “之下” 、“下方” 和 “下面” 可以是第 一特征在第二特征正下方或斜下方, 或仅仅表示第一特征水平高度小于第二特征。 0069 在本说明书的描述中, 参考术语 “一个实施例” 、“一些实施例” 、“示例” 、“具体示 例” 、 或 “一些示例” 等的描述意指结合该实施例或示例描述的具体特征、。

31、 结构、 材料或者特 点包含于本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语的示意性表述不 必须针对的是相同的实施例或示例。 而且, 描述的具体特征、 结构、 材料或者特点可以在任 一个或多个实施例或示例中以合适的方式结合。 此外, 在不相互矛盾的情况下, 本领域的技 术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结 合和组合。 0070 尽管上面已经示出和描述了本发明的实施例, 可以理解的是, 上述实施例是示例 性的, 不能理解为对本发明的限制, 本领域的普通技术人员在本发明的范围内可以对上述 实施例进行变化、 修改、 替换和变型。 说明书 6/6 页 9 CN 109886787 A 9 图1 图2 说明书附图 1/2 页 10 CN 109886787 A 10 图3 说明书附图 2/2 页 11 CN 109886787 A 11 。

展开阅读全文
内容关键字: 离散 社交 推荐 方法 系统
关于本文
本文标题:离散社交推荐方法及系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/12152891.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1