信息推荐方法、装置、计算机设备及存储介质.pdf
《信息推荐方法、装置、计算机设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《信息推荐方法、装置、计算机设备及存储介质.pdf(25页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010120620.4 (22)申请日 2020.02.26 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平安金融中 心23楼 (72)发明人 邓悦金戈徐亮 (74)专利代理机构 深圳市精英专利事务所 44242 代理人 蒋学超 (51)Int.Cl. G06Q 30/06(2012.01) G06K 9/62(2006.01) (54)发明名称 信息推荐方法、 装置、 计算机设备及存储介 质 (57。
2、)摘要 本发明实施例公开了一种信息推荐方法、 装 置、 计算机设备及存储介质。 该方法属于智能决 策技术领域, 该方法包括: 将消费管理服务器发 送的训练样本集合输入到聚类模型中以聚类得 到多个类; 获取各类的特征距离; 分别获取待测 样本与各类的类心的距离; 将多个类划分为多个 包含两个类的组并筛选特征类以及特征组; 分别 将待推荐用户终端发送的待测样本聚类到各特 征组的一类中; 统计待测样本聚类到各特征类中 的次数, 并选取次数最高的特征类作为待测样本 所属的类, 并根据待测样本所属的类为待推荐用 户终端推荐信息。 通过筛选特征类, 可过滤掉大 多数距离待测样本较远的特征组, 从而极大地降。
3、 低了计算机的数据处理量, 提高了计算机的处理 速度。 权利要求书3页 说明书14页 附图7页 CN 111445304 A 2020.07.24 CN 111445304 A 1.一种信息推荐方法, 其特征在于, 所述方法应用于推荐系统中的推荐服务器, 所述推 荐服务器还包括消费管理服务器以及用户终端, 所述方法包括: 接收消费管理服务器发送的训练样本集合, 并将所述训练样本集合中的训练样本输入 到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合包含多个用户的消费数 据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端处获取的; 分别获取每个所述类中距离所述类的类心最远。
4、的训练样本作为目标训练样本, 并获取 所述目标训练样本与所述类的类心的距离作为所述类的特征距离; 将多个所述类划分为多个包含两个所述类的组, 其中, 任一所述类均与除自身外的所 有类组成组; 若接收到待推荐用户终端发送的待测样本, 将所述待测样本输入所述聚类模型中以分 别获取所述待测样本与各所述类的类心的距离, 其中, 所述待测样本包含所述待推荐用户 终端的消费数据; 从各所述类中筛选出特征类, 并从各所述组中筛选出特征组, 其中, 所述特征类的类心 与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两个类均为所述特征类; 根据所述待测样本与各所述特征组的特征类的距离以及所述特征组的特。
5、征类的特征 距离, 分别将所述待测样本聚类到各所述特征组的一所述特征类中; 统计所述待测样本聚类到各所述特征组的特征类中的次数, 选取次数最高的特征类作 为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推荐用户终端推荐信 息。 2.根据权利要求1所述的信息推荐方法, 其特征在于, 所述获取所述目标训练样本与所 述类的类心的距离作为所述类的特征距离, 包括: 根据以下公式计算所述目标训练样本与所述类的类心的距离d1, 其 中, xi为类心的分量, yi为目标训练样本的分量, n为目标训练样本以及类心的维度。 3.根据权利要求1所述的信息推荐方法, 其特征在于, 所述将多个所述类划分为。
6、多个包 含两个所述类的组, 包括: 获取一所述类作为目标类; 分别将所述目标类与所述目标类之外的所有类组成组, 并对所述目标类进行标记; 判断是否存在未标记的类; 若存在未标记的类, 获取一未标记的类作为新的目标类, 并返回所述分别将所述目标 类与所述目标类之外的所有类组成组, 并对所述目标类进行标记的步骤; 若不存在未标记的类, 将所有组中重复的组删除。 4.根据权利要求1所述的信息推荐方法, 其特征在于, 所述根据所述待测样本与各所述 特征组的特征类的距离以及所述特征组的特征类的特征距离, 分别将所述待测样本聚类到 各所述特征组的一所述特征类中, 包括: 获取一所述特征组作为目标组; 根据。
7、所述待测样本与所述目标组的类的距离以及所述目标组的类的特征距离, 将所述 待测样本聚类到所述目标组的一所述类中, 并对所述目标组进行标记; 权利要求书 1/3 页 2 CN 111445304 A 2 判断是否存在未标记的特征组; 若存在未标记的特征组, 获取一未标记的特征组作为新的目标组, 并返回所述根据所 述待测样本与所述目标组的类的距离以及所述目标组的类的特征距离, 将所述待测样本聚 类到所述目标组的一所述类中, 并对所述目标组进行标记的步骤。 5.根据权利要求4所述的信息推荐方法, 其特征在于, 所述目标组包含的两个类分别为 第一类和第二类, 所述根据所述待测样本与所述目标组的类的距离。
8、以及所述目标组的类的 特征距离, 将所述待测样本聚类到所述目标组的一所述类中, 包括: 判断第一比值是否大于第二比值, 其中, 所述第一比值为所述待测样本与所述第一类 的类心的距离与所述待测样本与所述第二类的类心的距离的比值, 所述第二比值为所述第 一类的特征距离与所述第二类的特征距离的比值; 若所述第一比值大于所述第二比值, 判定所述待测样本聚类到所述第一类中; 若所述第一比值不大于所述第二比值, 判定所述待测样本聚类到所述第二类中。 6.根据权利要求1所述的信息推荐方法, 其特征在于, 所述将所述待测样本输入所述聚 类模型中以分别获取所述待测样本与各所述类的类心的距离, 包括: 根据以下公。
9、式计算所述待测样本与所述类的类心的距离d2, 其中xi为 类心的分量, zi为目标训练样本的分量, n为目标训练样本以及类心的维度。 7.一种信息推荐装置, 其特征在于, 包括: 输入单元, 用于接收消费管理服务器发送的训练样本集合, 并将所述训练样本集合中 的训练样本输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合包含多 个用户的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端处获 取的; 第一获取单元, 用于分别获取每个所述类中距离所述类的类心最远的训练样本作为目 标训练样本, 并获取所述目标训练样本与所述类的类心的距离作为所述类的特征距离; 划分单元。
10、, 用于将多个所述类划分为多个包含两个所述类的组, 其中, 任一所述类均与 除自身外的所有类组成组; 第二获取单元, 用于若接收到待推荐用户终端发送的待测样本, 将所述待测样本输入 所述聚类模型中以分别获取所述待测样本与各所述类的类心的距离, 其中, 所述待测样本 包含所述待推荐用户终端的消费数据; 筛选单元, 用于从各所述类中筛选出特征类, 并从各所述组中筛选出特征组, 其中, 所 述特征类的类心与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两个类均 为所述特征类; 聚类单元, 用于根据所述待测样本与各所述特征组的特征类的距离以及所述特征组的 特征类的特征距离, 分别将所述待测样。
11、本聚类到各所述特征组的一所述特征类中; 统计单元, 用于统计所述待测样本聚类到各所述特征组的特征类中的次数, 选取次数 最高的特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推荐用 户终端推荐信息。 8.根据权利要求7所述的信息推荐装置, 其特征在于, 所述第一获取单元包括: 权利要求书 2/3 页 3 CN 111445304 A 3 第一计算单元, 用于根据以下公式计算所述目标训练样本与所述类 的类心的距离d1, 其中, xi为类心的分量, yi为目标训练样本的分量, n为目标训练样本以及 类心的维度。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器及处理。
12、器, 所述存储器上 存储有计算机程序, 所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述 的方法。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计 算机程序当被处理器执行时可实现如权利要求1-6中任一项所述的方法。 权利要求书 3/3 页 4 CN 111445304 A 4 信息推荐方法、 装置、 计算机设备及存储介质 技术领域 0001 本发明涉及智能决策领域, 尤其涉及一种信息推荐方法、 装置、 计算机设备及存储 介质。 背景技术 0002 将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。 由 聚类所生成的簇是一组数。
13、据对象的集合, 这些对象与同一个簇中的对象彼此相似, 与其他 簇中的对象相异。 根据人群分类, 可以进行商品推荐。 具体地, 将某一类中待推荐用户购买 较多的商品推荐给该类中的新待推荐用户。 0003 现有的人群分类方法多是采用无监督的聚类方法, 其存在的缺点是当建立好聚类 模型之后, 新待推荐用户的数据在进行泛化时, 需要将新待推荐用户与模型所有类进行的 对比, 才能确定该新待推荐用户所属的类。 在分得的类较多时, 倘若采用全部对比, 所需的 数据处理量巨大, 将会耗费大量的计算资源, 并且计算耗时也大幅提升。 发明内容 0004 本发明实施例提供了一种信息推荐方法、 装置、 计算机设备及存。
14、储介质, 旨在解决 现有聚类模型计算资源消耗大、 计算耗时长的问题。 0005 第一方面, 本发明实施例提供了一种信息推荐方法, 其包括: 0006 接收消费管理服务器发送的训练样本集合, 并将所述训练样本集合中的训练样本 输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合包含多个用户的消 费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端处获取的; 0007 分别获取每个所述类中距离所述类的类心最远的训练样本作为目标训练样本, 并 获取所述目标训练样本与所述类的类心的距离作为所述类的特征距离; 0008 将多个所述类划分为多个包含两个所述类的组, 其中, 任一。
15、所述类均与除自身外 的所有类组成组; 0009 若接收到待推荐用户终端发送的待测样本, 将所述待测样本输入所述聚类模型中 以分别获取所述待测样本与各所述类的类心的距离, 其中, 所述待测样本包含所述待推荐 用户终端的消费数据; 0010 从各所述类中筛选出特征类, 并从各所述组中筛选出特征组, 其中, 所述特征类的 类心与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两个类均为所述特征 类; 0011 根据所述待测样本与各所述特征组的特征类的距离以及所述特征组的特征类的 特征距离, 分别将所述待测样本聚类到各所述特征组的一所述特征类中; 0012 统计所述待测样本聚类到各所述特征组的。
16、特征类中的次数, 选取次数最高的特征 类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推荐用户终端推荐 信息。 说明书 1/14 页 5 CN 111445304 A 5 0013 第二方面, 本发明实施例还提供了一种信息推荐装置, 其包括: 0014 输入单元, 用于接收消费管理服务器发送的训练样本集合, 并将所述训练样本集 合中的训练样本输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合包 含多个用户的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端 处获取的; 0015 第一获取单元, 用于分别获取每个所述类中距离所述类的类心最远的训练。
17、样本作 为目标训练样本, 并获取所述目标训练样本与所述类的类心的距离作为所述类的特征距 离; 0016 划分单元, 用于将多个所述类划分为多个包含两个所述类的组, 其中, 任一所述类 均与除自身外的所有类组成组; 0017 第二获取单元, 用于若接收到待推荐用户终端发送的待测样本, 将所述待测样本 输入所述聚类模型中以分别获取所述待测样本与各所述类的类心的距离, 其中, 所述待测 样本包含所述待推荐用户终端的消费数据; 0018 筛选单元, 用于从各所述类中筛选出特征类, 并从各所述组中筛选出特征组, 其 中, 所述特征类的类心与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两 个类。
18、均为所述特征类; 0019 聚类单元, 用于根据所述待测样本与各所述特征组的特征类的距离以及所述特征 组的特征类的特征距离, 分别将所述待测样本聚类到各所述特征组的一所述特征类中; 0020 统计单元, 用于统计所述待测样本聚类到各所述特征组的特征类中的次数, 选取 次数最高的特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推 荐用户终端推荐信息。 0021 第三方面, 本发明实施例还提供了一种计算机设备, 其包括存储器及处理器, 所述 存储器上存储有计算机程序, 所述处理器执行所述计算机程序时实现上述方法。 0022 第四方面, 本发明实施例还提供了一种计算机可读存储介质。
19、, 所述存储介质存储 有计算机程序, 所述计算机程序当被处理器执行时可实现上述方法。 0023 本发明实施例提供了一种信息推荐方法、 装置、 计算机设备及存储介质。 其中, 所 述方法包括: 接收消费管理服务器发送的训练样本集合, 并将所述训练样本集合中的训练 样本输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合包含多个用户 的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端处获取的; 分别获取每个所述类中距离所述类的类心最远的训练样本作为目标训练样本, 并获取所述 目标训练样本与所述类的类心的距离作为所述类的特征距离; 将多个所述类划分为多个包 含两个所。
20、述类的组, 其中, 任一所述类均与除自身外的所有类组成组; 若接收到待推荐用户 终端发送的待测样本, 将所述待测样本输入所述聚类模型中以分别获取所述待测样本与各 所述类的类心的距离, 其中, 所述待测样本包含所述待推荐用户终端的消费数据; 从各所述 类中筛选出特征类, 并从各所述组中筛选出特征组, 其中, 所述特征类的类心与所述待测样 本的距离小于预设的距离阈值, 所述特征组包含的两个类均为所述特征类; 根据所述待测 样本与各所述特征组的特征类的距离以及所述特征组的特征类的特征距离, 分别将所述待 测样本聚类到各所述特征组的一所述特征类中; 统计所述待测样本聚类到各所述特征组的 特征类中的次数。
21、, 选取次数最高的特征类作为所述待测样本所属的类, 并根据所述待测样 说明书 2/14 页 6 CN 111445304 A 6 本所属的类为所述待推荐用户终端推荐信息。 本发明的技术方案, 通过从各类中筛选出特 征类可过滤掉大多数距离待测样本较远的特征组, 而只是计算一部分距离较近的特征组, 从而可以极大地降低了计算机的数据处理量, 提高了计算机的处理速度。 附图说明 0024 为了更清楚地说明本发明实施例技术方案, 下面将对实施例描述中所需要使用的 附图作简单地介绍, 显而易见地, 下面描述中的附图是本发明的一些实施例, 对于本领域普 通技术人员来讲, 在不付出创造性劳动的前提下, 还可以。
22、根据这些附图获得其他的附图。 0025 图1为本发明实施例提供的一种信息推荐方法的流程示意图; 0026 图2为本发明实施例提供的一种信息推荐方法的子流程示意图; 0027 图3为本发明实施例提供的一种信息推荐方法的子流程示意图; 0028 图4为本发明实施例提供的一种信息推荐方法的子流程示意图; 0029 图5为本发明实施例提供的一种信息推荐装置的示意性框图; 0030 图6为本发明实施例提供的一种信息推荐装置的第一获取单元的示意性框图; 0031 图7为本发明实施例提供的一种信息推荐装置的划分单元的示意性框图; 0032 图8为本发明实施例提供的一种信息推荐装置的聚类单元的示意性框图; 0。
23、033 图9为本发明实施例提供的一种信息推荐装置的第二标记单元的示意性框图; 0034 图10为本发明实施例提供的一种信息推荐装置的第二获取单元的示意性框图; 以 及 0035 图11为本发明实施例提供的一种计算机设备的示意性框图。 具体实施方式 0036 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。 基于本发 明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例, 都属于本发明保护的范围。 0037 应当理解, 当在本说明书和所附权利要求书中使用时, 。
24、术语 “包括” 和 “包含” 指示 所描述特征、 整体、 步骤、 操作、 元素和/或组件的存在, 但并不排除一个或多个其它特征、 整 体、 步骤、 操作、 元素、 组件和/或其集合的存在或添加。 0038 还应当理解, 在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目 的而并不意在限制本发明。 如在本发明说明书和所附权利要求书中所使用的那样, 除非上 下文清楚地指明其它情况, 否则单数形式的 “一” 、“一个” 及 “该” 意在包括复数形式。 0039 还应当进一步理解, 在本发明说明书和所附权利要求书中使用的术语 “和/或” 是 指相关联列出的项中的一个或多个的任何组合以及所有可能。
25、组合, 并且包括这些组合。 0040 如在本说明书和所附权利要求书中所使用的那样, 术语 “如果” 可以依据上下文被 解释为 “当.时” 或 “一旦” 或 “响应于确定” 或 “响应于检测到” 。 类似地, 短语 “如果确定” 或 “如果检测到所描述条件或事件” 可以依据上下文被解释为意指 “一旦确定” 或 “响应于确 定” 或 “一旦检测到所描述条件或事件” 或 “响应于检测到所描述条件或事件” 。 0041 请参阅图1, 图1是本发明实施例提供的信息推荐方法的流程示意图。 如图所示, 该 说明书 3/14 页 7 CN 111445304 A 7 方法包括以下步骤S1-S7。 本发明提出的。
26、信息推荐方法应用于推荐系统中的推荐服务器, 所 述推荐服务器还包括消费管理服务器以及用户终端。 0042 S1, 接收消费管理服务器发送的训练样本集合, 并将所述训练样本集合中的训练 样本输入到预设的聚类模型中以聚类得到多个类。 0043 其中, 所述训练样本集合包含多个用户的消费数据样本, 所述消费数据样本是由 所述消费管理服务器从多个用户终端处获取的。 0044 具体实施中, 接收消费管理服务器发送的训练样本集合, 训练样本集合包含多个 用户的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终端处获取 的。 0045 将获取到的训练样本集合中的训练样本输入到预设的聚类模型中。
27、以聚类得到多 个类。 具体地, 预设的聚类模型可以为KMeans聚类模型。 KMeans聚类模型是一种常用的用来 对样本进行聚类的模型。 通过将训练样本集合中的训练样本输入到KMeans聚类模型中进行 聚类后可得到聚类结果。 聚类结果包括类的数量, 各类的类心, 以及各类包含的训练样本的 数量等信息。 0046 S2, 分别获取每个所述类中距离所述类的类心最远的训练样本作为目标训练样 本, 并获取所述目标训练样本与所述类的类心的距离作为所述类的特征距离。 0047 具体实施中, 分别获取每个类中距离该类的类心最远的训练样本作为目标训练样 本, 并且获取该目标训练样本与该类的类心的距离作为该类的。
28、特征距离。 特征距离可用于 表征类的大小范围特征。 特征距离越大表明类的范围越大, 特征距离越小表明类的范围越 小。 0048 在一实施例中, 以上步骤S2包括以下步骤S21。 0049S21, 根据以下公式计算所述目标训练样本与所述类的类心的距 离d1, 其中, xi为类心的分量, yi为目标训练样本的分量, n为目标训练样本以及类心的维度。 0050具体实施中, 根据以下公式计算所述目标训练样本与所述类的 类心的距离d1, 其中, xi为类心的分量, yi为目标训练样本的分量, n为目标训练样本以及类 心的维度。 0051 S3, 将多个所述类划分为多个包含两个所述类的组, 其中, 任一所。
29、述类均与除自身 外的所有类组成组。 0052 具体实施中, 将多个类划分为多个包含两个类的组, 其中, 任一所述类均与除自身 外的所有类组成组。 例如, 在一实施例中, 总共有a、 b以及c三个类, 则可划分为(a, b)、 (b, c) 以及(a, c)三个组。 0053 参见图2, 在一实施例中, 以上步骤S3具体包括如下步骤S31-S35。 0054 S31, 获取一所述类作为目标类。 0055 具体实施中, 首先随机获取一所述类作为目标类。 例如, 在一实施例中, 总共有a、 b 以及c三个类, 随机选择a类作为目标类。 0056 S32, 分别将所述目标类与所述目标类之外的所有类组成。
30、组, 并对所述目标类进行 说明书 4/14 页 8 CN 111445304 A 8 标记。 0057 具体实施中, 分别将所述目标类与所述目标类之外的所有类组成组, 并对所述目 标类进行标记。 例如, 分别将a与b、 c组成组得到(a, b)和(a, c)两个组。 并且对a进行标记。 0058 S33, 判断是否存在未标记的类。 0059 具体实施中, 判断是否存在未标记的类。 0060 S34, 若存在未标记的类, 获取一未标记的类作为新的目标类, 并返回所述分别将 所述目标类与所述目标类之外的所有类组成组, 并对所述目标类进行标记的步骤。 0061 具体实施中, 如果存在未标记的类, 则。
31、获取一未标记的类作为新的目标类, 并返回 所述分别将所述目标类与所述目标类之外的所有类组成组, 并对所述目标类进行标记。 例 如, 随机选择b作为新的目标类, 并分别将b与a、 c组成组得到(a, b)和(b, c)两个组。 并且对b 进行标记。 0062 进一步地, 随机选择c作为新的目标类, 并分别将c与a、 b组成组得到(a, c)和(b, c) 两个组。 并且对c进行标记。 0063 S35, 若不存在未标记的类, 将所有组中重复的组删除。 0064 具体实施中, 若不存在未标记的类, 则将通过以上步骤所得到的所有组中重复的 组删除。 例如, 总共得到(a, b)、 (a, c)、 (。
32、a, b)、 (b, c)、 (a, c)以及(b, c)六个组, 再将其中重复 的组删除, 最后得到(a, b)、 (b, c)以及(a, c)三个组。 0065 S4, 若接收到待推荐用户终端发送的待测样本, 将所述待测样本输入所述聚类模 型中以分别获取所述待测样本与各所述类的类心的距离。 0066 其中, 所述待测样本包含所述待推荐用户终端的消费数据。 消费数据包括如消费 商户、 消费商品、 消费金额以及消费时间等信息。 0067 具体实施中, 如果接收到待测样本, 将所述待测样本输入所述聚类模型, 聚类模型 将所述待测样本转换为一向量, 然后再分别计算该待测样本与各所述类的类心的距离。。
33、 0068 在一实施例中, 以上步骤S4包括以下步骤S41。 0069S41, 根据以下公式计算所述待测样本与所述类的类心的距离 d2, 其中xi为类心的分量, zi为目标训练样本的分量, n为目标训练样本以及类心的维度。 0070具体实施中, 根据以下公式计算所述待测样本与所述类的类心 的距离d2, 其中xi为类心的分量, zi为目标训练样本的分量, n为目标训练样本以及类心的维 度。 0071 S5, 从各所述类中筛选出特征类, 并从各所述组中筛选出特征组。 0072 其中, 所述特征类的类心与所述待测样本的距离小于预设的距离阈值, 所述特征 组包含的两个类均为所述特征类。 0073 具体。
34、实施中, 从各所述类中筛选出特征类, 并从各所述组中筛选出特征组。 需要说 明的是, 特征类的类心与待测样本的距离小于预设的距离阈值。 距离阈值可由本领域技术 人员根据经验进行设定, 本发明对此不作具体限定。 进一步地, 特征组包含的两个类均为特 征类。 说明书 5/14 页 9 CN 111445304 A 9 0074 通过以上步骤S5可过滤掉大多数距离待测样本较远的特征组, 从而极大地降低了 计算机的数据处理量, 提高了计算机的处理速度。 0075 S6, 根据所述待测样本与各所述特征组的特征类的距离以及所述特征组的特征类 的特征距离, 分别将所述待测样本聚类到各所述特征组的一所述特征类。
35、中。 0076 具体实施中, 对于每一个特征组, 均根据所述待测样本与该特征组的类的距离以 及该特征组的类的特征距离, 将所述待测样本聚类到该特征组的一所述类中。 0077 参见图3, 在一实施例中, 以上步骤S5具体包括以下步骤S51-S55。 0078 S51, 获取一所述特征组作为目标组。 0079 具体实施中, 可采用随机方式获取一所述特征组作为目标组。 例如, 在一实施例 中, 包含(a, b)、 (b, c)以及(a, c)三个组。 随机选择(a, b)为目标组。 0080 S52, 根据所述待测样本与所述目标组的类的距离以及所述目标组的类的特征距 离, 将所述待测样本聚类到所述目。
36、标组的一所述类中, 并对所述目标组进行标记。 0081 具体实施中, 根据所述待测样本与所述目标组的类的距离以及所述目标组的类的 特征距离, 将所述待测样本聚类到所述目标组的一所述类中, 并对所述目标组进行标记。 例 如, 在一实施例中, 将待测样本聚类到(a, b)中的a中。 并对(a, b)进行标记。 0082 参见图4, 在一实施例中, 所述目标组包含的两个类分别为第一类和第二类, 以上 步骤S52包括以下步骤: S521-S523。 0083 S521, 判断第一比值是否大于第二比值, 其中, 所述第一比值为所述待测样本与所 述第一类的类心的距离与所述待测样本与所述第二类的类心的距离的。
37、比值, 所述第二比值 为所述第一类的特征距离与所述第二类的特征距离的比值。 0084 具体实施中, 计算所述待测样本与所述第一类的类心的距离与所述待测样本与所 述第二类的类心的距离的比值r1, r1即为第一比值; 以及计算所述第一类的特征距离与所述 第二类的特征距离的比值r2, r2即为第二比值。 之后, 判断r1是否大于r2。 0085 S522, 若所述第一比值大于所述第二比值, 判定所述待测样本聚类到所述第一类 中。 0086 具体实施中, 如果r1大于r2, 则判定所述待测样本聚类到所述第一类中。 0087 S523, 若所述第一比值不大于所述第二比值, 判定所述待测样本聚类到所述第二。
38、 类中。 0088 具体实施中, 如果r1不大于r2, 则判定所述待测样本聚类到所述第二类中。 0089 S53, 判断是否存在未标记的特征组。 0090 具体实施中, 判断是否存在未标记的特征组。 0091 S54, 若存在未标记的特征组, 获取一未标记的特征组作为新的目标组, 并返回所 述根据所述待测样本与所述目标组的类的距离以及所述目标组的类的特征距离, 将所述待 测样本聚类到所述目标组的一所述类中, 并对所述目标组进行标记的步骤。 0092 具体实施中, 如果存在未标记的特征组, 获取一未标记的特征组作为新的目标组, 并返回所述根据所述待测样本与所述目标组的类的距离以及所述目标组的类的。
39、特征距离, 将所述待测样本聚类到所述目标组的一所述类中, 并对所述目标组进行标记的步骤。 例如, 在一实施例中, 随机获取(a, c)为新的目标组, 并将待测样本聚类到(a, c)中的a中。 并对(a, c)进行标记。 说明书 6/14 页 10 CN 111445304 A 10 0093 进一步地, 获取(b, c)为新的目标组, 并将待测样本聚类到(b, c)中的b中。 并对(b, c)进行标记。 0094 S55, 若不存在未标记的组, 转到步骤S6。 0095 具体实施中, 如果不存在未标记的组, 转到以下步骤S6。 0096 S7, 统计所述待测样本聚类到各所述特征组的特征类中的次。
40、数, 选取次数最高的 特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推荐用户终端 推荐信息。 0097 具体实施中, 统计在步骤S5中, 所述待测样本聚类到各所述特征组的特征类中的 次数, 选取次数最高的特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类 为所述待推荐用户终端推荐信息。 0098 例如, 在一实施例中, 总共包含三个特征类, 其分别为a、 b以及c。 待测样本聚类到 各所述特征类中的次数分别为a为2次, b为1次, c为0次, 则选取a作为所述待测样本所属的 类。 通过选取次数最高的特征类作为所述待测样本所属的类, 能够保证在对待测样本进行 聚类。
41、时(即将聚类模型进行泛化), 充分考虑了类的大小范围信息(即类的特征距离), 保证 了在待测样本上进行泛化时每个类的分布与训练模型时得到的分布一致, 从而提高了对新 待推荐用户进行聚类的准确性, 进而提高了信息推荐的准确性。 0099 进一步地, 根据所述待测样本所属的类为所述待推荐用户终端推荐信息。 具体地, 统计所述待测样本所属的类的用户所购买的商品, 并按照商品的购买次数由高到低的顺序 筛选出预设数量(例如, 预设数量为5)的商品作为推荐商品, 并将获取的推荐商品的商品信 息推荐给待推荐用户终端。 0100 本发明的技术方案, 接收消费管理服务器发送的训练样本集合, 并将所述训练样 本集。
42、合中的训练样本输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集 合包含多个用户的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户 终端处获取的; 分别获取每个所述类中距离所述类的类心最远的训练样本作为目标训练样 本, 并获取所述目标训练样本与所述类的类心的距离作为所述类的特征距离; 将多个所述 类划分为多个包含两个所述类的组, 其中, 任一所述类均与除自身外的所有类组成组; 若接 收到待推荐用户终端发送的待测样本, 将所述待测样本输入所述聚类模型中以分别获取所 述待测样本与各所述类的类心的距离, 其中, 所述待测样本包含所述待推荐用户终端的消 费数据; 从各所述。
43、类中筛选出特征类, 并从各所述组中筛选出特征组, 其中, 所述特征类的 类心与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两个类均为所述特征 类; 根据所述待测样本与各所述特征组的特征类的距离以及所述特征组的特征类的特征距 离, 分别将所述待测样本聚类到各所述特征组的一所述特征类中; 统计所述待测样本聚类 到各所述特征组的特征类中的次数, 选取次数最高的特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待推荐用户终端推荐信息。 本发明的技术方案, 通过 从各类中筛选出特征类可过滤掉大多数距离待测样本较远的特征组, 而只是计算一部分距 离较近的特征组, 从而可以极大地。
44、降低了计算机的数据处理量, 提高了计算机的处理速度。 0101 图5是本发明实施例提供的一种信息推荐装置60的示意性框图。 如图5所示, 对应 于以上信息推荐方法, 本发明还提供一种信息推荐装置60。 该信息推荐装置60包括用于执 行上述信息推荐方法的单元, 该装置60可以被配置于台式电脑、 平板电脑、 手提电脑、 等终 说明书 7/14 页 11 CN 111445304 A 11 端中。 具体地, 请参阅图5, 该信息推荐装置60包括输入单元61、 第一获取单元62、 划分单元 63、 第二获取单元64、 筛选单元65、 聚类单元66以及统计单元67。 0102 输入单元61, 用于接收消。
45、费管理服务器发送的训练样本集合, 并将所述训练样本 集合中的训练样本输入到预设的聚类模型中以聚类得到多个类, 其中, 所述训练样本集合 包含多个用户的消费数据样本, 所述消费数据样本是由所述消费管理服务器从多个用户终 端处获取的; 0103 第一获取单元62, 用于分别获取每个所述类中距离所述类的类心最远的训练样本 作为目标训练样本, 并获取所述目标训练样本与所述类的类心的距离作为所述类的特征距 离; 0104 划分单元63, 用于将多个所述类划分为多个包含两个所述类的组, 其中, 任一所述 类均与除自身外的所有类组成组; 0105 第二获取单元64, 用于若接收到待推荐用户终端发送的待测样本。
46、, 将所述待测样 本输入所述聚类模型中以分别获取所述待测样本与各所述类的类心的距离, 其中, 所述待 测样本包含所述待推荐用户终端的消费数据; 0106 筛选单元65, 用于从各所述类中筛选出特征类, 并从各所述组中筛选出特征组, 其 中, 所述特征类的类心与所述待测样本的距离小于预设的距离阈值, 所述特征组包含的两 个类均为所述特征类; 0107 聚类单元66, 用于根据所述待测样本与各所述特征组的特征类的距离以及所述特 征组的特征类的特征距离, 分别将所述待测样本聚类到各所述特征组的一所述特征类中; 0108 统计单元67, 用于统计所述待测样本聚类到各所述特征组的特征类中的次数, 选 取。
47、次数最高的特征类作为所述待测样本所属的类, 并根据所述待测样本所属的类为所述待 推荐用户终端推荐信息。 0109 在一实施例中, 如图6所示, 所述第一获取单元62包括第一计算单元621。 0110第一计算单元621, 用于根据以下公式计算所述目标训练样本与 所述类的类心的距离d1, 其中, xi为类心的分量, yi为目标训练样本的分量, n为目标训练样 本以及类心的维度。 0111 在一实施例中, 如图7所示, 所述划分单元63包括第三获取单元631、 第一标记单元 632、 第一判断单元633、 第一返回单元634以及删除单元635。 0112 第三获取单元631, 用于获取一所述类作为目。
48、标类; 0113 第一标记单元632, 用于分别将所述目标类与所述目标类之外的所有类组成组, 并 对所述目标类进行标记; 0114 第一判断单元633, 用于判断是否存在未标记的类; 0115 第一返回单元634, 用于若存在未标记的类, 获取一未标记的类作为新的目标类, 并返回所述分别将所述目标类与所述目标类之外的所有类组成组, 并对所述目标类进行标 记的步骤; 0116 删除单元635, 用于若不存在未标记的类, 将所有组中重复的组删除。 0117 在一实施例中, 如图8所示, 所述聚类单元66包括第四获取单元651、 第二标记单元 652、 第二判断单元653以及第二返回单元654。 说。
49、明书 8/14 页 12 CN 111445304 A 12 0118 第四获取单元651, 用于获取一所述特征组作为目标组。 0119 第二标记单元652, 用于根据所述待测样本与所述目标组的类的距离以及所述目 标组的类的特征距离, 将所述待测样本聚类到所述目标组的一所述类中, 并对所述目标组 进行标记; 0120 第二判断单元653, 用于判断是否存在未标记的特征组。 0121 第二返回单元654, 用于若存在未标记的特征组, 获取一未标记的特征组作为新的 目标组, 并返回所述根据所述待测样本与所述目标组的类的距离以及所述目标组的类的特 征距离, 将所述待测样本聚类到所述目标组的一所述类中。
50、, 并对所述目标组进行标记的步 骤。 0122 在一实施例中, 如图9所示, 所述第二标记单元652包括第三判断单元6521、 第一判 定单元6522以及第二判定单元6523。 0123 第三判断单元6521, 用于判断第一比值是否大于第二比值, 其中, 所述第一比值为 所述待测样本与所述第一类的类心的距离与所述待测样本与所述第二类的类心的距离的 比值, 所述第二比值为所述第一类的特征距离与所述第二类的特征距离的比值; 0124 第一判定单元6522, 用于若所述第一比值大于所述第二比值, 判定所述待测样本 聚类到所述第一类中; 0125 第二判定单元6523, 用于若所述第一比值不大于所述第。
- 内容关键字: 信息 推荐 方法 装置 计算机 设备 存储 介质
相机模块.pdf
具有防堵机构的浆水处理用滤筛装置.pdf
打包设备.pdf
可回收动脉瘤辅助支架及输送系统.pdf
电梯井道相邻房间的复合隔声墙体构造.pdf
灯具的免接电线的导电铜片触点结构.pdf
管式反应器.pdf
陶瓷纤维管.pdf
留孔装置.pdf
冲压机用的送料机构.pdf
玻璃装饰条组装装置.pdf
电缆抗拉强度检测装置.pdf
电网建设的架线机.pdf
家电玻璃多向磨边机.pdf
用于土壤肥料的均匀泼洒机构.pdf
漏电电流检测仪及防护组件.pdf
洁净室多重复合杀菌过滤风口结构.pdf
纸垛自动整理装置.pdf
有机废气、有机废液及烟气的协同处理系统.pdf
铜锭抛光用夹具.pdf
指纹取景器.pdf
新型电动自楔式安全制动器.pdf
新型血糖试纸盒.pdf
中远距离传输零中频接收机电路.pdf
纳米铁强化磺胺废水厌氧消化的方法.pdf
鱼缸除垢机器人.pdf
可变形手持便携式三防平板电脑.pdf
步进电机散热方法、系统及介质.pdf
建筑施工降尘设备.pdf
防水防潮型家用可燃气体探测器.pdf
基于物联网的智能实验室安全管理策略确定方法及装置.pdf
基于双边带光频梳的快速布里渊光学时域分析仪.pdf
水性环氧石墨烯防腐底漆的制备方法.pdf
一种建筑物防火涂料.pdf
均三氮苯化合物.pdf
气压扰动搅拌的水压式沼气发酵系统.pdf
一种低气味抗甲醛内墙乳胶漆及其制备方法.pdf
一种葡萄酒制备机的葡萄分筛机构.pdf
一种用于酿酒的新型电动加热搅拌罐.pdf
一种微波辅助亚临界水萃取紫甘薯红色素的方法.pdf
便携式磁化酒装置.pdf
一种高压配电柜.pdf
抗鼠神经生长因子(NGF)的多克隆抗体的制备方法及其应用.pdf
一种除醛剂.pdf
吡唑衍生物的生产方法.pdf
一种组合物、液晶显示装置及其制备方法.pdf
一种白酒蒸馏用甑桶.pdf
一种添加异丙醇松香树脂油墨组合物.pdf
直接绿/ZnO核壳结构纳米复合材料的制备方法.pdf
一种用于检测食品中细菌的探针和试剂盒.pdf
一种低碱值磺酸钙盐的制备方法.pdf