书签 分享 收藏 举报 版权申诉 / 24

基于用户模型演进的推荐装置和方法.pdf

  • 上传人:大师****2
  • 文档编号:2239409
  • 上传时间:2018-08-03
  • 格式:PDF
  • 页数:24
  • 大小:1.50MB
  • 摘要
    申请专利号:

    CN201410007167.0

    申请日:

    2014.01.07

    公开号:

    CN104765752A

    公开日:

    2015.07.08

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):G06F 17/30申请日:20140107|||公开

    IPC分类号:

    G06F17/30

    主分类号:

    G06F17/30

    申请人:

    三星电子(中国)研发中心; 三星电子株式会社

    发明人:

    方芳; 谢瑀; 何亮

    地址:

    210061江苏省南京市高新区高新研发大厦9~12层

    优先权:

    专利代理机构:

    北京铭硕知识产权代理有限公司11286

    代理人:

    张川绪; 张云珠

    PDF完整版下载: PDF下载
    内容摘要

    公开了一种基于用户模型演进的推荐装置和方法。所述装置推荐包括:用户模型建模单元,被配置为从一个或多个客户端装置接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型;演进模式分析单元,被配置为对每个用户的用户模型随时间的演进模式进行分析;推荐内容生成单元,被配置基于演进模式分析单元的分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置,其中,所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据,其中,所述演进模式表示用户在不同时间段的兴趣偏好的变化。

    权利要求书

    1.  一种基于用户模型演进的推荐装置,所述装置包括:
    用户模型建模单元,被配置为从一个或多个客户端装置接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型;
    演进模式分析单元,被配置为对每个用户的用户模型随时间的演进模式进行分析;
    推荐内容生成单元,被配置基于演进模式分析单元的分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置,
    其中,所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据,
    其中,所述演进模式表示用户在不同时间段的兴趣偏好的变化。

    2.
      如权利要求1所述的推荐装置,其中,所述用户模型建模单元包括:
    日志信息存储模块,被配置为存储从客户端装置接收的用户日志信息;
    建模模块,被配置为从日志信息存储模块获取由日志信息存储模块在特定时间段内存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型;
    用户模型存储模块,被配置为存储为每个用户建立的用户模型。

    3.
      如权利要求1所述的推荐系统,其中,所述演进模式分析单元包括:
    演进模式分析模块,被配置为使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析;
    演进分析结果存储模块,被配置为存储演进模式分析模块的分析结果。

    4.
      如权利要求1所述的推荐系统,其中,所述推荐内容生成单元包括:
    预测模块,被配置为在演进分析结果存储模块中搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测结果相应的推荐内容;
    推荐内容存储模块,被配置为存储与预测结果相应的推荐内容;
    推荐内容同步模块,被配置为将存储的与预测结果相应的推荐内容发送 给目标用户的客户端装置。

    5.
      如权利要求2所述的推荐系统,其中,如果客户端装置收集的原始格式的用户日志信息被所述客户端装置转换为可传输格式之后发送到推荐装置,则所述用户模型建模单元还包括:
    日志同步模块,被配置为将从客户端装置接收的可传输格式的用户日志信息转换回原始格式的用户日志信息,并将原始格式的用户日志信息存储在日志信息存储模块中。

    6.
      如权利要求2或5所述的推荐系统,其中,所述用户模型建模单元还包括:
    数据提取模块,被配置为基于建模需求对获取的所述特定时间段的用户日志信息中的数据进行处理,并将经过处理的数据提供给建模模块进行建模。

    7.
      如权利要求5所述的推荐系统,其中,所述可传输格式为json字符串格式。

    8.
      如权利要求2所述的推荐系统,其中,所述建模模块使用Ontology方法为用户建立用户模型。

    9.
      如权利要求3所述的推荐系统,其中,所述演进模式分析模块使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。

    10.
      如权利要求4所述的推荐系统,其中,所述预测模块使用最长路径匹配算法来确定与目标用户具有最相似的用户模型演进模式的用户。

    11.
      如权利要求2所述的推荐系统,其中,所述建模模块被配置为每隔预定时间段从日志信息存储模块获取在所述预定时间段内由日志信息存储模块存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型,从而为每个用户建立针对不同时间段的多个用户模型。

    12.
      一种客户端装置,所述客户端装置包括:
    用户日志提交单元,被配置为收集使用所述客户端装置的用户的用户日志信息,并将收集的用户日志信息发送到推荐装置;
    推荐内容接收单元,被配置为从推荐装置接收推荐内容;
    其中,所述推荐装置基于从一个或多个客户端装置接收的用户日志信息为每个客户端装置的用户建立用户模型,对每个用户的用户模型随时间的演 进模式进行分析,基于分析结果来预测每个用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给每个用户的客户端装置,
    其中,所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据,
    其中,所述演进模式表示用户在不同时间段的兴趣偏好的变化。

    13.
      如权利要求1所述的客户端装置,其中,所述用户日志提交单元将收集的用户日志信息转换为可传输格式之后发送到推荐装置。

    14.
      一种基于用户模型演进的推荐系统,所述系统包括:
    一个或多个客户端装置,被配置为收集使用客户端装置的用户的用户日志信息并从推荐装置接收推荐内容;
    推荐装置,被配置为从所述一个或多个客户端装置接收用户日志信息,基于接收的每个客户端装置的用户的用户日志信息为每个用户建立用户模型,对每个用户的用户模型随时间的演进模式进行分析,基于分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置,
    其中,所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据,
    其中,所述演进模式表示用户在不同时间段的兴趣偏好的变化。

    15.
      一种基于用户模型演进的推荐方法,所述方法包括:
    由推荐装置从一个或多个客户端装置接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型;
    由推荐装置对每个用户的用户模型随时间的演进模式进行分析;
    由推荐装置根据分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置,
    其中,所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据,
    其中,所述演进模式表示用户在不同时间段的兴趣偏好的变化。

    16.
      如权利要求15所述的推荐方法,其中,建立用户模型的步骤包括:
    存储从客户端装置接收的用户日志信息;
    获取推荐装置在特定时间段内接收并存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型;
    存储为每个用户建立的用户模型。

    17.
      如权利要求15所述的推荐方法,分析演进模式的步骤包括:
    使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析;
    存储分析结果。

    18.
      如权利要求15所述的推荐方法,其中,产生推荐内容的步骤包括:
    在所述分析结果中搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测结果相应的推荐内容;
    存储与预测结果相应的推荐内容;
    将存储的与预测结果相应的推荐内容发送给目标用户的客户端装置。

    19.
      如权利要求16所述的推荐方法,其中,如果客户端装置收集的原始格式的用户日志信息在被客户端装置转换为可传输格式之后发送到推荐装置,则推荐装置在接收到可传输格式的用户日志信息之后,将可传输格式的用户日志信息转换回原始格式的用户日志信息,并存储原始格式的用户日志信息。

    20.
      如权利要求16或19所述的推荐方法,其中,建立用户模型的步骤还包括:
    基于建模需求对获取的所述特定时间段的用户日志信息中的数据进行处理,以使用经过处理的数据进行建模。

    21.
      如权利要求19所述的推荐方法,其中,所述可传输格式为json字符串格式。

    22.
      如权利要求16所述的推荐方法,其中,使用Ontology方法为用户建立用户模型。

    23.
      如权利要求17所述的推荐方法,其中,分析演进模式的步骤使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。

    24.
      如权利要求18所述的推荐方法,其中,使用最长路径匹配算法来确 定与目标用户具有最相似的用户模型演进模式的用户。

    25.
      如权利要求16所述的推荐方法,其中,建立用户模型的步骤包括:每隔预定时间段获取在所述预定时间段内在推荐装置中接收并存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型,从而为每个用户建立针对不同时间段的多个用户模型。

    说明书

    基于用户模型演进的推荐装置和方法
    技术领域
    本申请涉及一种推荐装置和方法,更具体地讲,涉及一种基于用户模型演进的个性化推荐装置和方法。
    背景技术
    随着互联网技术的迅速发展,互联网上能够使用的服务数量急剧增加,人们在海量数据中寻找感兴趣的信息变得越发困难。因此,需要一种可根据每个用户的不同兴趣偏好,在用户进行搜索或网络浏览时为该用户推荐相应内容(例如,网页)的方法,从而为用户提供有针对性的个性化推荐服务。
    现有的个性化推荐方法主要包括两种:内容推荐方法和协同过滤方法。基于内容的推荐方法适用于内容类别便于分辨和标注的情况。协同过滤方法通常基于用户历史数据,以用户对产品和/或服务的评价为基础向目标用户推荐其潜在感兴趣的产品和/或服务。
    然而,现有的方法均是针对历史数据进行用户建模,并根据用户的历史和/或现有的兴趣偏好或行为进行推荐,这样只能反映出用户过去或已经存在的兴趣或行为模式,而没有考虑到用户的兴趣或行为的未来发展趋势。此外,现有的个性化推荐方法对于时间因素的考虑均是针对用户建模过程进行的,而并未将其扩展到对用户未来的兴趣或行为趋势的预测上。
    发明内容
    根据本发明的一方面,提供了一种基于用户模型演进的推荐装置,所述装置包括:用户模型建模单元,被配置为从一个或多个客户端装置接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型;演进模式分析单元,被配置为对每个用户的用户模型随时间的演进模式进行分析;推荐内容生成单元,被配置基于演进模式分析单元的分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置。所述用户日 志信息可包括用户使用互联网时关于用户浏览行为的数据。所述演进模式可表示用户在不同时间段的兴趣偏好的变化。
    所述用户模型建模单元可包括:日志信息存储模块,被配置为存储从客户端装置接收的用户日志信息;建模模块,被配置为从日志信息存储模块获取由日志信息存储模块在特定时间段内存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型;用户模型存储模块,被配置为存储为每个用户建立的用户模型。
    所述演进模式分析单元可包括:演进模式分析模块,被配置为使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析;演进分析结果存储模块,被配置为存储演进模式分析模块的分析结果。
    所述推荐内容生成单元可包括:预测模块,被配置为在演进分析结果存储模块中搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测结果相应的推荐内容;推荐内容存储模块,被配置为存储与预测结果相应的推荐内容;推荐内容同步模块,将存储的与预测结果相应的推荐内容发送给目标用户的客户端装置。
    如果客户端装置收集的原始格式的用户日志信息被所述客户端装置转换为可传输格式之后发送到推荐装置,则所述用户模型建模单元还可包括:日志同步模块,被配置为将从客户端装置接收的可传输格式的用户日志信息转换回原始格式的用户日志信息,并将原始格式的用户日志信息存储在日志信息存储模块中。
    所述用户模型建模单元还可包括:数据提取模块,被配置为基于建模需求对获取的所述特定时间段的用户日志信息中的数据进行处理,并将经过处理的数据提供给建模模块进行建模。
    所述可传输格式可以为json字符串格式。
    所述建模模块可使用Ontology方法为用户建立用户模型。
    所述演进模式分析模块可使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。
    所述预测模块可使用最长路径匹配算法来确定与目标用户具有最相似的 用户模型演进模式的用户。
    所述建模模块可被配置为每隔预定时间段从日志信息存储模块获取在所述预定时间段内由日志信息存储模块存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型,从而为每个用户建立针对不同时间段的多个用户模型。
    根据本发明的另一方面,提供了一种客户端装置,所述客户端装置包括:用户日志提交单元,被配置为收集使用所述客户端装置的用户的用户日志信息,并将收集的用户日志信息发送到推荐装置;推荐内容接收单元,被配置为从推荐装置接收推荐内容;其中,所述推荐装置基于从一个或多个客户端装置接收的用户日志信息为每个客户端装置的用户建立用户模型,对每个用户的用户模型随时间的演进模式进行分析,基于分析结果来预测每个用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给每个用户的客户端装置。所述用户日志信息可包括用户使用互联网时关于用户浏览行为的数据。所述演进模式可表示用户在不同时间段的兴趣偏好的变化。
    所述用户日志提交单元可将收集的用户日志信息转换为可传输格式之后发送到推荐装置。
    根据本发明的另一方面,提供了一种基于用户模型演进的推荐系统,所述系统包括:一个或多个客户端装置,被配置为收集使用客户端装置的用户的用户日志信息并从推荐装置接收推荐内容;推荐装置,被配置为从所述一个或多个客户端装置接收用户日志信息,基于接收的每个客户端装置的用户的用户日志信息为每个用户建立用户模型,对每个用户的用户模型随时间的演进模式进行分析,基于分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置。所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据。所述演进模式表示用户在不同时间段的兴趣偏好的变化。
    根据本发明的另一方面,提供了一种基于用户模型演进的推荐方法,所述方法包括:由推荐装置从一个或多个客户端装置接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型;由推荐装置对每个用户的用户模型随时间的演进模式进行分析;由推荐装置根据分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐 内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置。所述用户日志信息包括用户使用互联网时关于用户浏览行为的数据。所述演进模式表示用户在不同时间段的兴趣偏好的变化。
    建立用户模型的步骤可包括:存储从客户端装置接收的用户日志信息;获取推荐装置在特定时间段内接收并存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型;存储为每个用户建立的用户模型。
    分析演进模式的步骤可包括:使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析;存储分析结果。
    产生推荐内容的步骤可包括:在所述分析结果中搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测结果相应的推荐内容;存储与预测结果相应的推荐内容;将存储的与预测结果相应的推荐内容发送给目标用户的客户端装置。
    如果客户端装置收集的原始格式的用户日志信息在被客户端装置转换为可传输格式之后发送到推荐装置,则推荐装置可在接收到可传输格式的用户日志信息之后,将可传输格式的用户日志信息转换回原始格式的用户日志信息,并存储原始格式的用户日志信息。
    建立用户模型的步骤还可包括:基于建模需求对获取的所述特定时间段的用户日志信息中的数据进行处理,以使用经过处理的数据进行建模。
    所述可传输格式可以为json字符串格式。
    可使用Ontology方法为用户建立用户模型。
    分析演进模式的步骤可使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。
    可使用最长路径匹配算法来确定与目标用户具有最相似的用户模型演进模式的用户。
    建立用户模型的步骤可包括:每隔预定时间段获取在所述预定时间段内在推荐装置中接收并存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型,从而为每个用户建立针对不同 时间段的多个用户模型。
    有益效果
    通过应用本发明的方法,能够通过利用与目标用户具有相同或相似的用户模型演进模式的用户的信息来预测目标用户未来的兴趣偏好或行为模式,并将与预测结果相应的推荐内容提供给目标用户,因此能够获得更可靠的个性化推荐结果。此外,本发明考虑时间因素对用户兴趣度的影响,并且使用对用户未来的兴趣偏好或行为模式的预测进行推荐,因此能够获得更具前瞻性和可信性的推荐结果。
    附图说明
    通过下面结合本发明的示例性实施例对附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
    图1是示出根据本发明的示例性实施例的基于用户模型演进的推荐系统的框图;
    图2是示出根据本发明的示例性实施例的基于用户模型演进的推荐装置的详细框图;
    图3是示出根据本发明的示例性实施例的建模模块的操作的示例流程图;
    图4是示出根据本发明的另一示例性实施例的基于用户模型演进的推荐系统中的用户模型建模单元的配置的示例;
    图5是示出根据本发明的示例性实施例的演进模式分析模块的操作的示例流程图;
    图6是示出根据本发明的实施例的表现用户模型随时间的演进模式的示例;
    图7是示出根据本发明的示例性实施例的预测模块的预测操作的示例流程图;
    图8是示出根据本发明的示例性实施例的基于用户模型演进的推荐方法的流程图。
    贯穿附图和详细说明,除非另有描述,否则相同的附图标号将被理解为是指相同的元件、特征和结构。
    具体实施方式
    提供以下参照附图进行的描述以帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。所述描述包括各种特定细节以帮助理解,但这些细节被认为仅是示例性的。因此,本领域的普通技术人员将认识到:在不脱离本发明的范围和精神的情况下,可对这里描述的实施例进行各种改变和修改。此外,为了清楚和简明,可省略已知功能和构造的描述。
    除非另有定义,否则这里使用的所有术语(包括技术和科学术语)具有与示例性实施例所属领域的普通技术人员通常理解的含义相同的含义。还应该理解,除非这里明确定义,否则术语(诸如在常用词典中定义的术语)应被解释为具有与所述术语在相关领域的上下文中的含义一致的含义,而不应理想化或过于正式地被理解。
    图1是示出根据本发明的示例性实施例的基于用户模型演进的推荐系统10的框图。
    参照图1,根据本发明的实施例的基于用户模型演进的推荐系统10可包括一个或多个客户端装置100和基于用户模型演进的推荐装置200。尽管在图1中仅示出一个客户端装置100,但应该理解,这仅是为了便于描述而示出的示例,本发明的推荐系统10可包括更多个客户端装置100。本发明的推荐装置200可以是网络中的服务器。
    客户端装置100可被配置为收集使用客户端装置100的用户的用户日志信息并从推荐装置200接收推荐内容。在本发明中,用户日志信息可包括关于用户使用互联网时的行为的数据,即,用户使用互联网时关于用户浏览行为的数据。
    推荐装置200可被配置为从客户端装置100接收用户日志信息,基于接收的每个客户端装置的用户的用户日志信息为每个用户建立用户模型,对每个用户的用户模型随时间的演进模式进行分析,基于分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置100。在本发明中,演进模式用于表示用户在不同时间段的兴趣偏好或行为的变化。
    如图1中所示,在本发明的实施例中,客户端装置100可包括用户日志提交单元110和推荐内容接收单元120。用户日志提交单元110可被配置为收 集使用所述客户端装置的用户的用户日志信息,并将收集的用户日志信息发送到推荐装置200,推荐内容接收单元120可被配置为从推荐装置200接收推荐内容。收集用户日志信息的方法对于本领域技术人员而言是已知的,因此为了简明将省略其详细描述。此外,在本发明中,由用户日志提交单元110收集的用户日志信息可能不适合于被直接发送到推荐装置200,因此用户日志提交单元110可将收集的用户日志信息转换为可传输格式之后发送到推荐装置200。所述可传输格式可以是json字符串格式,并且经过转换的用户日志信息可通过http协议被发送到推荐装置200。
    参照图1,根据本发明的实施例的推荐装置200可包括用户模型建模单元210、演进模式分析单元220和推荐内容生成单元230。
    在当前实施例中,用户模型建模单元210可被配置为从一个或多个客户端装置100接收用户日志信息,并基于每个客户端装置的用户的用户日志信息,为每个用户建立用户模型。演进模式分析单元220可被配置为对每个用户的用户模型随时间的演进模式(即,用户模型演进模式)进行分析。推荐内容生成单元230可被配置为基于演进模式分析单元220的分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置。
    以下将结合图2至图6详细描述本发明的基于用户模型演进的推荐系统100的配置。
    图2是示出根据本发明的示例性实施例的基于用户模型演进的推荐装置200的详细框图。
    图2中示出的客户端装置100中的用户日志提交单元110和推荐内容接收单元120的功能和操作与图1中示出的用户日志提交单元110和推荐内容接收单元120的功能和操作相同,因此将省略其详细描述。
    参照图2,推荐装置200中的用户模型建模单元210可包括日志信息存储模块211、建模模块212和用户模型存储模块213。
    日志信息存储模块211可被配置为存储从客户端装置100接收的用户日志信息。建模模块212可被配置为从日志信息存储模块211获取由日志信息存储模块211在特定时间段内存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型。用户模型存储模块213可被配置为存储为每个用户建立的用户模型。
    在本发明的实施例中,建模模块212可每隔预定时间段从日志信息存储模块211获取在所述预定时间段内由日志信息存储模块211存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型。通过这种方式,建模模块212可为每个用户建立针对不同时间段的多个用户模型。
    以下将结合图3详细描述使用本发明的建模模块212建立用户模型的操作。
    图3是示出根据本发明的示例性实施例的建模模块212的操作的示例流程图。在当前实施例中,仅作为示例,所述建模模块212可使用Ontology方法为所有的用户建立用户模型。
    在步骤301,所述建模模块212可从日志信息存储模块211中获取由日志信息存储模块211在特定时间段内存储的用户的用户日志信息(例如,从3个月前到目前为止这段时间存储到日志信息存储模块211的用户日志信息),从获取的用户日志信息中提取该用户的偏好,并为该用户建立基于用户行为的用户描述文件。
    在本发明中,可使用机器学习的方法来建立所述用户描述文件。所述用户描述文件可包括用户浏览期间涉及的关键字和与每个关键字相应的权值。
    仅作为示例,使用机器学习的方法建立用户描述文件,主要是对关键字的处理。关键字可分为机器新学习到的关键字和用户描述文件中已经存在的关键字两种。具体地讲,可首先抽取用户的用户日志信息文件中的关键字,然后通过机器学习获取新学习到的关键字并计算其权值。以下简单介绍建立和更新用户描述文件的方法:
    (1)对于每个被用户点击或浏览的页面(其可从用户日志信息包含的页面集确定),筛选出相对新增关键字集,然后根据每个新增关键字在页面中出现的次数及每个新增关键字所属类标签的归一化权值来计算出每个新增关键字的权值,从而形成页面集的新增关键字集。此处,假设Wi为新增关键字ti的权值,则Wi可通过如下公式来计算:其中,m为标签的类别数量,P指P类标签,Np表示新增关键字ti在P部分出现的次数(即,在P类标签位置出现的次数),Cp表示P类标签的归一化权值,其中,Tp表示p类标签对应位置的权值,Tj表示j类标签对应位置的权值。
    (2)根据用户浏览某个页面的次数、每次浏览该页面的时间、以及浏览该页面总时间等一系列相关参数来计算该页面的反馈度。
    (3)根据页面集中包含的页面的个数、页面的反馈度、页面中包含的新增关键字的权值来计算页面集中新增关键字集中的每个新增关键字的权值均值向量。
    (4)在用户描述文件中增加新增关键字及其权值均值的向量,以更新用户描述文件。
    在上述步骤中,如果发现某个新增关键字经常出现在用户浏览页面中,则认为用户对该关键字有兴趣,则可相应提高其权值。同理,如果某个关键字长期未被使用,则可降低其权值。
    以上使用机器学习的方法建立用户描述文件的操作对于本领域技术人员而言是已知的,因此在此将不再进行更加详细的描述。
    此外,在本发明中,由于用户的兴趣可能涉及多个不同的领域,因此,可为用户浏览期间涉及到的每个领域建立一个相应的用户描述文件,即,可为每个用户建立一个或多个用户描述文件,每个用户描述文件与用户使用互联网期间涉及的一个领域相关。
    在步骤303,所述建模模块212可通过预先设置的语义提取规则来从用户浏览过的网页中提取语义关系。
    常用的基本事实语义关系可包括类属关系、属性关系、包含关系、位置关系相似关系等等。而基本事实语义关系一般可以用二元谓词或语义网来表示,复杂的语义关系可以用多元谓词来表示。
    本发明中的语义提取是基于预先定义的语义提取规则进行的,也就是说,需要预先定义一系列的语义提取规则。例如,一个语义规则ISA可以是,其中,S表示句子,NP表示名词短语,SNP表示个体名词,CNP表示类名词,VP表示动词短语。规则中所有动词形式都包含其动词的各种变形。此规则表示的意义为:如果句子S能够表示为NP1是NP2的形式,并且NP1是个体名词,NP2为类名词,则提取语义关系ISA(NP1,NP2)。
    提取语义关系的方法对于本领域技术人员而言是已知的,因此在此将不再进行更加详细的描述。
    在步骤305,所述建模模块212可使用在步骤301建立的用户描述文件 建立用户模型。
    具体地讲,所述建模模块212可首先构建中心词网络。在本发明中,所述建模模块212可将与特定领域相应的用户描述文件中权值较高的关键字(例如,权值高于预设阈值的关键字)设置为中心词,并将设置的中心词连接起来作为中心词网络。然后,所述建模模块212可将在步骤303中从建立该用户描述文件时用到的页面中提取的中心词之间的语义关系添加到所述中心词网络,从而建立用户模型。
    应该理解,如果针对一个用户建立了多个用户描述文件,则可仅选择与感兴趣的一个领域相应的一个用户描述文件来为用户建立一个用户模型,或者也可使用其中的多个用户描述文件来为用户建立相应多个用户模型。在建立了多个用户模型的情况下,可分别对所述多个用户模型中的每一个用户模型执行下面将描述的演进模式分析处理。
    优选地,根据本发明的实施例,在步骤305中,所述建模模块212可对建立的用户模型进行扩展,以形成语义关系更加完整的用户模型。在本发明中,可选用ontology编辑工具(如Protégé或Top Braid Composer等)来扩展所述用户模型。以Protégé工具为例,可将已构建的用户模型、语义提取规则以及经过标注的网页输入到Protégé工具,然后,Protégé工具可自动完成用户模型的扩展。
    此外,在建立了用户模型之后,还可根据需要对所述用户模型进行形式化编码、ontology的确认、评价等后续操作。
    在步骤307,建模模块212可将建立的用户模型存储在用户模型存储模块213中。
    使用ontology方法建立用户模型的步骤对于本领域技术人员而言是已知的,因此为了简明起见,其进一步的详细描述将被省略。此外,图3中示出的步骤的顺序仅是示例,可根据需要调整各步骤的顺序,例如,步骤301和步骤303的顺序可互换。应该理解,建立用户模型的方法不限于此,还可使用其他方法来建立用户模型。例如,还可基于加权关键词的方法,基于潜在语义索引的方法等方法来建立用户模型。
    图2中示出的用户模型建模单元210的配置仅是示例,可根据需要对用户模型建模单元210的配置进行改变。图4是示出根据本发明的另一示例性实施例的基于用户模型演进的推荐装置200中的用户模型建模单元210的配 置的示例。
    图4中示出的用户模型建模单元包括日志同步模块214、日志信息存储模块211、数据提取模块215、建模模块212以及用户模型存储模块213,其中,日志信息存储模块211、建模模块212以及用户模型存储模块213的功能分别与图2中示出的日志信息存储模块211、建模模块212和用户模型存储模块213相同,因此为了简明,在此将不再对其进行详细描述。
    在本发明中,如前所述,客户端装置100收集的原始格式的用户日志信息可能被所述客户端装置100转换为可传输格式之后发送到推荐装置200,在这种情况下,图4中的日志同步模块214可将从客户端装置100接收的可传输格式的用户日志信息转换回原始格式的用户日志信息,并将原始格式的用户日志信息存储在日志信息存储模块中211,以供建模模块212建立用户模型。
    此外,图4中的数据提取模块215可被配置为基于建模需求对获取的特定时间段的用户日志信息中的数据进行处理,并将经过处理的数据提供给建模模块212进行建模。也就是说,数据提取模块215可被用于基于建模模块212所使用的具体建模方法来对用户日志信息进行预处理,使其符合建模模块212中使用的建模方法的需求。
    通过以上方式,建模模块212可为每个用户建立关于特定时间段内用户使用网络的兴趣偏好或行为的用户模型,从而可获得每个用户在不同时间段的多个用户模型。
    尽管图4中示出用户模型建模单元210还包括日志同步模块214和数据提取模块215两者,但本发明不限于此,用户模型建模单元210可基于实际需求而包括日志同步模块215和数据提取模块215中的一个。
    返回到图2,根据本发明的实施例的演进模式分析单元220可包括演进模式分析模块221和演进分析结果存储模块222。
    演进模式分析模块221可被配置为使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析。演进分析结果存储模块222可被配置为存储演进模式分析模块221的分析结果。
    以下将结合图5详细解释演进模式分析模块221的操作。图5是示出根据本发明的示例性实施例的演进模式分析模块221的操作的示例流程图。
    在当前实施例中,演进模式分析模块221可使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。在本发明中,将针对同一时间段建立的用户模型进行的聚类称为一次迭代,针对不同时间段的用户模型进行的多次聚类构成迭代的聚类。此外,在本发明中,每一次迭代的聚类中心可根据上一次迭代的聚类中心进行预先调整,所述聚类中心是指某个用户的针对特定时间段的用户模型。如果形成K个类,则初始的聚类中心为任意选定的针对特定时间段的K个用户的用户模型。
    在步骤501,演进模式分析模块221进行迭代预处理,具体地讲,在步骤501,演进模式分析模块221从演进分析结果存储模块222获取上一次迭代获得的聚类中心及其相应历史信息,在本发明中,所述历史信息可包括:在先前的每次迭代中与所述聚类中心属于同一个簇的用户模型的用户ID信息和与所述簇的用户数有关的较大权值。在本发明中,为上一次迭代的聚类中心分配一个较大的权值可使得在当前次迭代过程中获得的新的聚类中心接近于上一次迭代的聚类中心,从而通过多次迭代聚类,聚类中心将会越来越趋于稳定,其中,为前次聚类中心分配的权值可表示所述前次聚类中心在本次聚类中的重要程度。在本发明中,属于同一簇的用户具有相同的兴趣偏好或行为模式。
    在步骤503,演进模式分析模块221使用从用户模型存储模块213获取的最近一次建立的所有用户的用户模型以及从演进分析结果存储模块222获取的上一次迭代的聚类中心及其相应历史信息进行聚类。也就是说,当建模模块212使用特定时间段内的用户日志信息生成一个或多个用户的用户模型之后,演进模式分析模块221即可使用当前次生成的用户模型以及上一次迭代获得的聚类中心及其相应历史信息进行聚类。聚类的方法对于本领域技术人员而言是已知的,因此在此不再进行详细描述。
    在每次聚类之后,可判断当前次迭代是否达到预设暂停条件。如图5所示,在步骤505,演进模式分析模块221可确定当前次迭代中获得的每个聚类中心的历史信息量是否超过预设数值,或者获得的每个聚类中心和与其相应的上一次迭代的聚类中心之间的距离是否小于预设阈值。如果没有聚类中心满足上述迭代暂停条件,则所述方法返回至步骤503继续进行聚类。如果有聚类中心满足上述迭代暂停条件,则在步骤507,演进模式分析模块221 可暂停迭代并对达到暂停条件的聚类中心进行分类。具体地讲,对于满足暂停条件的聚类中心,将当前与其距离小于预定义的阈值(即,满足暂停条件的聚类中心与其周围的用户模型之间的距离门限)的用户模型分类至所述聚类中心形成一簇,更新所述聚类中心的历史信息并删除相应的用户模型(即,删除与其距离大于所述预定义的阈值的用户模型),从而实现分类。对于剩余的用户模型和聚类中心(即,从本次聚类开始时使用的所有用户模型排除分类操作中已删掉的用户模型而剩下的用户模型),可进行再一次的聚类操作。
    在步骤509,演进模式分析模块221可确定本次迭代(即,聚类)是否停止。在本申请中,仅作为示例,停止条件可以是前后两次聚类的聚类中心不再变化或变化小于预设的停止阈值。如果没有停止,则所述方法返回至步骤503继续进行聚类。
    在本次迭代完成之后,可将上一次迭代的聚类中心的历史信息复制到当前次迭代获得的相应的新的聚类中心上,并删除上一次迭代的聚类中心。所获得的新的聚类中心及其相应历史信息可作为演进模式分析模块221的分析结果被存储在演进分析结果存储模块222中。此外,当前次迭代中每个用户模型的聚类结果(即,与哪个聚类中心属于同一簇)也可作为演进模式分析模块221的分析结果被存储在演进分析结果存储模块222中。这样,对于每个用户而言,从对针对不同时间段建立的用户模型的聚类结果可获知该用户的用户模型演进模式(即,在不同时间段的兴趣偏好的变化)。
    在本发明中,在最初一次迭代时,可将从建模模块212初始获得的所有用户的用户模型分成多个组,使得相同组中的用户模型所对应的用户具有相同兴趣偏好。
    图6是示出根据本发明的实施例的表现用户模型随时间的演进模式的用户模型演进图。
    在本发明中,可使用有向图来表示用户模型随时间的演进模式。如图6所示,图6中的节点V1、V2、V3和V4为聚类的簇,簇中的元素为彼此有着相似偏好的用户的用户模型,i是用户ID,t1、t2、t3和t4表示该用户模型建立的时间段。图6中的有向边表示随着时间的变化,用户模型在不同的簇间的迁移,因此,图6示出用户i在时间段t1、t2、t3和t4期间用户模型的演进路径(即,在不同时间段用户模型在不同簇间的迁移路径)。
    具体地讲,V1、V2、V3和V4分别为t1、t2、t3和t4时间段内所有用 户模型的聚类结果中的包含用户i的用户模型的簇,并可被看做状态点。每个状态点的生成都是某次迭代聚类的结果,即,每个状态点对应于针对某个特定时间段的用户模型进行聚类而获得的聚类结果中的一个簇。每进行一次迭代聚类可生成新的状态点。
    在多次迭代聚类之后,新的状态点可近似地等同于初始聚类得到的某个聚类中心,从而可加长用户模型的演进路径。具体地讲,在本发明中,用户模型的演进路径是指用户模型在不同的时间段内属于不同的聚类簇的演进路径,每次新的聚类过后,用户模型将会属于一个聚类簇,这个聚类簇可能变化也可能不变,但无论如何会存在一条路径,这条路径从本用户模型上次所属的聚类簇节点指向本次所属的新的聚类簇节点,也就是加长了演进路径。
    再次返回到图2,根据本发明的推荐内容生成单元230可包括预测模块231、推荐内容存储模块232和推荐内容同步模块233。
    预测模块231可在演进分析结果存储模块222中搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测的结果相应的推荐内容。推荐内容存储模块232可被配置为存储与预测结果相应的推荐内容。推荐内容同步模块233可将存储的与预测结果相应的推荐内容发送给目标用户的客户端装置。应理解,尽管图2示出了推荐内容存储模块232,但本发明的实施例也可不包括推荐内容存储模块232,而是由推荐内容同步模块233将预测模块231产生的推荐内容直接发送给客户端装置。
    以下将结合图7详细描述预测模块231的预测操作。图7是示出根据本发明的示例性实施例的预测模块231的预测操作的示例流程图。在本发明中,推荐模块231可使用最长路径匹配算法来确定与目标用户具有最相似(或相同)的用户模式演进模式的用户。
    在步骤701,预测模块231可确定目标用户的用户模型的最长演进路径及其长度t。例如,仅作为示例,可将所有包含目标用户模型的簇节点都找出,按照时间来排序,从而得到其最长路径。
    然后,在步骤703,预测模块231可在演进分析结果存储模块222中搜索与目标用户的用户模型的最长演进路径匹配的其他用户的用户模型演进路径(以下,简称匹配路径)。步骤705,可确定是否搜索到与目标用户的最长演进路径匹配的其他用户的用户模型演进路径,如果在步骤705搜索到匹配 路径,则在步骤707,预测模块231可确定是否仅找到一条匹配路径。如果在步骤707确定仅找出一条匹配路径,则在步骤709,使用所述匹配路径所属用户的用户模型演进模式来预测目标用户的用户模型演进趋势。
    如果在步骤707,预测模块231确定搜索到的匹配路径有多条,则在步骤711,可使用遗忘函数设置每条匹配路径中的每个迁移路径的权重值并计算每条匹配路径的总权重值,从而确定与目标用户的最长演进路径最匹配的一条匹配路径。
    具体地讲,在步骤711,由于用户兴趣的迁移很大程度上遵循自然遗忘规律,即,最近的用户兴趣迁移对预测的重要程度远远大于过去迁移对预测的重要程度。因此,可运用遗忘函数来计算用户模型演进模式的权重值。假设用户i的迁移的最长演进路径为||P||表示所述最长演进路径的长度,表示在时间段Ts用户i所属的聚类。
    可使用遗忘函数来计算用户模型Ui从时间段d到时间段e从一个聚类簇Vl到另一个聚类簇Vk的兴趣迁移路径的权值,其中,t表示该用户模型本次所属的簇生成的时间到当前时间之间的时间长度,λ是遗忘系数,可以以记忆相对强度的倒数来表示并且可根据路径终点的用户模型的新旧程度来确定。因此,演进路径P的总权重为其中,s是与最长演进路径的起点对应的时间点。
    在步骤713,可选择与计算出的总权重值最大的匹配路径对应的用户的用户模型演进模式来预测目标用户的用户模型演进趋势。
    返回到步骤705,如果没有找到与目标用户的最长演进路径匹配的路径,则预测模块231在步骤715将长度t减1并在步骤717构造目标用户的t-1长度的用户模型演进路径的子集,然后在步骤703搜索与目标用户的t-1长度的用户模型演进路径的子集中的每条演进路径匹配的其他用户的用户模型演进路径。当在步骤705确定找到匹配路径时,预测模块231针对找出的匹配路径进行步骤707至步骤713的操作,所述操作与上述对目标用户的长度t的用户模型演进路径的操作类似,因此在此不再进行详细描述。如果在步骤705确定没有找到与目标用户的t-1长度的用户模型演进路径匹配的其他用户的用户模型演进路径,则预测模块231可在步骤715和717构造目标用户的t-2 长度的用户模型演进路径的子集,并按照与前述步骤类似的步骤来确定其匹配路径。通过以上操作可确定与目标用户的用户模型演进模式最匹配的另一用户的用户模型演进模式。
    预测模块231可使用对目标用户的用户模型演进趋势进行预测的预测结果来产生相应的推荐内容,并将与预测结果相应的推荐内容存储在推荐内容存储模块232中。产生推荐内容的方法对于本领域技术人员而言是已知的,因此在此将不再进行详细描述。
    图8是示出根据本发明的示例性实施例的基于用户模型演进的推荐方法的流程图。
    如图8所示,在步骤801,可由推荐装置200中的用户模型建模单元210接收从一个或多个客户端装置100发送的用户日志信息,并基于接收的每个客户端装置的用户的日志信息为每个用户建立用户模型。所述用户日志信息可包括用户使用互联网时关于用户浏览行为的数据。
    具体地讲,在步骤801,可由所述用户模型建模单元210中的日志信息存储模块211存储从客户端装置接收的用户日志信息,然后由所述用户模型建模单元210中的建模模块212从日志信息存储模块211获取由日志信息存储模块211在特定时间段内存储的每个用户的用户日志信息,并基于获取的每个用户的用户日志信息,为每个用户建立针对所述特定时间段的用户模型。为每个用户建立的用户模型可被存储在用户模型建模单元210中的用户模型存储模块213中。
    在本发明中,所述建模模块212可每隔预定时间段从日志信息存储模块211获取在所述预定时间段内由日志信息存储模块211存储的用户日志信息,并使用获取的用户日志信息为每个用户建立针对所述预定时间段的用户模型,以为每个用户建立针对不同时间段的多个用户模型。
    此外,在本发明中,如果客户端装置收集的用户日志信息不适合于直接传输,则客户端装置可将收集的原始格式的用户日志信息转换为可传输格式之后发送到推荐装置200,在这种情况下,推荐装置200在接收到可传输格式的用户日志信息之后,可通过用户模型建模单元210中的日志同步模块214将接收的可传输格式的用户日志信息转换回原始格式的用户日志信息,并存储经过转换的用户日志信息。所述可传输格式可以为json字符串格式。
    优选地,在步骤801中,还可由用户模型建模单元210中的数据提取模 块215来基于建模需求对获取的特定时间段的用户日志信息中的数据进行处理,并将经过处理的数据提供给建模模块212进行建模。在本发明中,可使用Ontology方法为所有的用户建立用户模型。
    以上已参照图2至图4详细描述了建立用户模型的方法,因此为了简明,在此将不再进行详细描述。
    在步骤803,可由推荐装置200中的演进模式分析单元220对每个用户的用户模型随时间的演进模式进行分析。所述演进模式可表示用户在不同时间段的兴趣偏好的变化。
    具体地讲,在步骤803,可由演进模式分析单元220中的演进模式分析模块221使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,对每个用户的用户模型演进模式进行分析,然后由演进模式分析单元220中的演进分析结果存储模块222存储演进模式分析模块221的分析结果。
    在本发明中,所述演进模式分析模块221可使用所有用户的针对最近时间段建立的用户模型以及上一次的用户模型演进模式的分析结果,通过迭代聚类来分析每个用户的用户模型随时间的演进模式。以上已参照图至图5和图6详细描述了分析演进模式的方法,因此为了简明,在此将不再进行详细描述。
    在步骤805,可由推荐装置200中的推荐内容生成单元230根据演进模式分析单元220的分析结果来预测目标用户的用户模型演进趋势,产生与预测结果相应的推荐内容并将与预测结果相应的推荐内容发送给目标用户的客户端装置。
    具体地讲,在本发明中,在步骤805,推荐内容生成单230中的预测模块231可基于演进模式分析单元220的分析结果搜索与目标用户具有最相似的用户模型演进模式的用户,使用搜索到的用户的用户模型演进模式来预测目标用户的用户模型演进趋势,并产生与预测结果相应的推荐内容。与预测结果相应的推荐内容可被存储在推荐内容生成单元230中的推荐内容存储模块232中,然后可由推荐内容生成单元230中的推荐内容同步模块233将与预测结果相应的推荐内容发送给目标用户的客户端装置100。在本发明中,推荐内容同步模块233可将推荐内容转换为json字符串格式并使用http协议将其发送到客户端装置100。
    在本发明中,预测模块231可使用最长路径匹配算法来确定与目标用户具有最相似的用户模型演进模式的用户。
    以上已参照图7详细描述了确定与目标用户具有最相似的用户模型演进模式的用户的方法,因此为了简明,在此将不再进行详细描述。
    应用本发明的以上方法,能够通过利用与目标用户具有相同或相似的用户模型演进模式的用户的信息来预测目标用户未来的兴趣偏好或行为模式,因此能够获得更可靠的个性化推荐结果。
    本发明示例性实施例可实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后可由计算机系统读出的数据的任意数据存储装置。计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光数据存储装置和载波(诸如经有线或无线传输路径通过互联网的数据传输)。计算机可读记录介质也可分布于连接网络的计算机系统,从而计算机可读代码以分布式存储和执行。此外,完成本发明的功能程序、代码和代码段可容易地被与本发明相关的领域的普通程序员在本发明的范围之内解释。
    尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

    关 键  词:
    基于 用户 模型 演进 推荐 装置 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于用户模型演进的推荐装置和方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-2239409.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1