书签 分享 收藏 举报 版权申诉 / 19

一种拓展用户关系链的方法及装置.pdf

  • 上传人:a****
  • 文档编号:4071345
  • 上传时间:2018-08-13
  • 格式:PDF
  • 页数:19
  • 大小:1.15MB
  • 摘要
    申请专利号:

    CN201410784862.8

    申请日:

    2014.12.16

    公开号:

    CN104580385A

    公开日:

    2015.04.29

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    授权|||实质审查的生效IPC(主分类):H04L 29/08申请日:20141216|||公开

    IPC分类号:

    H04L29/08

    主分类号:

    H04L29/08

    申请人:

    腾讯科技(深圳)有限公司

    发明人:

    叶浩

    地址:

    518000广东省深圳市福田区振兴路赛格科技园2栋东403室

    优先权:

    专利代理机构:

    北京三高永信知识产权代理有限责任公司11138

    代理人:

    鞠永善

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了一种拓展用户关系链的方法及装置,属于互联网通信领域。所述方法包括:从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。本发明能够提高社交网络的活跃度和存留率。

    权利要求书

    权利要求书1.  一种拓展用户关系链的方法,其特征在于,所述方法包括:从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。2.  如权利要求1所述的方法,其特征在于,所述从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号,包括:从社交网络的拓扑子图中获取第一用户账号的可达关系图,所述可达关系图包括与所述第一用户账号存在间接好友关系的第二用户账号和存在直接好友关系的第三用户账号,且在所述可达关系图中所述第一用户账号与每个第二用户账号之间的路径包括的跳数不超过预设跳数阈值;从所述可达关系图中获取与所述第一用户账号之间的路径数目大于或等于预设数目阈值的第二用户账号。3.  如权利要求1所述的方法,其特征在于,所述选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户推荐给所述第一用户,包括:获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,将所述获取的第二用户对应的第二用户账号推荐给所述第一用户;或者,获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,从所述获取的第二用户中选择与所述第一用户的相识概率最大的预设数目个第二 用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。4.  如权利要求1所述的方法,其特征在于,所述从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号之前,还包括:在所述拓扑子图中的统计每个用户账号的出边数目、入边数目和双向边数目;根据所述每个用户账号的出边数目和所述双向边数目计算出所述每个用户账号的出度,以及根据所述每个用户账号的入边数目和双向边数目计算出所述每个用户账号的入度;从所述拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号。5.  如权利要求1-4任一项权利要求所述的方法,其特征在于,所述路径特征信息包括所述第一用户账号与所述第二用户账号之间的路径数目、所述路径包括的各种类型边的数目、所述路径上的每一跳包括的各种类型边的数目、所述第一用户账号的出度和入度、所述第二用户账号的出度和入度中的至少一者。6.  一种拓展用户关系链的装置,其特征在于,所述装置包括:第一获取模块,用于从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;第二获取模块,用于获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;构造模块,用于根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;预测模块,用于根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;推荐模块,用于选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。7.  如权利要求6所述的装置,其特征在于,所述第一获取模块包括:第一获取单元,用于从社交网络的拓扑子图中获取第一用户账号的可达关系图,所述可达关系图包括与所述第一用户账号存在间接好友关系的第二用户账号和存在直接好友关系的第三用户账号,且在所述可达关系图中所述第一用户账号与每个第二用户账号之间的路径包括的跳数不超过预设跳数阈值;第二获取单元,用于从所述可达关系图中获取与所述第一用户账号之间的路径数目大于或等于预设数目阈值的第二用户账号。8.  如权利要求6所述的装置,其特征在于,所述推荐模块包括:第一推荐单元,用于获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,将所述获取的第二用户对应的第二用户账号推荐给所述第一用户;或者,第二推荐单元,用于获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,从所述获取的第二用户中选择与所述第一用户的相识概率最大的预设数目个第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。9.  如权利要求6所述的装置,其特征在于,所述装置还包括:第一统计模块,用于在所述拓扑子图中的统计每个用户账号的出边数目、入边数目和双向边数目;第一计算模块,用于根据所述每个用户账号的出边数目和所述双向边数目计算出所述每个用户账号的出度,以及根据所述每个用户账号的入边数目和双向边数目计算出所述每个用户账号的入度;第一过滤模块,用于从所述拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号。10.  如权利要求6-9任一项权利要求所述的装置,其特征在于,所述路径特征信息包括所述第一用户账号与所述第二用户账号之间的路径数目、所述路径包括的各种类型边的数目、所述路径上的每一跳包括的各种类型边的数目、所述第一用户账号的出度和入度、所述第二用户账号的出度和入 度中的至少一者。

    说明书

    说明书一种拓展用户关系链的方法及装置
    技术领域
    本发明涉及互联网通信领域,特别涉及一种拓展用户关系链的方法及装置。
    背景技术
    随着互联网的发展,涌现了大量社交网络系统,用户不断的在互联网上构建自己的社交关系网络。当一个新的社交网络系统建立的时候,最大的挑战是好友关系链的稀疏性问题,即使新用户不断的在系统中注册登录,但是他们找不到更多的朋友一起互动,从而影响系统的活跃性以及用户的存留率。
    为了方便用户在社交网络系统中找到认识的好友,丰富用户关系链,当前的社交网络系统需要拓展用户的用户关系链来帮助用户获得更多的潜在好友。目前社交系统使用二度人脉来拓展用户的用户关系链,二度人脉基于的逻辑为“朋友的朋友也可能是自己的朋友”,即社交系统使用二度人脉为某用户拓展用户关系链,为了便于说明将该用户称为第一用户,社交系统获取与第一用户存在共同好友的其他用户,将其他用户推荐给第一用户,第一用户可以添加社交系统推荐的其他用户为好友,从而实现拓展自己的用户关键链。
    在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
    大部分情况下存在共同好友的两个用户不一定相识,因此使用二度人脉推荐给第一用户的其他用户多为佰生人,而第一用户与佰生人交流的可能性较低,降低社交系统的活跃度和存留率。
    发明内容
    为了提高社交网络的活跃度和存留率,本发明提供了一种拓展用户关系链的方法及装置。所述技术方案如下:
    一种拓展用户关系链的方法,所述方法包括:
    从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;
    获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;
    根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;
    根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;
    选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    一种拓展用户关系链的装置,所述装置包括:
    第一获取模块,用于从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;
    第二获取模块,用于获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;
    构造模块,用于根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;
    预测模块,用于根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;
    推荐模块,用于选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    在本发明实施例中,获取第一用户账号与第二用户账号之间的路径的路径特征信息,根据获取的路径特征信息构造特征向量,根据该特征向量预设第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率,相识概率越大,第一用户与第二用户相识的可能性越大,如此可以尽量向第一用户推荐与第一用户相识的第二用户,从而可以提高社交网络的活跃度和存留率。
    附图说明
    图1是本发明实施例1提供的一种拓展用户关系链的方法流程图;
    图2-1是本发明实施例2提供的一种拓展用户关系链的方法流程图;
    图2-2是本发明实施例2提供的一种社交网络的拓扑子图的结构示意图;
    图2-3是本发明实施例2提供的一种可达关系图的第一结构示意图;
    图2-4是本发明实施例2提供的一种可达关系图的第二结构示意图;
    图2-5是本发明实施例2提供的一种路径的第一结构示意图;
    图2-6是本发明实施例2提供的一种路径的第二结构示意图;
    图2-7是本发明实施例2提供的一种路径的第三结构示意图;
    图2-8是本发明实施例2提供的一种路径的第四结构示意图;
    图3是本发明实施例3提供的一种拓展用户关系链的装置结构示意图
    图4是本发明实施例4提供的一种服务器结构示意图。
    具体实施方式
    为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
    实施例1
    参见图1,本发明实施例提供了一种拓展用户关系链的方法,包括:
    步骤101:从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与第一用户账号存在间接好友关系的第二用户账号。
    步骤102:获取第一用户账号与第二用户账号之间的路径的路径特征信息。
    步骤103:根据第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量。
    步骤104:根据该特征向量预测第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率。
    其中,如果第一用户与第二用户的相识概率越大,第一用户与第二用户相识的可能性就越大。
    步骤105:选择与第一用户的相识概率满足预设推荐条件的第二用户,将选择的第二用户对应的第二用户账号推荐给第一用户。
    在本发明实施例中,获取第一用户账号与第二用户账号之间的路径的路径特征信息,根据获取的路径特征信息构造特征向量,根据该特征向量预设第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率,相识概率越大,第一用户与第二用户相识的可能性越大,如此可以尽量向第一用户推荐与第一用户相识的第二用户,从而可以提高社交网络的活跃度和存留率。
    实施例2
    参见图2,本发明实施例提供了一种拓展用户关系链的方法,包括:
    步骤201:从社交网络中获取社交网络的拓扑子图。
    社交网络维护一个拓扑子图,该拓扑子图中包括社交网络中的每个用户的用户账号和连接各用户账号的边。在社交网络中,每个用户的用户账号对应一个通讯录,该通讯录用于存储与该用户是直接好友关系的其他用户的联系人信息,该联系人信息中至少包括该其他用户的用户账号。
    对于某用户,如果该用户的用户账号对应的通讯录中存储了某个其他用户的联系人信息而该其他联系人的通讯录中未存储该用户的联系人信息,则在社交网络的拓扑子图中体现为一条出边,该出边从该用户的用户账号指向该其他用户的用户账号;如果某个其他用户的用户账号对应的通讯录中存储了该用户的联系人信息而该用户的通讯录中未存储该其他用户的联系人信息,则在社交网络的拓扑子图中体现为一条入边,该入边从该其他用户的用户账号指向该用户的用户账号;如果两个用户的通讯录中都存储有各自的联系人信息,在拓扑子图中,连接该两个用户的用户账号的边是一条双向边。
    例如,参见图2-2,社交网络中包括用户账号A、B、C、D、E、F、G和H,用户账号A对应的通讯录中存储有用户账号B和C,且用户账号B中也存储了用户账号A,所有用一条双向边连接用户账号A和用户账号B以及用一条出边从用户账号A指向用户账号C,双向边用“”来表示,出边可以用“→”来表示;用户账号E对应的通讯录中存储有用户账号A,所以用一条入边从用户账号E指向用户账号A,入边可以用“←”来表示。对于其他的每个用户账号按上述方式处理便构造出如图2-2所示的社交网络的拓扑子图。
    其中,用户的用户账号可以为用户在社交网络中注册的账号、用户的手机号或电话号码等。用户的通讯录可以为:该用户在该社交网络中的通讯录,该用户的手机通信录和/或该用户在其他社交网络中的通讯录。
    步骤202:从社交网络的拓扑子图中过滤掉预设账号类型的用户账号。
    预设账号类型的用户账号可以为运营商的账号、外卖的账号、业务员的账号、名人的账号、社交网络中的机器账号和僵尸账号等。
    运营商的账号、外卖的账号或名人的账号往往被大量的用户存储在通讯录中,存储运营商的账号、外卖的账号或名人的账号的任意两用户在通常情况是 不相识的,所以通过运营商的账号或外卖的账号可能无法向某用户推荐与该用户相识的其他用户。
    业务员的账号对应的通讯录中往往存储了大量其他用户的用户账号,而在该通讯录中存储的这些用户账号对应的用户之间往往不相识,所以通过业务员的账号可能无法向某用户推荐与该用户相识的其他用户。
    在微博等社交网络中,用户往往为增加自己被他人收听的数目,往往会向商家购买大量的机器人账号或僵尸账号,在机器人账号对应的通讯录或僵尸账号对应的通讯录中存储该用户的用户账号,以增加用户被收听的数目。商家往往将相同的机器人账号或僵尸账号卖给不同的用户,所以两个机器人账号对应的通讯录或两个僵尸账号对应的通讯录中存储的用户账号的重合度较高。机器人账号对应的通讯录或僵尸账号对应的通讯录中存储的用户账号对应的用户之间往往也不相识,所以通过机器人账号或僵尸账号可能无法向某用户推荐与该用户相识的其他用户。
    为了提高后续步骤处理的速度,以提高拓展用户关系链的效率,在本步骤可以将这些无价值的用户账号,即预设账号类型的用户账号从社交网络的拓扑子图中过滤掉。
    本步骤可以包括如下第一和第二两处理方式,包括:
    第一种方式、在社交网络的拓扑子图中统计每个用户账号的出边数目、入边数目和双向边数目,根据每个用户账号的出度数目和双向边数目计算得到每个用户账号的出度以及根据每个用户账号的入边数目和双向边的数目计算得到每个用户账号的入度,从社交网络的拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号。
    其中,计算每个用户账号的出度数目和双向边数目之和得到每个用户账号的出度,以及计算每个用户账号的入边数目和双向边的数目之和得到每个用户账号的入度。
    其中,出度或入度满足预设过滤条件的用户账号可能为运营商的账号、外卖的账号、业务员的账号和名人的账号等。
    其中,可以按如下(1)和(2)两方式从社交网络的拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号,包括:
    (1)、从社交网络的拓扑子图中过滤掉出度或入度不超过预设阈值的用户 账号。
    其中,预设阈值可以为1或2等数值,出度或入度不超过预设阈值的用户账号为可能为运营商的账号或外卖的账号等。需要说明的是:在社交网络中存在大量的用户账号对应的通讯录中都存储有运营商的账号或外卖的账号,运营商的账号对应的通讯录或外卖的账号对应的通讯录中往往没有存储任何其他用户账号,所以运营商的账号或外卖的账号的出度都很小或为0,因此出度或入度小于预设阈值的用户账号可能为运营商的账号或外卖的账号等。
    (2)、根据社交网络的拓扑子图中的每个用户账号的出度和入度分别计算出出度均值和入度均值,计算每个用户账号的出度与该出度均值之间的出度倍数以及计算每个用户账号的入度与该入度均值之间的入度倍数,从社交网络的拓扑子图中过滤掉出度倍数或入度倍数超过预设倍数阈值的用户账号。
    其中,出度倍数或入度倍数大于预设倍数阈值的用户账号可能为业务员的账号、名人的账号、运营商的账号或外卖的账号等。
    需要说明的是:由于存在大量的用户账号对应的通讯录中都存储有运营商的账号、外卖的账号或名人的账号,所以运营商的账号、外卖的账号或名人的账号的入度很大且与入度均值的入度倍数往往大于预设倍数阈阈值,因此入度倍数大于预设倍数阈值的用户账号可能为运营商的账号或外卖的账号等。
    在社交网络中,业务员的账号对应的通讯录中存储有大量其他用户的用户账号,所以业务员的账号的出度很大且与出度均值之间的出度倍数往往大于预设倍数阈值,所以出度倍数大于预设倍数阈值的用户账号可能为业务员的账号。
    在本发明实施例中,可以按上述(1)方式或(2)方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号;或者,可以先按(1)方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号,然后再按(2)方式从经过(1)方式过滤的社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号;或者,可以先按(2)方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号,然后再按(1)方式从经过(2)方式过滤的社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号。
    第二种方式、获取社交网络中的每个用户账号对应的通讯录,根据每个用户账号对应的通讯录计算任意两用户账号对应的通讯录的重合度,从社交网络的拓扑子图中过滤掉重合度超过预设重合度阈值的两用户账号。
    其中,重合度超过预设重合度阈值的用户账号可以为社交网络的机器人账号或僵尸账号等。由于任意两个机器人账号对应的通讯录或两个僵尸账号对应的通讯录中存储的用户账号的重合度较高,因此重合度超过预设重合度阈值的用户账号可以为社交网络的机器人账号或僵尸账号等。
    在本发明实施例中,可以按上述第一种方式或第二种方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号;或者,可以先按第一种方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号,然后再按第二种方式从经过第一种方式过滤的社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号;或者,可以先按第二种方式从社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号,然后再按第一种方式从经过第二种方式过滤的社交网络的拓扑子图中过滤掉部分预设账号类型的用户账号。
    其中,在社交网络的拓扑子图中与过滤掉的用户账号相连的出边、入边或双向边也随之去除。
    步骤203:从社交网络的拓扑子图中获取第一用户账号的可达关系图。
    其中,该可达关系图包括与第一用户账号存在间接好友关系的第二用户账号和存在直接好友关系的第三用户账号,在可达关系图中第一用户账号与第二用户账号之间的路径的跳数不超过预设跳数阈值。
    其中,第一用户账号是需要拓展用户关系链的用户对应的用户账号。与第一用户账号存在直接好友关系的第三用户账号为在拓扑子图中与第一用户账号存在边直接相连的用户账号;与第一用户账号存在间接好友关系的第二用户账号为在拓扑子图中与第一用户账号不存在边直接相连但与第一用户账号之间存在路径的用户账号;第一用户账号与第二用户账号之间的路径包括的跳数越大,表明第一用户账号对应的第一用户与第二用户账号对应的第二用户相识的可能性越低,第一用户账号与第二用户账号之间的路径包括的跳数越小,表明第一用户账号对应的第一用户与第二用户账号对应的第二用户相识的可能性越高。所以为了能为第一用户账号对应的第一用户推荐与第一用户相识的其他用户,所以在第一用户账号的可达关系图中第一用户账号与第二用户账号之间的路径的跳数不超过预设跳数阈值。预设跳数据阈值可以为大于或等于2的任意整数值,优选的预设跳数阈值为2、3、4或5。
    例如,如图2-2所示的社交网络的拓扑子图,对于用户账号A,与用户账号 A存在边直接相连的用户账号包括B、C和E,用户账号B、C、E与用户账号A之间存在直接好友关系;而用户账号A与用户账号D、F、G和H不存在边直接相连但用户账号A分别与用户账号D、F、G和H之间存在路径,所以用户账号A与用户账号D、F、G和H之间存在间接好友关系;用户账号A与用户账号D之间的路径包括的跳数为2,用户账号A与用户账号H之间的路径包括的跳数3,所以用户账号A对应的用户与用户账号D对应的用户相识的可能性大于用户账号A对应的用户与用户账号H对应的用户相识的可能性。
    假设第一用户账号为用户账号A,以及预设跳数阈值为3,从如图2-2所示的社交网络的拓扑子图中获取第一用户账号A的可达关系图,包括如图2-3所示的可达关系图和如图2-4所示的可达关系图。
    步骤204:从第一用户账号对应的可达关系图中获取与第一用户账号之间的路径的路径数目大于或等于预设数目阈值的第二用户账号。
    其中,预设数目阈值可以为数据2或3等。
    例如,假设预设数目阈值可以为2,从如图2-3所示的第一用户账号A对应的可达关系图中获取与第一用户账号A的路径数目大于或等于预设数目阈值2的第二用户账号包括用户账号H,以及从如图2-4所示的第一用户账号A对应的可达关系图中获取与第一用户账号A的路径数目大于或等于预设数目阈值2的第二用户账号包括用户账号D。
    步骤205:获取第一用户账号与第二用户账号之间的路径之间的路径的路径特征信息。
    第一用户账号与第二用户账号之间的路径的路径特征信息包括第一用户账号与第二用户账号之间的路径数目、该路径包括的各种类型边的数目、该路径上的每一跳包括的各种类型边的数目、第一用户账号的出度和入度、第二用户账号的出度和入度中的至少一者。
    本步骤可以为:对于每个第二用户账号,从第一用户账号对应的可达关系图中获取第一用户账号与该第二用户账号之间的每条路径,根据每条路径,提取每条路径的路径特征信息。如统计获取的路径数目,从获取的路径中确定出每条边的类型,再统计出各种类型边的数目,从每条路径中确出每一跳包括的边,从每一跳包括的边中统计出每一跳包括的各种类型边的数目。
    例如,对于第一用户账号A以及第二用户账号H,从如图2-3所示的第一 用户账号A的可达关系图中获取第一用户账号A与第二用户账号H之间的路径包括如图2-5所示的路径和如图2-6所示的路径,统计获取的路径数目为2;从如图2-5所示的路径和如图2-6所示的路径中确定出每条边的类型,统计出各种类型边的数目,包括出边的数目为2、入边的数目为2以及双向边的数目为2;从如图2-5所示的路径和如图2-6所示的路径中确出每一跳包括的边,从每一跳包括的边中统计出每一跳包括的各种类型边的数目,包括第一跳包括出边的数目为1和入边的数目为1,第二跳包括出边的数目为1和双向边的数目为1,第三跳包括入边的数目为1和双向边的数目为1;获取第一用户账号A的出度2和入度2以及第二用户账号H的出度2和入度1。
    对于第一用户账号A以及第二用户账号D,从如图2-4所示的第一用户账号A的可达关系图中获取第一用户账号A与第二用户账号D之间的路径包括如图2-7所示的路径和如图2-8所示的路径,统计获取的路径数目为2;从如图2-7所示的路径和如图2-8所示的路径中确定出每条边的类型,统计出各种类型边的数目,包括出边的数目为2、入边的数目为1以及双向边的数目为1;从如图2-7所示的路径和如图2-8所示的路径中确出每一跳包括的边,从每一跳包括的边中统计出每一跳包括的各种类型边的数目,包括第一跳包括出边的数目为1和双向边的数目为1,第二跳包括出边的数目为1和入边的数目为1;获取第二用户账号D的出度1和入度1。
    步骤206:根据第一用户与第二用户账号之间的路径之间的路径的路径特征信息构造特征向量。
    其中,可以根据预设的路径特征信息的排列顺序,将第一用户账号与第二用户账号之间的路径的路径特征信息组成特征向量。例如,第一用户账号与第二用户账号之间的路径的路径特征信息包括第一用户账号与第二用户账号之间的路径数目排在特征向量的第一位、路径包括的各种类型边的数目排在的路径数目之后、然后再排路径上的每一跳包括的各种类型边的数目、接着再排第一用户账号的出度和入度、最后排第二用户账号的出度和入度,如此便得到特征向量。
    步骤207:根据构造的特征向量采用预设的回归算法计算出第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率。
    将构造的特征向量作为预设的回归算法的输入,输入给预设的回归算法, 再使用预设的回归算法计算出第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率。
    预设的回归算法是预先对回归算法进行训练得到的,训练过程可以为:事先设置多对用户账号,设置每对用户账号中包括两个用户账号之间的路径的路径特征信息,并标注每对用户账号对应的两用户是否为潜在的好友关系,然后将设置的这些信息输入给回归算法,以对回归算法进行训练。
    步骤208:选择与第一用户的相识概率满足预设推荐条件的第二用户,将选择的第二用户对应的第二用户账号推荐给第一用户。
    本步骤具体为:获取与第一用户的相识概率大于或等于预设概率阈值的第二用户,将获取的第二用户对应的第二用户账号推荐给第一用户;或者,
    获取与第一用户的相识概率大于或等于预设概率阈值的第二用户,从获取的第二用户中选择与第一用户的相识概率最大的预设数目个第二用户,将选择的第二用户对应的第二用户账号推荐给第一用户。
    本发明实施例的执行主体可以为服务器。
    在本发明实施例中,获取第一用户账号与第二用户账号之间的路径的路径特征信息,根据获取的路径特征信息构造特征向量,根据该特征向量预设第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率,相识概率越大,第一用户与第二用户相识的可能性越大,如此可以尽量向第一用户推荐与第一用户相识的第二用户,从而可以提高社交网络的活跃度和存留率。另外,还可以从社交网络的拓扑子图中过滤掉预设账号类型的用户账号,如此可以提高拓展用户关系链的效率。
    实施例3
    参见图3,本发明实施例提供了一种拓展用户关系链的装置,包括:
    第一获取模块301,用于从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;
    第二获取模块302,用于获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;
    构造模块303,用于根据所述第一用户账号与第二用户账号之间的路径的路 径特征信息构造特征向量;
    预测模块304,用于根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;
    推荐模块305,用于选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    可选的,所述第一获取模块301包括:
    第一获取单元,用于从社交网络的拓扑子图中获取第一用户账号的可达关系图,所述可达关系图包括与所述第一用户账号存在间接好友关系的第二用户账号和存在直接好友关系的第三用户账号,且在所述可达关系图中所述第一用户账号与每个第二用户账号之间的路径包括的跳数不超过预设跳数阈值;
    第二获取单元,用于从所述可达关系图中获取与所述第一用户账号之间的路径数目大于或等于预设数目阈值的第二用户账号。
    可选的,所述推荐模块305包括:
    第一推荐单元,用于获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,将所述获取的第二用户对应的第二用户账号推荐给所述第一用户;或者,
    第二推荐单元,用于获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,从所述获取的第二用户中选择与所述第一用户的相识概率最大的预设数目个第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    进一步地,所述装置还包括:
    第一统计模块,用于在所述拓扑子图中的统计每个用户账号的出边数目、入边数目和双向边数目;
    第一计算模块,用于根据所述每个用户账号的出边数目和所述双向边数目计算出所述每个用户账号的出度,以及根据所述每个用户账号的入边数目和双向边数目计算出所述每个用户账号的入度;
    第过滤模块,用于从所述拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号。
    可选的,第一过滤模块包括:
    第一过滤单元,用于从所述拓扑子图中过滤掉出度或入度不超过预设阈值 的用户账号;和/或,
    第二过滤单元,用于根据所述拓扑子图中的每个用户账号的出度和入度分别计算出度均值和入度均值,计算所述每个用户账号的出度与所述出度均值之间的出度倍数以及计算所述每个用户账号的入度与所述入度均值之间的入度倍数,从所述拓扑子图中过滤掉出度倍数或入度倍数超过预设倍数阈值的用户账号。
    进一步地,该装置还包括:
    第三获取模块,用于获取社交网络中的每个用户账号对应的通讯录;
    第二计算模块,用于根据所述每个用户账号对应的通讯录计算任意两用户账号对应的通讯录的重合度;
    第二过滤模块,用于从所述拓扑子图中过滤掉重合度超过预设重合度阈值的两用户账号。
    所述路径特征信息包括所述第一用户账号与所述第二用户账号之间的路径数目、所述路径包括的各种类型边的数目、所述路径上的每一跳包括的各种类型边的数目、所述第一用户账号的出度和入度、所述第二用户账号的出度和入度中的至少一者。
    在本发明实施例中,获取第一用户账号与第二用户账号之间的路径的路径特征信息,根据获取的路径特征信息构造特征向量,根据该特征向量预设第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率,相识概率越大,第一用户与第二用户相识的可能性越大,如此可以尽量向第一用户推荐与第一用户相识的第二用户,从而可以提高社交网络的活跃度和存留率。
    实施例4
    图4是本发明实施例提供的服务器的结构示意图。服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央 处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
    服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
    服务器1900可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
    从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号;
    获取所述第一用户账号与第二用户账号之间的路径的路径特征信息;
    根据所述第一用户账号与第二用户账号之间的路径的路径特征信息构造特征向量;
    根据所述特征向量预测所述第一用户账号对应的第一用户与所述第二用户账号对应的第二用户之间的相识概率;
    选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    可选的,所述从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号,包括:
    从社交网络的拓扑子图中获取第一用户账号的可达关系图,所述可达关系图包括与所述第一用户账号存在间接好友关系的第二用户账号和存在直接好友关系的第三用户账号,且在所述可达关系图中所述第一用户账号与每个第二用户账号之间的路径包括的跳数不超过预设跳数阈值;
    从所述可达关系图中获取与所述第一用户账号之间的路径数目大于或等于预设数目阈值的第二用户账号。
    可选的,所述选择与所述第一用户的相识概率满足预设推荐条件的第二用户,将所述选择的第二用户推荐给所述第一用户,包括:
    获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,将所述获取的第二用户对应的第二用户账号推荐给所述第一用户;或者,
    获取与所述第一用户的相识概率大于或等于预设概率阈值的第二用户,从所述获取的第二用户中选择与所述第一用户的相识概率最大的预设数目个第二用户,将所述选择的第二用户对应的第二用户账号推荐给所述第一用户。
    进一步地,所述从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号之前,还包括:
    在所述拓扑子图中的统计每个用户账号的出边数目、入边数目和双向边数目;
    根据所述每个用户账号的出边数目和所述双向边数目计算出所述每个用户账号的出度,以及根据所述每个用户账号的入边数目和双向边数目计算出所述每个用户账号的入度;
    从所述拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号。
    可选的,所述从所述拓扑子图中过滤掉出度或入度满足预设过滤条件的用户账号,包括:
    从所述拓扑子图中过滤掉出度或入度不超过预设阈值的用户账号;和/或,
    根据所述拓扑子图中的每个用户账号的出度和入度分别计算出度均值和入度均值,计算所述每个用户账号的出度与所述出度均值之间的出度倍数以及计算所述每个用户账号的入度与所述入度均值之间的入度倍数,从所述拓扑子图中过滤掉出度倍数或入度倍数超过预设倍数阈值的用户账号。
    进一步地,所述从社交网络的拓扑子图中获取与第一用户账号的路径满足预设路径条件且与所述第一用户账号存在间接好友关系的第二用户账号之前,还包括:
    获取社交网络中的每个用户账号对应的通讯录;
    根据所述每个用户账号对应的通讯录计算任意两用户账号对应的通讯录的重合度;
    从所述拓扑子图中过滤掉重合度超过预设重合度阈值的两用户账号。
    其中,所述路径特征信息包括所述第一用户账号与所述第二用户账号之间的路径数目、所述路径包括的各种类型边的数目、所述路径上的每一跳包括的各种类型边的数目、所述第一用户账号的出度和入度、所述第二用户账号的出度和入度中的至少一者。
    在本发明实施例中,获取第一用户账号与第二用户账号之间的路径的路径特征信息,根据获取的路径特征信息构造特征向量,根据该特征向量预设第一用户账号对应的第一用户与第二用户账号对应的第二用户之间的相识概率,相识概率越大,第一用户与第二用户相识的可能性越大,如此可以尽量向第一用户推荐与第一用户相识的第二用户,从而可以提高社交网络的活跃度和存留率。
    本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
    以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

    关 键  词:
    一种 拓展 用户 关系 方法 装置
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种拓展用户关系链的方法及装置.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4071345.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1