一种面向移动社交环境的用户行为预测方法技术领域
本发明属于无线通信技术领域,具体涉及一种面向移动社交环境的用户行为
预测方法。
背景技术
随着智能移动设备和移动互联网技术的快速发展,移动社交网络(MSN)
也呈蓬勃发展势头。移动社交网络是在传统的社交网络的基础上发展起来的,主
要是为用户提供方便的网络服务和帮助。作为一种新兴的社交网络,移动社交网
络为用户提供了一个交流平台,用户可以通过移动设备和其他人进行交互,找到
拥有相同兴趣爱好的朋友圈。用户是移动社交网络的主体,通过了解用户的特性
采取一定的措施,这样才能保证移动社交网络的正常发展。为用户提供更好的服
务,满足大部分用户的需求,已经成为移动社交网络研究的重要组成部分。
而现阶段,移动互联网服务和信息内容的日益增长将逐渐超出人们所能接受
的范围,加之移动设备的界面显示、终端处理、输入/输出等能力有限,为移动
用户带来沉重的“移动信息过载问题”,导致移动网络资源利用率和用户体验受
到严重影响。而且对于大型的发展中的移动社交圈而言,网络中是否存在用户群
体,如何识别用户群体及其特征,以及为用户提供更好的服务,这都是需要进行
深入研究的。而且,移动社交环境下的用户行为分析和网络本身的性能是息息相
关的,用户是网络服务的主体,适应用户行为的网络体系才能实现资源的最优配
置。用户行为显著影响网络性能,而网络应用也必须建立在深刻了解用户行为的
基础上。因此,在未来移动社交网络的发展中,研究用户的行为特征,不仅可以
为用户提供更好的服务,提升用户体验,而且对移动社交网络的资源优化有一定
的研究意义。
移动社交网络的核心是“以人为本”,提供各种社交应用满足用户需求。虽
然,群体性是移动社交网络的一大特点,但是,在研究群体之前,必须清楚个体
的行为特征。“个性化推荐服务”已经成为提升用户体验的重要渠道。随着大数
据时代的到来,用户在移动社交网络中的业务行为也变得越来越复杂。现有的算
法难以满足日益复杂的移动社交网络的推荐需求。因此,在移动服务推荐系统中,
常用关联挖掘方法来获得用户行为之间的关联关系,分析用户的当前时刻及上一
时刻的业务行为,预测其下一时刻的业务行为。
目前,有很多关联规则挖掘算法,而Apriori算法是最经典的关联规则挖掘
算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过
程由连接与剪枝组成。针对该算法的效率瓶颈问题,结合移动社交环境的特点采
用一种基于编码的二维Apriori方法用于挖掘用户行为来提高运行效率。该方法
的核心思想和步骤是:首先统计用户上一时刻和当前时刻的业务行为,并对统计
后的数据进行二进制编码,然后采用“与”运算取代传统Apriori算法得到频繁集。
而且,朋友圈的划分以及关联结果的数据融合,提高了算法的准确性。
发明内容
为了克服上述现有技术的不足,本发明提出一种面向移动社交环境的用户行
为预测方法。该方法考虑用户受到自身的影响以及朋友圈其他用户对其的影响。
对移动社交网络的中用户行为进行预测,可有效地提高预测的准确性,适用于用
户业务推荐。
为了解决上述技术问题,本发明采用的技术方案是:
本发明即面向移动社交环境的用户行为预测方法,其具体过程为:
步骤A,采用基于编码的二维Apriori方法实现用户行为的关联分析,所述
用户行为是指用户的业务行为,包括视频业务行为,新闻业务行为,聊天文本业
务行为等,所述关联分析的具体步骤如下:
步骤A-1,将目标用户上一时刻的业务行为及当前时刻的业务行为做关联分
析,首先统计各条记录中目标用户上一时刻和当前时刻产生的业务行为,即各条
记录中如果业务行为发生记为1,不发生记为0,并对统计的数据进行二进制编
码处理,然后采用“与”运算取代传统Apriori算法得到频繁集,进而可获得频繁
关联规则,由频繁关联规则预测目标用户下一时刻产生的业务行为;
步骤A-2,将目标用户当前时刻的业务行为分别与所述移动社交环境中其n
个朋友圈用户上一时刻的业务行为做关联分析,首先统计各条记录中目标用户当
前时刻产生的业务行为及其n个朋友圈用户上一时刻产生的业务行为,即各条记
录中如果业务行为发生记为1,不发生记为0,并对统计的数据进行二进制编码,
最后采用编码“与”运算取代传统Apriori算法得到频繁集,进而可获得频繁关联
规则,由频繁关联规则预测目标用户下一时刻产生的业务行为;
步骤B,使用影响力因子公式在目标用户的朋友圈中获得n个朋友圈用户,
影响力因子公式为:
T ( m , n i ) = α * log 2 ( SN ( m , n i ) SN m + 1 ) + β * log 2 ( IN ( m , n i ) IN m + 1 ) ]]>
其中,表示一个时间段内用户m和用户ni间的影响力因子;表
示一个时间段内用户m和用户ni同时在线的在线时长,i是用户标号,为正整数;
SNm表示一个时间段内用户m的在线时长;表示一个时间段内用户m和
用户ni交互的次数,INm表示一个时间段内用户m总的交互次数。α,β为权重
参数,且α+β=1。α,β通过多次实验获得,而且影响力因子的值是介于0
和1之间的,由于考虑到实际情况,用户受自身的影响较大,所以用户受自身影
响的影响力因子设为T(m,m)=1;
步骤C,将步骤A中获得的n+1个关联分析结果视为n+1个节点,对其进
行融合分析;
假设各节点的方差分别为各个节点支持度的均值分别设为
x1,x2,....,xn+1,这些值彼此间相互独立,各个节点的权值系数分别为ω1,ω2,...,ωn+1,
则融合分析包含步骤如下:
步骤C-1,对每个节点多次采样取平均值,求出各个节点关于一个频繁关联
规则支持度的方差;
步骤C-2,求出各个节点最终的权值系数
初始权值系数ωl为:
ω l = 1 / σ l 2 Σ i = 1 n + 1 1 / σ i 2 , ]]>
则最终的权值系数为:
ω l * = l n ( e ω l * T ( m , n l ) ) 1 + l n ( Π T ( m , n l ) ) , ]]>
其中,l是节点标号,为正整数,且1≤l≤n+1;
步骤C-3,求出节点融合值x;
x = Σ l = 1 n + 1 ω l * x l , ]]>
权值系数ωl*必须满足:节点融合值x即为这个频繁关联规则的最
终支持度,x越大则表明这个频繁关联规则发生的可能性越高,由此针对用户行
为关联分析的预测建模,有效提高用户行为预测的准确性。
有益效果:
1、本发明提出了基于编码的二维Apriori方法实现用户行为的关联分析,克
服了传统Apriori方法的效率瓶颈问题,有利于提高预测模型的效率。
2、基于编码的二维Apriori方法使用编码方式来实现频繁集的获取,在做用
户行为的关联分析时可以大大降低扫描数据库的次数,节约时间。
3、本发明根据影响力因子公式获得朋友圈用户,然后分别与目标用户做关
联分析,从而有效提高预测方法的准确性。
4、本发明采用基于影响力因子改进的最优加权融合方法将关联分析结果进
行融合。有利于提高预测方法的准确性。
5、本发明产生的面向移动社交环境的用户行为预测方法非常简单而易于实
现,具有很好的应用前景。
附图说明
图1为数据融合框图。
图2为面向移动社交环境的用户行为预测方法流程图。
具体实施方式
下面结合附图对发明的技术方案进行详细说明:
本发明提出了一种面向移动社交环境的用户行为预测方法,根据移动社交环
境的群体性,交互性,实时性特点,通过基于编码的二维Apriori方法实现用户
行为分析,为用户提供准确的联合业务推荐。
本发明主要包括三个内容:一是用户行为的关联分析,利用基于编码的二维
Apriori方法实现用户业务行为的关联分析;二是朋友圈的划分,采用影响力因
子公式获得目标用户的朋友圈用户;三是将关联分析结果融合在一起,预测目标
用户下一时刻的业务行为。
1.基于编码的二维Apriori方法实现用户行为的关联分析
基于用户自身业务行为的关联分析:
首先,将某一个用户上一时刻的业务行为和当前时刻的业务行为做关联分
析。为了便于分辨,记某个目标用户为m。表1-1所示为一个简单的移动社交环
境用户m的业务行为数据表,共有7条记录,2个属性(维)。用户的业务类型
可以分成n类,如:新闻业务,视频业务,音乐业务,聊天文本业务等。
表1-1移动社交环境用户m的业务行为数据表
对表1-1的业务行为数据表用符号来表示,最终得表1-2事务数据表。
表1-2事务数据表
其中,Tj表示一个记录内目标用户上一时刻的业务行为和当前时刻的业
务行为Ik表示用户业务类型,分别表示新闻业务,视频业务,音乐业务,
聊天文本业务,游戏业务,网购业务,j是时间段标号,k是业务类型标号。
下面以表1-2所示的事务数据表为例,设最小支持度阈值为20%,利用基于
编码的二维Apriori方法生成频繁项集的过程如下:
第一步,扫描事务数据表,对事务项编码,形成项编码表,如表1-3所示:
表1-3项编码表
第二步,根据项的编码计数,得到频繁1-项集L1,如表1-4所示:
表1-4生成频繁1-项集L1
第三步,由L1生成L2,通过“与”运算就可获得结果,不需要重复扫描数据表,
如表1-5所示:
表1-5由L1生成L2
由于本发明采用的基于编码的二维Apriori方法,所以只挖掘到频繁2-项集
L2结束。设最小置信度为75%,则根据频繁项集求事务数据库D中的所有频繁
关联规则,此时,只需考虑长度大于1的频繁项目集。其中一个频繁集为
计算关联规则:的置信度,其值为100%。根据最小
置信度阈值,得到一条频繁关联规则:频繁关联规则
所表达的含义是当前时刻用户的业务是I1,则下一时刻用户最可能产生的业务为
I2,两者之间具有一定关联关系。频繁集的支持度为3/7。
多用户关联分析过程:
根据影响力因子公式获得用户m的n个朋友圈用户,然后采用基于编码的
二维Apriori方法将用户m分别及其n个朋友圈用户做关联分析。从挖掘出的频
繁集中分析其他朋友圈用户上一时刻的业务行为及用户m当前时刻的业务行为,
从而预测下一时刻用户m的业务行为。挖掘频繁集的过程与单个用户的业务行
为的关联分析过程相同。与此同时,将其他n-1个用户也分别与用户m做关联分
析,挖掘出频繁集,挖掘过程与上述相同。
2.朋友圈的划分
移动社交环境中的用户通过上网方式与其他用户交互,故可以采用用户的在
线时长和交互次数作指标来划分用户m的n个朋友圈用户,具体划分由公式(1)
获得。由于考虑到实际情况,用户受自身的影响较大,所以用户受自身影响的影
响力因子设为T(m,m)=1。划分朋友圈用户是多用户关联分析的前提条件,有利于
提高预测结果的准确性。
3.数据融合
为了给用户提供更准确的业务推荐服务,需将获得的n+1个关联分析结果做
融合分析。现将n+1个分析结果视为节点,假设各节点的方差分别为
各个节点支持度的均值分别设为x1,x2,....,xn+1,这些值彼此间相
互独立,各个节点的权值系数分别为ω1,ω2,...,ωn+1,则引入权值系数后,节点的
融合值就变为:
x = Σ l = 1 n + 1 ω l * x l - - - ( 2 ) ]]>
权值系数ωl*必须满足:l是节点标号,为正整数,且1≤l≤n+1。初
始权值系数为将每个朋友圈用户影响力因子与其对应的权值系数
中和,则最终的权值系数为:
ω l * = l n ( e ω l * T ( m , n l ) ) 1 + l n ( Π T ( m , n l ) ) - - - ( 3 ) ]]>
且满足 Σω l * = 1. ]]>
结合移动社交环境的特点,对每个节点多次采样取平均值,先求出各个节点
关于一个频繁关联规则支持度的方差,再根据式(3)求出各自的权值系数,然
后根据(2)式求出融合后的值x,x即为这个频繁关联规则的最终支持度,x越
大则表明这个频繁关联规则发生的可能性越高。具体的融合框图如图1所示,首
先,目标用户与自身做关联分析,其次,目标用户分别与朋友圈的n个用户做关
联分析,最后,将这n+1种关联分析结果融合在一起,预测目标用户下一时刻的
业务行为。
本发明即面向移动社交环境的用户行为预测方法具体的流程图如图2所示,
实现过程如下:
第一步,通过基于编码的二维Apriori方法研究基于用户自身历史业务行为
的关联分析。
第二步:采用影响力因子公式获得目标用户的n个朋友圈用户。
第三步:通过基于编码的二维Apriori方法研究基于多用户历史业务行为的
关联分析。
第四步:采用基于影响力因子公式改进的最优加权融合方法将n+1个关联分
析结果融合在一起。
第五步:由融合结果分析用户的历史业务行为信息,预测其下一时刻的业务
行为。
本行业的技术人员应了解,本发明不受上述实施例的限制,上述实施例和说
明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本
发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,
本发明要求保护范围由所附的权利要求书其等效物界定。