《一种确定移动用户的常驻点信息的方法和装置.pdf》由会员分享,可在线阅读,更多相关《一种确定移动用户的常驻点信息的方法和装置.pdf(19页完整版)》请在专利查询网上搜索。
1、10申请公布号CN104252527A43申请公布日20141231CN104252527A21申请号201410443562322申请日20140902G06F17/3020060171申请人百度在线网络技术(北京)有限公司地址100085北京市海淀区上地十街10号百度大厦72发明人邢皖甲熊磊74专利代理机构北京汉昊知识产权代理事务所普通合伙11370代理人罗朋54发明名称一种确定移动用户的常驻点信息的方法和装置57摘要本发明提出了一种在计算机设备中确定移动用户的常驻点信息的方法,其中,该方法包括以下步骤A获取所述移动用户的多个时空点信息,其中,所述时空点信息用于指示所述移动用户的空间位置以。
2、及移动用户位于该空间位置时对应的时间点信息;B基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息。根据本发明的方案,可根据移动用户的时空点信息确定移动用户的多个常驻点信息,并确定该等常驻点信息的类型。51INTCL权利要求书3页说明书13页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书13页附图2页10申请公布号CN104252527ACN104252527A1/3页21一种在计算机设备中确定移动用户的常驻点信息的方法,其中,该方法包括以下步骤A获取所述移动用户的多个时空点信息,其中,所述时空点信息用于指示所述移动用户的空间位置以及移。
3、动用户位于该空间位置时对应的时间点信息;B基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息。2根据权利要求1所述的方法,其中,所述聚类算法需要设定聚类中心的数量。3根据权利要求2所述的方法,其中,所述步骤B包括以下步骤B1对于多个假设数量的全部或部分中的每个假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量;B2根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息。4根据权利要求3所述的方法,其中,。
4、所述步骤B1包括以下步骤B111对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果;B112当该假设数量对应的聚类结果符合第一预定条件时,将该假设数量作为所述所选择的假设数量;B113当该假设数量对应的聚类结果不符合所述第一预定条件时,重复所述步骤B111。5根据权利要求3所述的方法,其中,所述多个假设数量递增或递减,所述步骤B1包括以下步骤B121将所述多个假设数量中的一个假设数量作为当前假设数量,将所述聚类算法的聚类中心的数量设定为该当前假设数量,并基。
5、于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该当前假设数量对应的聚类结果;B122将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该下一个假设数量对应的聚类结果;B123当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时,将该当前假设数量作为所述所选择的假设数量;B124当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时,将该下一个假设数量作为该当前假设数量,重复所述步骤B122。6根据权利要求3所述的方法,其中,所述步骤B1包括以下步骤对于多个假设数量中的每个假设数量,。
6、将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果;根据所述多个假设数量分别对应的多个聚类结果,选择一个假设数量。7根据权利要求3至6中任一项所述的方法,其中,基于以下至少一项,来根据多个假设数量分别对应的多个聚类结果选择一个假设数量权利要求书CN104252527A2/3页3假设数量对应的聚类结果中的类包含的时空点信息的数量;假设数量对应的聚类结果中的类的离散度。8根据权利要求1至7中任一项所述的方法,其中,该方法还包括以下步骤X根据所述多个常驻点信息,确定所述多个常驻点信息中的每个常驻点信息的类型。9根据权利要。
7、求8所述的方法,其中,所述步骤X包括对所述多个常驻点信息中的每个执行的以下步骤获取该常驻点信息的位置属性信息和时间属性信息;根据所述位置属性信息和时间属性信息,确定该常驻点信息的类型。10根据权利要求1至9中任一项所述的方法,其中,所述时空点信息为四维空间向量。11一种在计算机设备中确定移动用户的常驻点信息的装置,其中,该装置包括以下装置用于获取所述移动用户的多个时空点信息的装置,其中,所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息;用于基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息的装置。12根据权利要求11所述的装。
8、置,其中,所述聚类算法需要设定聚类中心的数量。13根据权利要求12所述的装置,其中,所述用于确定多个常驻点信息的装置包括以下装置用于对于多个假设数量的全部或部分中的每个假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量的装置;用于根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息的装置。14根据权利要求13所述的装置,其中,所述用于选择一个假设数量的装置包括以下装置用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量,。
9、将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果的装置;用于当该假设数量对应的聚类结果符合第一预定条件时,将该假设数量作为所述所选择的假设数量的装置;用于当该假设数量对应的聚类结果不符合所述第一预定条件时,触发所述用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量,获得与该假设数量对应的聚类结果的装置重复执行操作的装置。15根据权利要求13所述的装置,其中,所述多个假设数量递增或递减,所述用于选择一个假设数量的装置包括以下装置用于将所述多个假设数量中的一个假设数量作为当前假设数量,将所述聚类算法的聚类。
10、中心的数量设定为该当前假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该当前假设数量对应的聚类结果的装置;权利要求书CN104252527A3/3页4用于将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该下一个假设数量对应的聚类结果的装置;用于当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时,将该当前假设数量作为所述所选择的假设数量的装置;用于当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时,将该下一个假设数量作为该当前假设数量,触发所述用于获得与该下一个假。
11、设数量对应的聚类结果的装置重复执行操作的装置。16根据权利要求13所述的装置,其中,所述用于选择一个假设数量的装置包括以下装置用于对于多个假设数量中的每个假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果的装置;用于根据所述多个假设数量分别对应的多个聚类结果,选择一个假设数量的装置。17根据权利要求13至16中任一项所述的装置,其中,基于以下至少一项,来根据多个假设数量分别对应的多个聚类结果选择一个假设数量假设数量对应的聚类结果中的类包含的时空点信息的数量;假设数量对应的聚类结果中的类的离散度。18根据权。
12、利要求11至17中任一项所述的装置,其中,该装置还包括以下装置用于根据所述多个常驻点信息,确定所述多个常驻点信息中的每个常驻点信息的类型的装置。19根据权利要求18所述的装置,其中,所述用于确定常驻点信息的类型的装置包括对所述多个常驻点信息中的每个执行操作的以下装置用于获取该常驻点信息的位置属性信息和时间属性信息的装置;用于根据所述位置属性信息和时间属性信息,确定该常驻点信息的类型的装置。20根据权利要求11至19中任一项所述的装置,其中,所述时空点信息为四维空间向量。权利要求书CN104252527A1/13页5一种确定移动用户的常驻点信息的方法和装置技术领域0001本发明涉及计算机技术领域。
13、,尤其涉及一种在计算机设备中确定移动用户的常驻点信息的方法和装置。背景技术0002现有技术中,通常仅会获取移动用户的一个当前位置,例如通过移动用户主动上报或者触发移动用户上报等方式,获取移动用户的当前位置。进而,基于该当前位置来进行诸如定位等操作。发明内容0003本发明的目的是提供一种在计算机设备中确定移动用户的常驻点信息的方法和装置。0004根据本发明的一个方面,提供一种在计算机设备中确定移动用户的常驻点信息的方法,其中,该方法包括以下步骤0005A获取所述移动用户的多个时空点信息,其中,所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息;0006B基于。
14、聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息。0007根据本发明的另一个方面,还提供了一种在计算机设备中确定移动用户的常驻点信息的装置,其中,该装置包括以下装置0008用于获取所述移动用户的多个时空点信息的装置,其中,所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息;0009用于基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息的装置。0010与现有技术相比,本发明具有以下优点1可通过对移动用户的时空点信息进行聚类分析,来确定移动用户的多个常驻点,从而可更准确地了解移动用户的活动范围以及生活规。
15、律;2可根据移动用户的多个常驻点信息,确定移动用户的每个常驻点的类型,且在一定程度上预测用户在某常驻点区域出现的概率。附图说明0011通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显0012图1为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图;0013图2为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图;说明书CN104252527A2/13页60014图3为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图;0015图4为本发明另一个实施例的在计算机设备中确定。
16、移动用户的常驻点信息的装置的结构示意图。0016附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式0017下面结合附图对本发明作进一步详细描述。0018图1为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图。0019其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算CLOUDCOMPUTING的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络包括但不限于互联。
17、网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。0020需要说明的是,所述计算机设备仅为举例,其他现有的或今后可能出现的计算设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。0021根据本实施例的方法包括步骤S1和步骤S2。0022在步骤S1中,计算机设备获取移动用户的多个时空点信息。0023其中,所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息。优选地,所述时空点信息可具有多种表现形式,包括但不限于一个度量的向量、多维空间中的一个点等;更优选地,所述时空点信息为四。
18、维空间向量。0024例如,移动用户的一个时空点信息为四维空间向量A,B,C,D,其中,A,B,C为移动用户的空间位置的坐标,D为移动用户位于该空间位置时对应的时间点信息。0025具体地,计算机设备可通过多种方式获取移动用户的多个时空点信息。例如,计算机设备接收来自其他计算机设备的、移动用户的多个时空点信息;又例如,移动用户定时向计算机设备上报其时空点信息,则在一段时间内,计算机设备接收移动用户所上报的多个时空点信息等。0026需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取移动用户的多个时空点信息的实现方式,均应包含在本发明的范围内。0。
19、027在步骤S2中,计算机设备基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息。0028其中,所述聚类算法包括任何可用于进行聚类分析的算法,例如,基于密度的聚类算法、EM算法等。优选地,所述聚类算法需要设定聚类中心的数量;更优选地,所述聚类算法为基于密度的聚类算法。0029其中,所述常驻点信息包括用于指示移动用户的常驻点的任何信息;优选地,所述说明书CN104252527A3/13页7常驻点信息包括与移动用户的常驻点相关的任何信息;优选地,可直接将聚类分析获得的聚类结果中的类作为常驻点信息。更优选地,可通过对聚类结果中的类进行统计分析,来确定该类对应的常驻点信息。
20、,其中,所述常驻点信息包括位置属性信息和时间属性信息,所述位置属性信息用于指示该常驻点的空间位置或位置范围,所述时间属性信息用于指示移动用户位于该常驻点时的多个时间点信息或时间范围。0030具体地,计算机设备基于聚类算法对所述多个时空点信息进行聚类分析,来获得包括多个类的聚类结果,并根据该多个类来确定移动用户的多个常驻点信息。0031例如,计算机设备将聚类算法的聚类中心的数量设定为预定数量,如4;计算机设备从所述多个时空点信息中选择4个时空点信息作为聚类中心,对于多个时空点信息中的每个时空点信息,计算机设备计算该时空点信息分别与该4个聚类中心之间的距离,并将该时空点信息归类到最小距离所对应的聚。
21、类中心;之后,计算机设备根据聚类结果中的4个类,来确定移动用户的4个常驻点信息。0032作为本实施例的一种优选方案,所述聚类算法需要设定聚类中心的数量。0033其中,计算机设备基于该需要设定聚类中心的聚类算法,来对所述多个时空点信息进行聚类分析,并确定所述移动用户的多个常驻点信息的方式包括但不限于00341聚类算法的聚类中心的数量已预先确定,则计算机设备直接基于已确定的聚类中心的数量,运行聚类算法以对所述多个时空点信息进行聚类分析,并确定所述移动用户的多个常驻点信息。00352聚类算法的聚类中心的数量并未确定,则在此情况下,计算机设备需要先确定一个合适的聚类中心的数量。0036具体地,本实现方。
22、式中,计算机设备可从多个假设数量中确定一个合适的假设数量,作为聚类中心的数量。所述步骤S2进一步包括步骤S21和步骤S22。0037在步骤S21中,对于多个假设数量的全部或部分中的每个假设数量,计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量。0038优选地,计算机设备基于以下至少一项,来根据多个假设数量分别对应的多个聚类结果选择一个假设数量0039假设数量对应的聚类结果中的类包含的时空点信息的数量。0040优选地,类中包含的时空点信息的数量越。
23、多,则通常聚类结果越好。0041假设数量对应的聚类结果中的类的离散度。0042优选地,类的离散度越低,则通常聚类结果越好。0043其中,所述离散度用于指示类的密集程度。其中,计算机设备可采用多种方式来确定所述离散度,如,计算机设备根据类中的所有时空点信息确定类的均值,并计算每个时空点信息与该均值之间的极差、平均差或标准差等来表示该类的离散度。0044需要说明的是,所述步骤S21可采用多种方式来实现。例如,步骤S21的实现方式包括但不限于0045A本实现方式中,所述步骤S21进一步包括步骤S2111、步骤S2112和步骤S2113。0046在步骤S2111中,对于所述多个假设数量中一个未确定其对。
24、应的聚类结果的假设说明书CN104252527A4/13页8数量,计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果。0047在步骤S2112中,当该假设数量对应的聚类结果符合第一预定条件时,计算机设备将该假设数量作为所述所选择的假设数量。0048其中,所述第一预定条件包括任何预定的用于选择假设数量的条件。优选地,所述第一预定条件包括但不限于0049该聚类结果中的类包含的时空点信息的数量超过预定数量阈值。0050该聚类结果中的类的离散度低于预定离散度阈值。0051例如,预定数量阈值为100,假设数量对应的。
25、聚类结果中包括4个类,该4个类中时空点信息的数量分别为120、110、108、150。则在步骤S2112中,计算机设备确定假设数量对应的聚类结果的每个类中的时空点信息的数量均超过预定数量阈值,则计算机设备确定该聚类结果符合第一预定条件,且将该假设数量作为所选择的假设数量。0052在步骤S2113中,当该假设数量对应的聚类结果不符合所述第一预定条件时,计算机设备重复所述步骤S2111。0053具体地,当该假设数量对应的聚类结果不符合第一预定条件时,计算机设备重复步骤S2111,来获得未确定其对应的聚类结果的假设数量所对应的聚类结果;依次类推,直至一个假设数量对应的聚类结果符合第一预定条件时,将该。
26、假设数量作为所选择的假设数量,并停止操作。0054例如,多个假设数量包括从2至1000的所有自然数。第一次执行步骤S2111时,计算机设备选择的假设数量为2,并在将聚类中心的数量设定为2的情况下,基于聚类算法对所述多个时空点信息进行聚类分析,获得与假设数量“2”对应的聚类结果;接着,计算机设备判断“2”对应的聚类结果不符合所述第一预定条件,在步骤S2113中,计算机设备重复步骤S2111,选择未确定其对应的聚类结果的假设数量“4”,并确定其聚类结果;接着,计算机设备判断“4”对应的聚类结果不符合所述第一预定条件,继续执行步骤S2113;以此类推,直至计算机设备获得符合第一预定条件的假设数量“5。
27、”,并执行步骤S2112,将“5”作为所选择的假设数量。0055本实现方式中,计算机设备仅需要获得一个符合第一预定条件的假设数量,即可基于该假设数量执行后续操作,而无需遍历并获得所有假设数量的聚类结果。0056B本实现方式中,所述多个假设数量递增或递减,所述步骤S21进一步包括步骤S2121、步骤S2122、步骤S2123和步骤S2124。0057在步骤S2121中,计算机设备将所述多个假设数量中的一个假设数量作为当前假设数量,将所述聚类算法的聚类中心的数量设定为该当前假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该当前假设数量对应的聚类结果。0058例如,多个假设数量包。
28、括从2至1000递增的多个自然数。在步骤S2121中,计算机设备将“2”作为当前假设数量,并将聚类算法的聚类中心的数量设定为“2”,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与“2”对应的聚类结果。0059在步骤S2122中,计算机设备将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该下一个假设数量对应的聚类结果。说明书CN104252527A5/13页90060例如,计算机设备将聚类算法的聚类中心的数量设定为“2”的下一个假设数量“3”,并基于聚类算法对所述多个时空点信息进行聚类分析,获得与该下一个假。
29、设数量对应的聚类结果。0061在步骤S2123中,当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时,计算机设备将该当前假设数量作为所述所选择的假设数量。0062优选地,可根据聚类结果中类的离散度和/或类包含的时空信息点的数量来确定下一个假设数量对应的聚类结果是否差于该当前假设数量对应的聚类结果。0063例如,可计算下一个假设数量对应的聚类结果中类之间的方差E1,以及当前假设数量对应的聚类结果中类之间的方差E2,并比较E1和E2,当E1大于E2,计算机设备可确定下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果;当E1小于E2,计算机设备可确定下一个假设数量对应的聚。
30、类结果优于该当前假设数量对应的聚类结果。0064在步骤S2124中,当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时,计算机设备将该下一个假设数量作为该当前假设数量,重复所述步骤S2122。0065例如,当前假设数量为“2”,且“2”的下一个假设数量为“3”,且“3”对应的聚类结果优于“2”对应的聚类结果,则计算机设备将“3”作为当前假设数量,并重复步骤S2122,获得“4”的聚类结果;接着,若“4”对应的聚类结果优于“3”对应的聚类结果,则计算机设备将“4”作为当前假设数量,继续重复步骤S2122;以此类推,直至下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果。
31、时,在步骤S2123中,计算机设备将该当前假设数量作为所述所选择的假设数量。0066由于当多个假设数量呈现出递增或递减关系时,一个最佳的假设数量对应的聚类结果,会优于其相邻两个假设数量对应的聚类结果,因此,本实现方式中,计算机设备可获得最佳的假设数量。并且,由于获得最佳假设数量后即可基于该假设数量执行后续操作,而无需继续获取其他假设数量的聚类结果,故通常情况下,本实现方式无需遍历并获得所有假设数量的聚类结果。0067C所述步骤S21进一步包括步骤S2131和步骤S2132。0068在步骤2131中,对于多个假设数量中的每个假设数量,计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量,并基。
32、于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果。0069例如,存在4个假设数量2、3、4、5。计算机设备基于所述聚类算法分别获得聚类中心的数量为2时的聚类结果、聚类中心的数量为3时的聚类结果、聚类中心的数量为4时的聚类结果、以及聚类中心的数量为5时的聚类结果。0070在步骤2132中,计算机设备根据所述多个假设数量分别对应的多个聚类结果,选择一个假设数量。0071其中,计算机设备根据多个假设数量分别对应的多个聚类结果选择一个假设数量的实现方式已在前文中予以详述,在此不再赘述。0072需要说明的是,多个假设数量可表现为集合的形式,如为集合2,3,4,1000,则计。
33、算机设备可直接从该集合中读取假设数量。或者,多个假设数量可表现为公式的形式,如KKN;其中,K表示假设数量,K为基数通常K可取2,1,N0,1,2,998;说明书CN104252527A6/13页10则计算机设备可通过该公式来计算得到其需要的假设数量。0073需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对于多个假设数量的全部或部分中的每个假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量的。
34、实现方式,均应包含在本发明的范围内。0074在步骤S22中,计算机设备根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息。0075其中,计算机设备可采用多种方式根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息。0076例如,计算机设备可直接将聚类结果的多个类作为移动用户的多个常驻点信息。0077又例如,对于聚类结果中的每个类,计算机设备可通过对该类进行统计分析,如分别对该类中的所有时空点信息的空间位置和时间点信息进行统计,来确定该类对应的常驻点信息。0078需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任。
35、何根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息的实现方式,均应包含在本发明的范围内。0079根据本实施例的方案,可通过对移动用户的时空点信息进行聚类分析,来确定移动用户的多个常驻点,从而可更准确地了解移动用户的活动范围以及生活规律。0080图2为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图。本实施例的方法主要由计算机设备来实现,其中,参照图1所示实施例中对计算机设备所做的任何说明,均以引用的方式包含于此。0081根据本实施例的方法包括步骤S1、步骤S2和步骤S3。其中,所述步骤S1和步骤S2已在参照图1所示实施例中予以详述,在此不再赘述。。
36、0082在步骤S3中,计算机设备根据所述多个常驻点信息,确定所述多个常驻点信息中的每个常驻点信息的类型0083其中,所述常驻点信息的类型用于指示移动用户的常驻点的性质,如家、餐厅、娱乐场所、工作地等。0084具体地,对于每个常驻点信息,计算机设备通过分析该常驻点信息,确定该常驻点信息的类型。0085例如,根据常驻点信息以及地图,计算机设备确定该常驻点信息所对应的位置范围在一个居民区内,则计算机设备确定该常驻点信息的类型为家。0086优选地,所述步骤S3进一步包括对所述多个常驻点信息中的每个执行的步骤S31和步骤S32。0087在步骤S31中,计算机设备获取该常驻点信息的位置属性信息和时间属性信。
37、息。0088其中,计算机设备可采用多种方式获取该常驻点信息的位置属性信息和时间属性信息。0089例如,当所述常驻点信息为聚类结果中的类时,计算机设备对该类中的所有时空点信息进行统计分析,来根据所有时空点信息中的空间位置获得该常驻点信息的位置属性说明书CN104252527A107/13页11信息,并根据所有时空点信息中的时间点信息获得该常驻点信息的时间属性信息。0090又例如,当所述常驻点信息是通过对聚类结果中的类进行统计分析来得到的时,计算机设备可直接从该常驻点信息中提取该常驻点信息的位置属性信息和时间属性信息。0091需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制。
38、,本领域技术人员应该理解,任何获取该常驻点信息的位置属性信息和时间属性信息的实现方式,均应包含在本发明的范围内。0092在步骤S32中,计算机设备根据所述位置属性信息和时间属性信息,确定该常驻点信息的类型。0093例如,常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在每周周一至周五的900至1800,且该常驻点信息的位置属性信息指示该常驻点的位置为一个办公楼,则计算机设备确定该常驻点信息的类型为工作地。0094又例如,常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在周末的2100至2400,且该常驻点信息的位置属性信息指示该常驻点位于商业区附近,则计算机设备。
39、确定该常驻点信息的类型为娱乐场所。0095需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述位置属性信息和时间属性信息,确定该常驻点信息的类型的实现方式,均应包含在本发明的范围内。0096根据本实施例的方案,可根据移动用户的多个常驻点信息,确定移动用户的每个常驻点的类型,且在一定程度上预测用户在某常驻点区域出现的概率。0097图3为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图。根据本实施例的确定移动用户的常驻点信息的装置包括用于获取所述移动用户的多个时空点信息的装置以下简称“第一获取装置1”以及用于基于聚。
40、类算法对所述多个时空点信息进行聚类分析,来确定所述移动用户的多个常驻点信息的装置以下简称“第一确定装置2”。0098第一获取装置1获取移动用户的多个时空点信息。0099其中,所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息。优选地,所述时空点信息可具有多种表现形式,包括但不限于一个度量的向量、多维空间中的一个点等;更优选地,所述时空点信息为四维空间向量。0100例如,移动用户的一个时空点信息为四维空间向量A,B,C,D,其中,A,B,C为移动用户的空间位置的坐标,D为移动用户位于该空间位置时对应的时间点信息。0101具体地,第一获取装置1可通过多种方式获。
41、取移动用户的多个时空点信息。例如,第一获取装置1接收来自其他计算机设备的、移动用户的多个时空点信息;又例如,移动用户定时向计算机设备上报其时空点信息,则在一段时间内,第一获取装置1接收移动用户所上报的多个时空点信息等。0102需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取移动用户的多个时空点信息的实现方式,均应包含在本发明的范围内。0103第一确定装置2基于聚类算法对所述多个时空点信息进行聚类分析,来确定所述说明书CN104252527A118/13页12移动用户的多个常驻点信息。0104其中,所述聚类算法包括任何可用于进行聚类分析的。
42、算法,例如,基于密度的聚类算法、EM算法等。优选地,所述聚类算法需要设定聚类中心的数量;更优选地,所述聚类算法为基于密度的聚类算法。0105其中,所述常驻点信息包括用于指示移动用户的常驻点的任何信息;优选地,所述常驻点信息包括与移动用户的常驻点相关的任何信息;优选地,可直接将聚类分析获得的聚类结果中的类作为常驻点信息。更优选地,可通过对聚类结果中的类进行统计分析,来确定该类对应的常驻点信息,其中,所述常驻点信息包括位置属性信息和时间属性信息,所述位置属性信息用于指示该常驻点的空间位置或位置范围,所述时间属性信息用于指示移动用户位于该常驻点时的多个时间点信息或时间范围。0106具体地,第一确定装。
43、置2基于聚类算法对所述多个时空点信息进行聚类分析,来获得包括多个类的聚类结果,并根据该多个类来确定移动用户的多个常驻点信息。0107例如,第一确定装置2将聚类算法的聚类中心的数量设定为预定数量,如4;第一确定装置2从所述多个时空点信息中选择4个时空点信息作为聚类中心,对于多个时空点信息中的每个时空点信息,第一确定装置2计算该时空点信息分别与该4个聚类中心之间的距离,并将该时空点信息归类到最小距离所对应的聚类中心;之后,第一确定装置2根据聚类结果中的4个类,来确定移动用户的4个常驻点信息。0108作为本实施例的一种优选方案,所述聚类算法需要设定聚类中心的数量。0109其中,第一确定装置2基于该需。
44、要设定聚类中心的聚类算法,来对所述多个时空点信息进行聚类分析,并确定所述移动用户的多个常驻点信息的方式包括但不限于01101聚类算法的聚类中心的数量已预先确定,则第一确定装置2直接基于已确定的聚类中心的数量,运行聚类算法以对所述多个时空点信息进行聚类分析,并确定所述移动用户的多个常驻点信息。01112聚类算法的聚类中心的数量并未确定,则在此情况下,第一确定装置2需要先确定一个合适的聚类中心的数量。0112具体地,本实现方式中,第一确定装置2可从多个假设数量中确定一个合适的假设数量,作为聚类中心的数量。第一确定装置2进一步包括用于对于多个假设数量的全部或部分中的每个假设数量,将所述聚类算法的聚类。
45、中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量的装置图未示,以下简称“选择装置”以及用于根据所选择的假设数量对应的聚类结果,确定所述移动用户的多个常驻点信息的装置图未示,以下简称“第一子确定装置”。0113对于多个假设数量的全部或部分中的每个假设数量,选择装置将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果,并根据多个假设数量分别对应的多个聚类结果,选择一个假设数量。0114优选地,选择装置。
46、基于以下至少一项,来根据多个假设数量分别对应的多个聚类结果选择一个假设数量0115假设数量对应的聚类结果中的类包含的时空点信息的数量。说明书CN104252527A129/13页130116优选地,类中包含的时空点信息的数量越多,则通常聚类结果越好。0117假设数量对应的聚类结果中的类的离散度。0118优选地,类的离散度越低,则通常聚类结果越好。0119其中,所述离散度用于指示类的密集程度。其中,选择装置可采用多种方式来确定所述离散度,如,计算机设备根据类中的所有时空点信息确定类的均值,并计算每个时空点信息与该均值之间的极差、平均差或标准差等来表示该类的离散度。0120需要说明的是,选择装置可。
47、采用多种方式来实现。例如,选择装置的实现方式包括但不限于0121A本实现方式中,选择装置进一步包括用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量,将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果的装置图未示,以下简称“第一聚类装置”、用于当该假设数量对应的聚类结果符合第一预定条件时,将该假设数量作为所述所选择的假设数量的装置图未示,以下简称“第一设定装置”以及用于当该假设数量对应的聚类结果不符合所述第一预定条件时,触发所述第一聚类装置重复执行操作的装置图未示,以下简称“第一触发装置”。0122对于。
48、所述多个假设数量中一个未确定其对应的聚类结果的假设数量,第一聚类装置将所述聚类算法的聚类中心的数量设定为该假设数量,并基于所述聚类算法对所述多个时空点信息进行聚类分析,获得与该假设数量对应的聚类结果。0123当该假设数量对应的聚类结果符合第一预定条件时,第一设定装置将该假设数量作为所述所选择的假设数量。0124其中,所述第一预定条件包括任何预定的用于选择假设数量的条件。优选地,所述第一预定条件包括但不限于0125该聚类结果中的类包含的时空点信息的数量超过预定数量阈值。0126该聚类结果中的类的离散度低于预定离散度阈值。0127例如,预定数量阈值为100,假设数量对应的聚类结果中包括4个类,该4。
49、个类中时空点信息的数量分别为120、110、108、150。则第一设定装置确定假设数量对应的聚类结果的每个类中的时空点信息的数量均超过预定数量阈值,则第一设定装置确定该聚类结果符合第一预定条件,且将该假设数量作为所选择的假设数量。0128当该假设数量对应的聚类结果不符合所述第一预定条件时,第一触发装置触发所述第一聚类装置重复执行操作。0129具体地,当该假设数量对应的聚类结果不符合第一预定条件时,第一触发装置触发所述第一聚类装置重复执行操作,来获得未确定其对应的聚类结果的假设数量所对应的聚类结果;依次类推,直至一个假设数量对应的聚类结果符合第一预定条件时,第一设定装置将该假设数量作为所选择的假设数量,并停止操作。0130例如,多个假设数量包括从2至1000的所有自然数。第一聚类装置第一次执行操作时,选择的假设数量为2,并在将聚类中心的数量设定为2的情况下,基于聚类算法对所述多个时空点信息进行聚类分析,获得与假设数量“2”对应的聚类结果;接着,由于“2”对应的聚类结果不符合所述第一预定条件,第一触发装置触发所述第一聚类装置重复执行操作,选择未确定其对应的聚类结果的假设数量“4”,并确定其聚类结果;接着,由于“4”对应说明书CN104252527A1310/13页14的聚类结果不符合所述第一预定条件,第一触发装置继续触发所述第一聚类装置重复执行操作;以此类推,直至。