网站数据处理方法及装置技术领域
本发明涉及网络技术领域,尤其涉及一种网站数据处理方法及装置。
背景技术
近些年来,随着信息技术的不断发展,网站分析技术越来越成熟,其
中,网站分析中需要对促进网站转化事件发生的原因进行分析,从而获取
到促进网站转化事件发生的关键因素,可以为网站布局或者网站营销提供
帮助。其中,网站导航有效度反应的是用户在网站中借助各类导航功能,
如面包屑导航、网站地图、相关链接、信息列表等,浏览更多网页资源的
便捷度,而如何统计一个网站的导航有效度则是一个技术难点。
目前,是通过人工统计网站导航类型,然后针对每种类型进行抽样测
试得到网站导航的有效度。然而,通过人工计算网站导航的有效度主要有
三个缺点:第一,人工统计耗时较长;第二,若每隔一段时间都需要统计
导航有效度,则需要一直重复进行劳动;第三,人工统计属于抽样统计,
并且测试人员不能准确反应网站用户群体的真实导航有效度。
发明内容
鉴于上述问题,提出了本发明,以便提供一种克服上述问题或者至少
部分地解决上述问题的网站数据处理方法及装置。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种网站数据处理方法,该方法包括:
获取目标网站的用户访问数据;
从所述用户访问数据中获取用户访问目标网站的总页面数和着陆页面
数,所述着陆页面为用户访问目标网站的第一个页面;
根据所述总页面数和着陆页面数,确定所述目标网站的导航有效度。
另一方面,本发明实施例还提供了一种网站数据处理装置,该装置包
括:
获取单元,用于获取目标网站的用户访问数据;
所述获取单元,还用于从所述用户访问数据中获取用户访问目标网站
的总页面数和着陆页面数,所述着陆页面为用户访问目标网站的第一个页
面;
确定单元,用于根据所述总页面数和着陆页面数,确定所述目标网站
的导航有效度。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的网站数据处理方法及装置,首先获取目标网站的
用户访问数据,然后从所述用户访问数据中获取用户访问目标网站的总页
面数和着陆页面数,所述着陆页面为用户访问目标网站的第一个页面,最
后根据所述总页面数和着陆页面数,确定所述目标网站的导航有效度。与
目前通过人工方式统计目标网站的导航有效度相比,本发明首先从目标网
站的用户访问数据中,获取用户访问目标网站的总页面数和着陆页面数,
然后根据总页面数和着陆页面数确定目标网站的导航有效度,从而通过本
发明实现了自动获取目标网站的导航有效度,解决了人工统计目标网站的
有效度时所产生的人力资源浪费,及统计目标网站的导航有效度效率、准
确率低的问题。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于
本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目
的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符
号表示相同的部件。在附图中:
图1为本发明实施例提供的一种网站数据处理方法流程图;
图2为本发明实施例提供的另一种网站数据处理方法流程图
图3为本发明实施例提供的一种网站数据处理装置的组成框图;
图4为本发明实施例提供的另一种网站数据处理装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显
示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开
而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更
透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术
人员。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发
明作详细说明。
本发明实施例提供了一种网站数据处理方法,如图1所示,所述方法
包括:
101、获取目标网站的用户访问数据。
其中,目标网站是具有导航功能的网站,具体可以为面包屑导航、网
站地图、相关链接、信息列表等,本发明实施例不做具体限定。需要说明
的是,本发明可通过在目标网站中嵌入Tracker代码(JS脚本),收集用户
在目标网站的访问数据。
102、从所述用户访问数据中获取用户访问目标网站的总页面数和着陆
页面数。
其中,所述着陆页面为用户访问目标网站的第一个页面,着陆页面可
以是目标网站中的任意一个页面。需要说明的是,着陆页面具体可以通过
搜索引擎进入,也可以直接通过用户输入的URL地址进入,或是由其他网
站的外链接进入,本发明实施例不做具体限定。
对于本发明实施例,用户访问目标网站的总页面数是所有用户访问目
标网站的页面总数,着陆页面是根据对目标网站的用户访问数据进行逐条
解析,并从解析结果中获取用户访问目标网站的第一个页面,然后对获取
的着陆页面进行统计,得到着陆页面数。需要说明的是,由于着陆页面为
用户访问目标网站的第一个页面,因此也可用着陆页面数表示访问目标网
站用户的个数。
在本发明实施例中,若用户在着陆页面中点击了页面中的任一链接,
则认为该用户访问了其他页面,且是借助于着陆页面中的各类导航功能(如
面包屑导航、网站地图、相关链接、信息列表等),则视为目标网站的一次
有效导航,否则认为该目标网站中的着陆页面的导航未起到有效作用。因
此,可以根据总页面数和着陆页面数的差值,确定所述目标网站的有效导
航页面数。例如,用户访问目标网站的总页面数为15,着陆页面数为5,
则经过计算目标网站的有效导航页面数为10;若着陆页面数为15,则目标
网站的有效导航页面数为0,说明用户在进入目标网站的着陆页面后,未点
击页面中的任何一个链接,而是在浏览后直接退出的,因此该目标网站未
起到任何导航效果。
103、根据所述总页面数和着陆页面数,确定所述目标网站的导航有效
度。
在本发明实施例中,步骤103具体可以为:首先根据总页面数和着陆
页面数的差值得到目标网站的有效导航页面数,然后将目标网站的有效导
航页面数和总页面数的比值,确定为目标网站的导航有效度。例如,用户
访问的总页面数为20,着陆页面数为10,则目标网站的有效导航页面数为
10,目标网站的导航有效度等于目标网站的有效导航页面数比上总页面数,
即目标网站的导航有效度为50%。
对于本发明实施例,首先从目标网站的用户访问数据中,获取用户访
问目标网站的总页面数和着陆页面数,然后根据总页面数和着陆页面数确
定目标网站的导航有效度,从而通过本发明实现了自动获取目标网站的导
航有效度,解决了人工统计目标网站的有效度时所产生的人力资源浪费,
及统计目标网站的导航有效度效率、准确率低的问题。
本发明实施例提供的一种网站数据处理方法,首先获取目标网站的用
户访问数据,然后从所述用户访问数据中获取用户访问目标网站的总页面
数和着陆页面数,所述着陆页面为用户访问目标网站的第一个页面,最后
根据所述总页面数和着陆页面数,确定所述目标网站的导航有效度。与目
前通过人工方式统计目标网站的导航有效度相比,本发明首先从目标网站
的用户访问数据中,获取用户访问目标网站的总页面数和着陆页面数,然
后根据总页面数和着陆页面数确定目标网站的导航有效度,从而通过本发
明实现了自动获取目标网站的导航有效度,解决了人工统计目标网站的有
效度时所产生的人力资源浪费,及统计目标网站的导航有效度效率、准确
率低的问题。
本发明实施例提供了另一种网站数据处理方法,如图2所示,所述方
法包括:
201、获取目标网站的用户访问数据。
其中,目标网站是具有导航功能的网站,具体可以为面包屑导航、网
站地图、相关链接、信息列表等,本发明实施例不做具体限定。需要说明
的是,本发明可通过在目标网站中嵌入Tracker代码(JS脚本),收集用户
在目标网站的访问数据。
202、从所述用户访问数据中获取用户访问目标网站的总页面数和着陆
页面数。
其中,所述着陆页面为用户访问目标网站的第一个页面,着陆页面可
以是目标网站中的任意一个页面。需要说明的是,着陆页面具体可以通过
搜索引擎进入,也可以直接通过直接输入的URL地址进入,或是由其他网
站的外链接进入,本发明实施例不做具体限定。对于本发明实施例,用户
访问目标网站的总页面数是所有用户访问目标网站的页面总数,着陆页面
是根据对目标网站的用户访问数据进行逐条解析,并从解析结果中获取用
户访问目标网站的第一个页面,然后对获取的着陆页面进行统计,得到着
陆页面数。需要说明的是,由于着陆页面为用户访问目标网站的第一个页
面,因此也可用着陆页面数表示访问目标网站用户的个数。
对于本发明实施例,从所述用户访问数据中获取用户访问目标网站的
着陆页面数包括:对所述目标网站的用户访问数据进行解析;从所述解析
结果中提取所述着陆页面;对提取的着陆页面进行统计,得到所述着陆页
面数。
对于本发明实施例,所述从所述用户访问数据中获取用户访问目标网
站的总页面数和总着陆页面数包括:从所述用户访问数据中获取以特定页
面为起始的用户访问的着陆页面数和总页面数。其中,所述特定页面为目
标网站中的任意一个页面,以特定页面为起始的用户访问的着陆页面数是
以特定页面为着陆页面的访问数量,以特定页面为起始的用户访问的总页
面数是从特定页面衍生出来的访问页面的数量。在本发明实施例中,从所
述用户访问数据中获取以特定页面为起始的用户访问的着陆页面数和总页
面数,可以在后续步骤中计算目标网站中,特定页面的导航有效度,从而
提高了获取网页导航有效度的精确度。
203、根据所述总页面数和着陆页面数的差值,确定所述目标网站的有
效导航页面数。
在本发明实施例中,若用户在着陆页面中点击了页面中任一链接,则
认为该用户访问了其他页面,且是借助于着陆页面中的各类导航功能(如
面包屑导航、网站地图、相关链接、信息列表等),视为目标网站的一次有
效导航,否则认为该目标网站中的着陆页面的导航未起到有效作用。因此,
可以根据总页面数和着陆页面数的差值,确定所述目标网站的有效导航页
面数。
例如,用户访问网站的总页面数为15,着陆页面数为10,则经过计算
目标网站的有效导航页面数为5。
204、根据所述目标网站的有效导航页面数和所述总页面数的比值,确
定所述目标网站的导航有效度。
对于本发明实施例,步骤204包括:根据预置时间段内的目标网站的
有效导航页面数和所述总页面数的比值,确定所述目标网站的导航有效度。
其中,所述预置时间段可以根据用户的实际需求进行配置,也可以由系统
默认配置,本发明实施例不做具体限定。例如,预置时间段为2015年12
月25日-2015年12月26日时,则会统计出2015年12月25日-2015年12
月26日的目标网站的导航有效度。
对于本发明实施例,所述根据所述总页面数和着陆页面数,确定所述
目标网站的导航有效度包括:根据以特定页面为起始的用户访问的着陆页
面数和总页面数,确定所述特定页面的导航有效度。
在本发明实施例中,首先获取目标网站的用户访问数据,然后从所述
用户访问数据中获取用户访问目标网站的总页面数和着陆页面数,再根据
所述总页面数和着陆页面数的差值,确定所述目标网站的有效导航页面数,
最后根据所述目标网站的有效导航页面数和所述总页面数的比值,确定所
述目标网站的导航有效度,从而通过本发明实现了自动获取目标网站的导
航有效度,解决了人工统计目标网站的有效度时所产生的人力资源浪费,
及统计目标网站的导航有效度效率、准确率低的问题。
本发明提供的另一种网站数据处理方法,首先获取目标网站的用户访
问数据,然后从所述用户访问数据中获取用户访问目标网站的总页面数和
着陆页面数,所述着陆页面为用户访问目标网站的第一个页面,最后根据
所述总页面数和着陆页面数,确定所述目标网站的导航有效度。与目前通
过人工方式统计目标网站的导航有效度相比,本发明首先从目标网站的用
户访问数据中,获取用户访问目标网站的总页面数和着陆页面数,然后根
据总页面数和着陆页面数确定目标网站的导航有效度,从而通过本发明实
现了自动获取目标网站的导航有效度,解决了人工统计目标网站的有效度
时所产生的人力资源浪费,及统计目标网站的导航有效度效率、准确率低
的问题。
进一步地,本发明实施例提供一种网站数据处理装置,如图3所示,
所述装置包括:获取单元31、确定单元32。
获取单元31,用于获取目标网站的用户访问数据;
所述获取单元31,还用于从所述用户访问数据中获取用户访问目标网
站的总页面数和着陆页面数,所述着陆页面为用户访问目标网站的第一个
页面;
确定单元32,用于根据所述总页面数和着陆页面数,确定所述目标网
站的导航有效度。
需要说明的是,本发明实施例提供的一种网站数据处理装置所涉及各
功能单元的其他相应描述,可以参考图1所示方法的对应描述,在此不再
赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的
全部内容。
本发明提供的一种网站数据处理装置,首先获取目标网站的用户访问
数据,然后从所述用户访问数据中获取用户访问目标网站的总页面数和着
陆页面数,所述着陆页面为用户访问目标网站的第一个页面,最后根据所
述总页面数和着陆页面数,确定所述目标网站的导航有效度。与目前通过
人工方式统计目标网站的导航有效度相比,本发明首先从目标网站的用户
访问数据中,获取用户访问目标网站的总页面数和着陆页面数,然后根据
总页面数和着陆页面数确定目标网站的导航有效度,从而通过本发明实现
了自动获取目标网站的导航有效度,解决了人工统计目标网站的有效度时
所产生的人力资源浪费,及统计目标网站的导航有效度效率、准确率低的
问题。
进一步地,本发明实施例提供另一种网站数据处理装置,如图4所示,
所述装置包括:获取单元41、确定单元42。
获取单元41,用于获取目标网站的用户访问数据;
所述获取单元41,还用于从所述用户访问数据中获取用户访问目标网
站的总页面数和着陆页面数,所述着陆页面为用户访问目标网站的第一个
页面;
确定单元42,用于根据所述总页面数和着陆页面数,确定所述目标网
站的导航有效度。
所述确定单元42,还用于根据所述总页面数和着陆页面数的差值,确
定所述目标网站的有效导航页面数。
所述确定单元42,具体用于根据所述目标网站的有效导航页面数和所
述总页面数的比值,确定所述目标网站的导航有效度。
所述确定单元42,具体用于根据预置时间段的目标网站的有效导航页
面数和所述总页面数的比值,确定所述目标网站的导航有效度。
进一步地,所述获取单元41包括:
解析模块411,用于对所述目标网站的用户访问数据进行解析;
提取模块412,用于从所述解析结果中提取所述着陆页面;
统计模块413,用于对提取的着陆页面进行统计,得到所述着陆页面数。
所述获取单元41,具体用于从所述用户访问数据中获取以特定页面为
起始的用户访问的着陆页面数和总页面数;
所述确定模块42,具体用于根据以特定页面为起始的用户访问的着陆
页面数和总页面数,确定所述特定页面的导航有效度。
需要说明的是,本发明实施例提供的一种网站数据处理装置所涉及各
功能单元的其他相应描述,可以参考图2所示方法的对应描述,在此不再
赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的
全部内容。
本发明提供的另一种网站数据处理装置,首先获取目标网站的用户访
问数据,然后从所述用户访问数据中获取用户访问目标网站的总页面数和
着陆页面数,所述着陆页面为用户访问目标网站的第一个页面,最后根据
所述总页面数和着陆页面数,确定所述目标网站的导航有效度。与目前通
过人工方式统计目标网站的导航有效度相比,本发明首先从目标网站的用
户访问数据中,获取用户访问目标网站的总页面数和着陆页面数,然后根
据总页面数和着陆页面数确定目标网站的导航有效度,从而通过本发明实
现了自动获取目标网站的导航有效度,解决了人工统计目标网站的有效度
时所产生的人力资源浪费,及统计目标网站的导航有效度效率、准确率低
的问题。
所述网站数据处理装置包括处理器和存储器,上述获取单元和确定单
元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上
述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可
以设置一个或以上,通过调整内核参数来提高获取目标网站的导航有效度
的效率及准确率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储
器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash
RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,
适于执行初始化有如下方法步骤的程序代码:获取目标网站的用户访问数
据;从所述用户访问数据中获取用户访问目标网站的总页面数和着陆页面
数,所述着陆页面为用户访问目标网站的第一个页面;根据所述总页面数
和着陆页面数,确定所述目标网站的导航有效度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、
或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施
例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个
或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不
限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的
形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序
产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流
程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中
的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专
用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个
机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产
生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方
框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理
设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存
储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个
流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备
上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机
实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现
在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的
功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/
输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储
器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash
RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以
由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结
构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相
变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器
(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可
擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光
盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁
盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,
可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读
介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载
波。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技
术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之
内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范
围之内。