一种校验网络业务运营数据的方法及装置 【技术领域】
本发明涉及数据校验技术, 特别是指一种校验网络业务运营数据的方法及装置。背景技术 随着网络的飞速发展, 各种各样的网络业务层出不穷, 参与各类业务的用户也越 来越多 ; 相应的, 根据网络业务运营数据来统计和分析某种或某类网络业务的运营情况, 对 于运营商而言是非常必要和非常重要的。
以网络业务是网络游戏为例来说明, 这里, 所谓网络游戏是运营商通过互联网构 建的支持众多用户同时参与游戏的虚拟空间, 一般, 网络游戏涉及的业务运营数据包括但 不限于 : 服务器平均在线用户数 (ACU), 即: 一个运营日所有时间点对应的同时在线用户的 平均值 ; 日活跃用户数, 即: 一个运营日内登录过游戏的用户数 ; 人均在线时长, 即: 当日活 跃用户在线时长的平均值。只有对这些数据进行详细地采集和分析, 才能获得相应网络业 务准确的运营情况。 那么, 对于所获得的 ACU、 日活跃用户数、 人均在线时长等网络业务运营 数据, 同样存在需要校验所获得数据是否准确的问题, 如果所获得的数据不准确, 就不可能 得到精确的分析结果。
目前, 对于日活跃用户数、 ACU、 人均在线时长等网络业务运营数据指标的准确性 判断, 大都是通过结合游戏运营日志数据和游戏数据对单个数据指标进行核查来实现的, 其中, 所述游戏运营日志数据是指记录用户行为和操作的日志数据, 如登录信息、 登出信息 等, 是游戏 LOG 数据库中的相关数据 ; 所述游戏数据是指支撑游戏运行的数据信息, 如用户 角色属性等, 是游戏 Game 数据库中的相关数据。具体的, 现有技术可采用以下两种方式校 验网络业务运营数据 :
第一种, 通过逐个数据指标如日活跃用户数、 ACU、 人均在线时长, 核查游戏运营日 志数据和游戏数据, 以判断单个数据指标的准确性。比如, 对于日活跃用户数指标, 是从游 戏用户登录、 登出日志中获取数据, 并计算有多少用户当天登录游戏, 即处于活跃状态, 这 样的数据就确定为游戏运营日志数据。但是, 以此判断这个数据指标的准确性有一定的弊 端, 因为与游戏运营各指标所关联的日志内容有可能因网络波动等环境因素而导致数据丢 失, 或因开发人员疏忽等因素而导致日志内容记录不完整等, 如果有记录遗漏、 或其他因素 导致的数据丢失等, 均会影响各数据指标计算结果的准确性, 影响游戏运营效果的准确性 判断 ; 如果预估这个数据错误, 也只能逐条去查游戏运营日志数据, 在数据量大的情况下, 是不可取的。
第二种, 通过逐条日志内容或游戏数据内容来核查游戏数据日志记录的准确性。 比如, 对于日活跃用户数指标, 是通过查询游戏用户角色信息表中最近刷新时间, 即: 最近 登录时间来计算活跃用户数, 这种方法相对准确一些。但是, 一方面, 通过核查日志内容或 游戏数据来判断单个数据指标的准确性比较繁琐, 往往会消耗较多时间, 而难以准确定位 具体错误原因 ; 另一方面, 有些游戏的角色信息表中未设置最近刷新时间这个字段, 这种情 况下, 就不能通过这种方式计算活跃用户数。
上述两种方法从不同角度说明 : 现有技术对网络业务运营数据指标的准确性判 断、 以及逐条核查网络业务数据和网络业务运营日志数据是繁琐且不可行的, 目前还没有 人提出一种合适的、 判断数据指标准确性的方法。发明内容
有鉴于此, 本发明的主要目的在于提供一种校验网络业务运营数据的方法及装 置, 能简单方便地校验网络业务运营数据、 以及与其关联的业务数据记录的准确性。
为达到上述目的, 本发明的技术方案是这样实现的 :
本发明提供了一种校验网络业务运营数据的方法, 包括 :
获取各网络业务运营数据的历史数据, 根据所获取的历史数据确定各网络
业务运营数据之间的关系 ;
利用所确定的关系, 校验当前获取的各网络业务运营数据及其关联的业务数据记 录是否准确。
上述方案中, 所述网络业务为网络游戏 ; 所述网络业务运营数据包括平均在线用 户数 ACU、 人均在线时长、 活跃用户数。
上述方案中, 所述获取各网络业务运营数据的历史数据包括 :
从游戏运营日志数据库中角色登录、 登出日志表内获取登录用户数、 或根据游戏 数据库内角色的最近更新时间字段, 获取指定时间段内的活跃用户数 ;
从游戏运营日志数据库内的角色登出表内获取指定时间段内每个游戏用户
当次登录时长, 并计算出指定时间段内所有游戏用户的总在线时长和活跃用户 数, 将总在线时长除以活跃用户数得到人均在线时长 ;
周期性采集一次时间点同时在线用户数, 用指定时间段内所有时间点的同时在线 用户数的累加和除以采集次数, 得到 ACU。
上述方案中, 所述确定各网络业务运营数据之间的关系为 : 确定 ACU 与连续在线 24 小时等效用户数的数值相等 ; 且确定 ACU 的值为人均在线时长与活跃用户数之积除以 24。
上述方案中, 所述校验当前获取的各网络业务运营数据是否准确为 : 计算 ACU 与 等效用户数的比值是否为 1。
本发明还提供了一种校验网络业务运营数据的装置, 包括 : 包括数据获取模块、 数 据关系确定模块、 校验数据模块 ; 其中,
所述数据获取模块, 用于获取各网络业务运营数据的历史数据 ;
所述数据关系确定模块, 用于根据所获取的历史数据确定各网络业务运营数据之 间的关系 ;
所述校验数据模块, 用于利用所确定的关系, 校验当前获取的各网络业务运营数 据及其关联的业务数据记录是否准确。
本发明提供的校验网络业务运营数据的方法及装置, 确定网络业务运营数据之间 的关系, 并根据所确定的关系校验网络业务运营数据及其关联的业务数据记录的准确性, 如此, 不仅可以简单、 方便、 快速地校验网络业务运营数据的准确性 ; 而且, 可以快速判断相 关网络业务数据记录的准确性, 并能定位记录的错误位置。
附图说明
图 1 为本发明方法的实现流程示意图 ; 图 2 为本发明中计算所有用户一天总在线时长的实现原理示意图 ; 图 3 为本发明装置的组成结构示意图。具体实施方式
本发明的基本思想是 : 确定网络业务运营数据之间的关系, 并根据所确定的关系 校验网络业务运营数据及其关联的业务数据记录的准确性。
通常, 对于相互独立的几个参数分别校验其准确性, 由于没有参照数据会使校验 准确性存在一定困难 ; 而如果能确定所需校验的几个参数之间的关系, 就可以利用几个参 数之间的制约关系简单方便地校验出各个参数的准确性。基于这种思想, 本发明的关键就 在于确定各网络业务运营数据之间的关系。
本发明校验网络业务运营数据的方法如图 1 所示, 包括以下步骤 :
步骤 101 : 获取各网络业务运营数据的历史数据 ; 步骤 102 : 根据所获取的历史数据确定各网络业务运营数据之间的关系 ;
步骤 103 : 利用所确定的关系, 校验当前获取的各网络业务运营数据及其关联的 业务数据记录是否准确。
下面以网络业务是网络游戏为例具体描述本发明的实现, 本实施例中, 网络业务 运营数据包括 ACU、 人均在线时长、 活跃用户数。
步骤 a : 从游戏相关数据库中获取活跃用户数, 并根据采集数据计算出人均在线 时长、 ACU ;
具体的, 从游戏运营日志数据库中角色登录、 登出日志表内获取登录用户数、 或根 据游戏数据库内角色的最近更新时间字段, 获取指定时间段内的活跃用户数 ; 从游戏运营 日志数据库内的角色登出表内获取指定时间段内每个游戏用户此次登录时长, 进而依此计 算出指定时间段内所有游戏用户的总在线时长和活跃用户数, 并用总在线时长除以活跃用 户数得到人均在线时长 ; 周期性如每 5 分钟采集一次时间点同时在线用户数, 用指定时间 段内如一天所有时间点的同时在线用户数的累加和除以采集次数, 得到 ACU。
步骤 b : 确定活跃用户数、 人均在线时长以及 ACU 之间的关系 ;
通常, 计算所有用户一天总在线时长, 可将运营日内每个时间点上的同时在线用 户数连成一条线, 那么, 这条曲线覆盖的面积 ( 时间轴 t 在 [0, 24] 内 ) 即为所有用户一天 总在线时长。如图 2 所示, 假设 : t 在 [0, 24] 内, 有 n 个时间点, 记为 : ti, i = 1, 2, ...n,
那么,小时 ; 每个时间点都对应一个同时在线用户数, 记为 : pi, i = 1, 2, ...n, 那么, 所有用户一天总在线时长为 t1p1+t2p2+...+tnpn, 且 t1 = t2 = ... = tn。
同 时, 因此,因 为 ∑ n 为 24 小时, 且 即为时间点 ti, 所以,即为连续在线 24 小时等效用户数, 其中, 所谓连续在线 24 小时等效用户数是指所有用户一天总在线时长 P, 也可以相当于有 P 位用户连续 24 小时在线。
从上述推导可以看出, ACU 与连续在线 24 小时等效用户数的数值相等, 也就是说, ACU 的值就是人均在线时长与活跃用户数之积除以 24, 且在相同的时间段内, 等效用户数 的值与该时间段内 ACU 的值相同。
步骤 c : 利用所确定的关系, 校验当前获取的游戏运营数据及其关联的游戏数据 记录是否准确。
由于步骤 b 中已确定 ACU 的值与人均在线时长与活跃用户数之积除以 24 的值相 等, 所以两者之比应为 1。结合实际应用具体举例来说, 比如 : 现有海量用户游戏运营过程 中, 对于活跃用户数、 或人均在线时长、 或 ACU 的单个数据指标, 往往会因为各种不确定因 素导致数据异常, 但如果数据波动不特别明显时, 单独从每个数据指标来看并不能确定数 据有异常。而本实施例中, 由于确定了活跃用户数、 人均在线时长、 ACU 三者之间的关系, 因 此, 可以简单地计算 ACU 与人均在线时长与活跃用户数之积除以 24 的比值, 如果比值不等 于 1 或大于 1, 则可快速看出数据有异常情况, 对指导游戏运营有较大意义。
再比如, 在现有游戏运营过程中, 当产品人员提出某个数据指标存在问题后, 开发 人员往往无法快速定位到实际出现问题的位置。而在本实施例中, 可根据数据指标的计算 判断出是各个数据指标的计算过程出现了问题, 还是数据指标的计算所涉及到的游戏运营 日志数据记录遗漏、 或记录错误导致。举例来说, 对于游戏运营数据的问题, 一般通过观察 最近几天数据指标的波动、 或对比上一个月 / 上周当天的数据情况, 比如 : 前几天某个数据 指标的波动都很小, 突然某天波动很大, 则预估这天的数据可能是有问题的, 就需要查找原 因; 这个原因可能就是计算的问题, 或是发布版本后对于该记录的数据日志的遗漏或错误, 如此, 更方便开发人员定位问题出现的位置。
可以看出, 现有技术判断数据指标准确性的方法是通过逐个数据指标去核查游戏 数据或游戏运营日志数据, 在大数据量的情况下这种方法是不可取的, 因为各种因素都可 能会导致日志数据记录的准确性有误。而本实施例中确定了 ACU、 人均在线时长、 以及活跃 用户数三个数据指标之间的关系, 并确定等效用户的值与 ACU 的值相等, 即比值为 1, 那么, 如果判断出等效用户的数据是准确的, 而比值不为 1, 就能确定 ACU 的计算有问题, 再去核 查 ACU 的计算方法, 进而可以判断出游戏运营日志数据中在线数据是有问题的 ; 或者, 如果 判断出等效用户数与 ACU 的比值远远大于 1 或小于 1, 且能确定在线时长和 ACU 的计算方 法是正确的, 则可判定活跃用户的计算方法有问题或是与活跃用户相联系的日志记录有问 题, 进而去查计算方法或日志记录, 显然, 采用本发明的方法判断游戏运营日志数据的准确 性比现有技术更容易、 更方便。
为实现上述方法, 本发明还提供了一种校验网络业务运营数据的装置, 包括数据 获取模块、 数据关系确定模块、 校验数据模块 ; 其中,
所述数据获取模块, 用于获取各网络业务运营数据的历史数据 ;
所述数据关系确定模块, 用于根据所获取的历史数据确定各网络业务运营数据之 间的关系 ;
所述校验数据模块, 用于利用所确定的关系, 校验当前获取的各网络业务运营数 据及其关联的业务数据记录是否准确。
其中, 网络业务为网络游戏时, 所述网络业务运营数据至少包括 ACU、 人均在线时长、 活跃用户数 ; 相应的, 所述确定各网络业务运营数据之间的关系为 : 确定 ACU 与连续在 线 24 小时等效用户数的数值相等, 且确定 ACU 的值为人均在线时长与活跃用户数之积除以 24。
以上所述, 仅为本发明的较佳实施例而已, 并非用于限定本发明的保护范围, 凡在 本发明的精神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本发明的保护 范围之内。