应用程序文件的开发者识别方法、装置、设备及存储介质.pdf
《应用程序文件的开发者识别方法、装置、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《应用程序文件的开发者识别方法、装置、设备及存储介质.pdf(20页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910365066.3 (22)申请日 2019.04.30 (71)申请人 深圳市腾讯计算机系统有限公司 地址 518000 广东省深圳市南山区高新区 高新南一路飞亚达大厦510楼 (72)发明人 刘健 (74)专利代理机构 北京三高永信知识产权代理 有限责任公司 11138 代理人 张所明 (51)Int.Cl. H04L 29/06(2006.01) (54)发明名称 应用程序文件的开发者识别方法、 装置、 设 备及存储介质 (57)摘要 本申请公开了一种应用程序文件。
2、的开发者 识别方法、 装置、 设备及存储介质, 属于互联网技 术领域。 所述方法包括: 获取待识别的应用程序 文件; 在第一数据库中查询与所述应用程序文件 匹配的开发者信息, 所述第一数据库用于存储应 用程序文件与开发者信息之间的对应关系; 当未 查询到与所述应用程序文件匹配的开发者信息 时, 运行所述应用程序文件; 模拟用户操作处于 运行状态的所述应用程序文件, 获取所述应用程 序文件在运行过程中产生的网络流量信息; 基于 所述网络流量信息, 获取所述应用程序文件的开 发者信息。 本申请通过对网络流量信息进行分 析, 来辅助识别应用程序文件的开发者, 该种识 别方式较为精准。 权利要求书2页。
3、 说明书11页 附图6页 CN 110213234 A 2019.09.06 CN 110213234 A 1.一种应用程序文件的开发者识别方法, 其特征在于, 所述方法包括: 获取待识别的应用程序文件; 在第一数据库中查询与所述应用程序文件匹配的开发者信息, 所述第一数据库用于存 储应用程序文件与开发者信息之间的对应关系; 当未查询到与所述应用程序文件匹配的开发者信息时, 运行所述应用程序文件; 模拟用户操作处于运行状态的所述应用程序文件, 获取所述应用程序文件在运行过程 中产生的网络流量信息; 基于所述网络流量信息, 获取所述应用程序文件的开发者信息。 2.根据权利要求1所述的方法, 其特。
4、征在于, 所述获取所述应用程序文件在运行过程中 产生的网络流量信息, 包括: 获取所述应用程序文件在运行过程中产生的网络访问请求, 直至收集到的网络访问请 求数量达到预设阈值; 将数量达到所述预设阈值的网络访问请求作为所述网络流量信息。 3.根据权利要求1所述的方法, 其特征在于, 所述获取所述应用程序文件在运行过程中 产生的网络流量信息, 包括: 在所述应用程序文件的运行过程中, 获取预设时长内所述应用程序文件产生的网络访 问请求; 将所述预设时长内产生的网络访问请求作为所述网络流量信息。 4.根据权利要求2或3所述的方法, 其特征在于, 所述基于所述网络流量信息, 获取所述 应用程序文件的。
5、开发者信息, 包括: 获取所述网络流量信息中各个网络访问请求的域名信息; 对于每个所述网络访问请求, 在第二数据库中查询与所述网络访问请求的域名信息匹 配的网站运营者信息, 所述第二数据库用于存储域名与网站运营者之间的对应关系; 在获取到的网站运营者信息中统计相同网站运营者信息的出现次数; 将出现次数满足预设条件的网站运营者信息, 作为所述待识别的应用程序文件的开发 者信息。 5.根据权利要求4所述的方法, 其特征在于, 所述将出现次数满足预设条件的网站运营 者信息, 作为所述待识别的应用程序文件的开发者信息, 包括: 将出现次数排在首位的网站运营者信息, 作为所述应用程序文件的开发者信息; 。
6、或, 所述出现次数排在前N位的网站运营者信息, 作为所述应用程序文件的开发者信息, N 的取值为正整数。 6.根据权利要求4所述的方法, 其特征在于, 所述方法还包括: 对于每个所述网络访问请求, 建立所述应用程序文件与所述网络访问请求、 相应访问 时间、 相应域名信息、 相应网站运营者信息之间的对应关系; 将建立的所述对应关系存储至第三数据库。 7.根据权利要求1所述的方法, 其特征在于, 所述方法还包括: 当所述应用程序文件的开发者为恶意开发者时, 聚合与所述开发者相关的应用程序文 件, 对与所述开发者相关的应用程序文件执行去除处理。 8.一种应用程序文件的开发者识别装置, 其特征在于, 。
7、所述装置包括: 权利要求书 1/2 页 2 CN 110213234 A 2 第一获取模块, 用于获取待识别的应用程序文件; 查询模块, 用于在第一数据库中查询与所述应用程序文件匹配的开发者信息, 所述第 一数据库用于存储应用程序文件与开发者信息之间的对应关系; 第一处理模块, 用于当未查询到与所述应用程序文件匹配的开发者信息时, 运行所述 应用程序文件; 所述第一处理模块, 还用于模拟用户操作处于运行状态的所述应用程序文件; 第二获取模块, 用于获取所述应用程序文件在运行过程中产生的网络流量信息; 识别模块, 用于基于所述网络流量信息, 获取所述应用程序文件的开发者信息。 9.一种应用程序文。
8、件的开发者识别设备, 其特征在于, 所述设备包括处理器和存储器, 所述存储器中存储有至少一条指令, 所述至少一条指令由所述处理器加载并执行以实现如 权利要求1至7中任一项权利要求所述的应用程序文件的开发者识别方法。 10.一种存储介质, 其特征在于, 所述存储介质中存储有至少一条指令, 所述至少一条 指令由处理器加载并执行以实现如权利要求1至7中任一项权利要求所述的应用程序文件 的开发者识别方法。 权利要求书 2/2 页 3 CN 110213234 A 3 应用程序文件的开发者识别方法、 装置、 设备及存储介质 技术领域 0001 本申请涉及互联网技术领域, 特别涉及一种应用程序文件的开发者。
9、识别方法、 装 置、 设备及存储介质。 背景技术 0002 随着智能移动终端的普及和移动网络技术的快速发展, 应用市场中各种各样的应 用程序文件层出不穷, 这极大地方便了人们的日常工作和生活。 然而, 在为人们带来极大便 利的同时, 还存在诸多安全隐患。 比如, 一些不法分子会通过制作应用程序文件来提供色 情、 赌博等非法服务、 或以投资理财名义进行非法集资、 或通过窃取短信内容等来损害用户 权益, 由于这类恶意应用程序文件会对用户的信息安全和财产安全造成极大隐患, 因此很 有必要对应用程序文件的开发者进行识别, 以净化应用市场。 0003 相关技术在对应用程序文件的开发者进行识别时, 主要采。
10、取以下两种方式: 第一 种、 依靠人工搜集方式进行开发者识别。 第二种、 基于主动提交的证书辅助进行开发者识 别。 比如, 有些应用市场在收录应用时, 会要求应用提交者提供营业执照等辅助资质来证明 其身份。 0004 针对第一种方式, 不但耗时耗力, 而且还存在因为人工搜集不全或不准而导致的 开发者信息缺失或错误的情况。 针对第二种方式, 一方面恶意攻击者可以仿制证书或者盗 用其他开发者的证书, 另一方面有些证书可由开发者自行生成, 并没有权威的数字证书签 名机构认证, 因此该种方式也无法确保获取到的开发者信息的准确性, 甚至还存在通过证 书无法获取开发者信息的情况。 发明内容 0005 本申。
11、请实施例提供了一种应用程序文件的开发者识别方法、 装置、 设备及存储介 质, 解决了相关技术存在的开发者信息缺失或错误, 获取到的开发者信息不准确等问题。 所 述技术方案如下: 0006 一方面, 提供了一种应用程序文件的开发者识别方法, 所述方法包括: 0007 获取待识别的应用程序文件; 0008 在第一数据库中查询与所述应用程序文件匹配的开发者信息, 所述第一数据库用 于存储应用程序文件与开发者信息之间的对应关系; 0009 当未查询到与所述应用程序文件匹配的开发者信息时, 运行所述应用程序文件; 0010 模拟用户操作处于运行状态的所述应用程序文件, 获取所述应用程序文件在运行 过程中。
12、产生的网络流量信息; 0011 基于所述网络流量信息, 获取所述应用程序文件的开发者信息。 0012 另一方面, 提供了一种应用程序文件的开发者识别装置, 所述装置包括: 0013 第一获取模块, 用于获取待识别的应用程序文件; 0014 查询模块, 用于在第一数据库中查询与所述应用程序文件匹配的开发者信息, 所 说明书 1/11 页 4 CN 110213234 A 4 述第一数据库用于存储应用程序文件与开发者信息之间的对应关系; 0015 第一处理模块, 用于当未查询到与所述应用程序文件匹配的开发者信息时, 运行 所述应用程序文件; 0016 所述第一处理模块, 还用于模拟用户操作处于运行。
13、状态的所述应用程序文件; 0017 第二获取模块, 用于获取所述应用程序文件在运行过程中产生的网络流量信息; 0018 识别模块, 用于基于所述网络流量信息, 获取所述应用程序文件的开发者信息。 0019 在一种可能的实现方式中, 所述第二获取模块, 还用于获取所述应用程序文件在 运行过程中产生的网络访问请求, 直至收集到的网络访问请求数量达到预设阈值; 将数量 达到所述预设阈值的网络访问请求作为所述网络流量信息。 0020 在一种可能的实现方式中, 所述第二获取模块, 还用于在所述应用程序文件的运 行过程中, 获取预设时长内所述应用程序文件产生的网络访问请求; 0021 将所述预设时长内产生。
14、的网络访问请求作为所述网络流量信息。 0022 在一种可能的实现方式中, 所述识别模块, 还用于获取所述网络流量信息中各个 网络访问请求的域名信息; 对于每个所述网络访问请求, 在第二数据库中查询与所述网络 访问请求的域名信息匹配的网站运营者信息, 所述第二数据库用于存储域名与网站运营者 之间的对应关系; 在获取到的网站运营者信息中统计相同网站运营者信息的出现次数; 将 出现次数满足预设条件的网站运营者信息, 作为所述待识别的应用程序文件的开发者信 息。 0023 在一种可能的实现方式中, 所述识别模块, 还用于将出现次数排在首位的网站运 营者信息, 作为所述应用程序文件的开发者信息; 或, 。
15、所述出现次数排在前N位的网站运营 者信息, 作为所述应用程序文件的开发者信息, N的取值为正整数。 0024 在一种可能的实现方式中, 所述装置还包括: 0025 存储模块, 用于对于每个所述网络访问请求, 建立所述应用程序文件与所述网络 访问请求、 相应访问时间、 相应域名信息、 相应网站运营者信息之间的对应关系; 将建立的 所述对应关系存储至第三数据库。 0026 在一种可能的实现方式中, 所述装置还包括: 0027 第二处理模块, 用于当所述应用程序文件的开发者为恶意开发者时, 聚合与所述 开发者相关的应用程序文件, 对与所述开发者相关的应用程序文件执行去除处理。 0028 另一方面, 。
16、提供了一种应用程序文件的开发者识别设备, 所述设备包括处理器和 存储器, 所述存储器中存储有至少一条指令, 所述至少一条指令由所述处理器加载并执行 以实现上述的应用程序文件的开发者识别方法。 0029 另一方面, 提供了一种存储介质, 所述存储介质中存储有至少一条指令, 所述至少 一条指令由处理器加载并执行以实现上述的应用程序文件的开发者识别方法。 0030 本申请实施例提供的技术方案带来的有益效果是: 0031 在获取到待识别的应用程序文件后, 本申请实施例会先在第一数据库中查询与待 识别的应用程序文件匹配的开发者信息, 当在第一数据库中未查询到与该应用程序文件匹 配的开发者信息时, 会运行。
17、该应用程序文件并模拟用户操作处于运行状态的该应用程序文 件, 之后, 获取该应用程序文件在运行过程中产生的网络流量信息, 进而基于网络流量信息 获取该应用程序文件的开发者信息, 基于以上描述可知, 本申请实施例通过对网络流量信 说明书 2/11 页 5 CN 110213234 A 5 息进行分析, 来辅助识别应用程序文件的开发者, 该种识别方式较为精准, 能够有效降低应 用程序文件的开发者信息的缺失率或错误率。 也即, 本申请实施例能够避免因人工搜集不 全或不准而导致的开发者信息缺失或错误的情况, 以及获取到的开发者信息不准, 甚至无 法获取开发者信息的情况。 附图说明 0032 为了更清楚。
18、地说明本申请实施例中的技术方案, 下面将对实施例描述中所需要使 用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本申请的一些实施例, 对于 本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 的附图。 0033 图1是本申请实施例提供的一种应用程序文件的开发者识别方法涉及的实施环境 示意图; 0034 图2是本申请实施例提供的一种应用程序文件的开发者识别方法流程图; 0035 图3是本申请实施例提供的一种应用程序文件的开发者识别流程示意图; 0036 图4是本申请实施例提供的一种显示界面的示意图; 0037 图5是本申请实施例提供的另一种显示界面的示。
19、意图; 0038 图6是本申请实施例提供的另一种显示界面的示意图; 0039 图7是本申请实施例提供的一种应用程序文件的开发者识别装置的结构示意图; 0040 图8是本申请实施例提供的一种应用程序文件的开发者识别设备的结构示意图。 具体实施方式 0041 为使本申请的目的、 技术方案和优点更加清楚, 下面将结合附图对本申请实施方 式作进一步地详细描述。 0042 在对本申请实施例进行详细地解释说明之前, 先对本申请实施例涉及到的一些名 词进行解释说明。 0043 应用程序文件: 在本申请实施例中, 应用程序文件即指代软件安装包, 是可自行解 压缩文件的集合, 其中包括软件安装的所有文件。 运行。
20、这个软件安装包, 可以将该软件的所 有文件释放到存储介质上, 完成修改注册表、 修改系统设置、 创建快捷方式等工作。 时下, 应 用程序文件通常由应用市场或应用商店收录, 并提供给用户。 0044 作为一个实例, 应用程序文件可为APK(Android Package, 安卓安装包)文件, 安装 有安卓操作系统的终端在安装应用软件时均需要从应用市场或应用商店等下载APK文件。 0045 开发者: 在本申请实施例中, 开发者指代应用程序文件的开发者, 还可称之为应用 程序文件的作者、 所有者、 或经营者, 本申请实施例对此不进行具体限定。 0046 应用市场: 也称之为应用商店或应用商城, 收录。
21、了海量各种各样的应用资源以供 用户下载, 其为应用资源的下载管理平台。 0047 下面对本申请实施例提供的一种应用程序文件的开发者识别方法涉及的实施环 境进行介绍说明。 0048 本申请实施例提供的一种应用程序文件的开发者识别方法应用于图1所示的开发 者识别系统, 也称之为开发者识别设备, 参见图1, 该开发者识别系统包括: 模拟器101、 网络 说明书 3/11 页 6 CN 110213234 A 6 代理102、 应用程序文件开发者库103、 ICP(Internet Content Provider, 网络内容服务商) 备案库104、 网络访问请求记录库105以及互联网106。 004。
22、9 其中, 模拟器101、 网络代理102、 应用程序文件开发者库103、 ICP备案库104和网络 访问请求记录库105既可以配置在同一个设备上, 也可以配置在不同的设备上, 即该开发者 识别系统可由一个或多个设备组成, 本申请实施例对此不进行具体限定。 比如, ICP备案库 104来自远程连接的服务器。 0050 另外, 上述设备为具有计算能力的计算机设备, 该计算机设备既可以为个人电脑、 服务器等固定式计算机设备, 还可以是平板电脑、 智能手机等移动式计算机设备, 本申请实 施例对此不进行具体限定。 0051 在本申请实施例中, 模拟器101是一个可以运行在计算机设备上的虚拟设备, 模拟。
23、 器101可以不需使用物理设备即可预览、 开发和测试应用程序文件。 以安卓运行环境为例, 则模拟器101为安卓模拟器, 其不需安卓设备即可预览、 开发和测试安卓应用程序。 0052 网络代理102为网络信息的中转站, 其可以接收客户端的网络访问请求, 然后从互 联网106获取网络信息并返回给发起网络访问请求的客户端。 0053 在本申请实施例中, 如图1所示, 网络代理102接收来自模拟器101的网络访问请 求。 基于网络102具备的这一特性, 网络代理102可以监控应用程序文件在运行过程中产生 的所有网络访问请求。 作为一个示例, 网络代理102会将监控到的网络访问请求进行记录, 并将其存入。
24、网络访问请求记录库105。 换一种表达方式, 网络访问请求记录库105用于存放 应用程序文件在运行过程中访问的URL(Uniform Resource Locator,统一资源定位符)记 录。 0054 在一种可能的实现方式中, 网络访问请求记录库105中的数据记录方式可如下述 表1所示: 0055 表1 0056 0057 上述表1给出了应用程序文件的名称、 访问时间、 网络访问请求的访问URL、 域名与 说明书 4/11 页 7 CN 110213234 A 7 网站运营者之间的对应关系。 需要说明的是, 上述表1仅是给出了一种可能的网络访问请求 记录方式, 其中, 网络访问请求记录库10。
25、5还可记录比上述表1示出的5个表项之间的对应关 系更多或更少的对应关系, 本申请实施例对此不进行具体限定。 0058 其中, ICP备案库104是用于存储网站ICP备案信息的数据库。 在一种可能的实现方 式中, ICP备案库104存储的网站ICP备案信息可如下述表2所示。 0059 表2 0060 域名/网站主办单位名称备案号网站名称 M.com深圳市M有限公司粤B2-*-5M网 N.com浙江N有限公司浙B2-*-1N网 S.com北京S有限公司京ICP证*-1S网 0061 需要说明的是, 上述表2仅是给出了一种可能的ICP备案信息记录方式, 其中, ICP 备案库104还可记录比上述表2。
26、示出的4个表项之间的对应关系更多或更少的对应关系, 本 申请实施例对此不进行具体限定。 0062 在本申请实施例中, 应用程序文件开发者库103是用于存储应用程序开发者信息 的数据库。 作为一个示例, 以安卓运行环境为例, 则应用程序文件开发者库103即可称之为 APK开发者库。 0063 其中, 应用程序文件开发者库103存储的开发者信息可如下述表3所示。 0064 表3 0065 应用程序文件开发者信息 aA公司 bB公司 0066 需要说明的是, 上述表3仅是给出了一种可能的开发者信息记录方式, 其中, 应用 程序文件开发者库103还可记录比上述表3示出的2个表项之间的对应关系更多的对应。
27、关 系, 本申请实施例对此不进行具体限定。 0067 由于相关技术在识别应用程序文件的开发者信息时主要依靠人工搜集或者根据 应用提交时主动向应用市场提交的证书辅助识别, 针对人工搜集方式, 人工搜集可能会存 在搜集不全或搜集不准的情况, 这会导致应用市场中大量应用程序文件的开发者信息缺失 或错误。 针对证书辅助识别方式, 有些应用市场在收录应用时, 可以通过要求开发者提供公 司营业执照等辅助资质来证明其身份, 但这里存在的一个问题是攻击者可以仿制或盗用营 业执照来提交应用, 而应用市场在人工审核辅助资质时也无法保证其完全准确, 且费时费 力。 另外, 通过相关证书进行识别还存在另外的问题, 以。
28、安卓运行环境为例, 由于安卓证书 可由开发者自行生成, 并不需要权威的数字证书签名机构认证, 所以这种方式也无法确保 获取到的开发者信息的准确性, 甚至还存在通过提交的证书无法识别开发者的情况。 0068 为了解决以上问题, 本申请实施例基于图1所示的系统架构, 提供了一种基于网络 流量分析自动化识别开发者信息的方法, 即可全自动地探测应用程序文件的开发者, 大幅 说明书 5/11 页 8 CN 110213234 A 8 度地降低了应用市场中应用程序文件的开发者信息的缺失率, 另外, 本申请实施例通过对 应用程序文件的开发者进行识别, 还能够提高应用市场等场景下的用户推荐体验, 以及在 移动。
29、端安全场景下对恶意开发者的相关应用程序文件的识别和覆盖。 0069 下面通过详细的实施方式对本申请实施例提供的应用程序文件的开发者识别方 法进行解释说明。 另外, 下述实施例中出现的类似第一、 第二、 第三、 第四等描述, 仅是用于 区分不同的对象, 而不构成任何其他的限定。 0070 图2是本申请实施例提供的一种应用程序文件的开发者识别方法的流程图。 该方 法的执行主体为图1所示的开发者识别设备, 参见图2, 本申请实施例提供的方法流程, 包 括: 0071 201、 获取待识别的应用程序文件。 0072 如图3所示, 待识别的应用程序文件在本文中也称之为待分析的应用程序文件。 在 一种可能。
30、的实现方式中, 待分析的应用程序文件可为应用市场或应用商店或应用商城中待 进行开发者信息分析的应用程序文件。 0073 202、 在第一数据库中查询与待识别的应用程序文件匹配的开发者信息。 0074 在本申请实施例中, 第一数据库即指代图1中示出的应用程序文件开发者库, 其用 于存储应用程序文件与开发者信息之间的对应关系, 该对应关系可如前述的表3所示。 0075 参见图3, 对于一个待识别的应用程序文件, 会先在应用程序文件开发者库中进行 查询, 以判断该数据库中是否已经记录了相应的开发者信息; 如果该数据库中已经记录了 相应的开发者信息, 则处理流程至此结束; 如果该数据库中未记录相应的开。
31、发者信息, 则执 行下述步骤203。 0076 203、 当未查询到与待识别的应用程序文件匹配的开发者信息时, 运行待识别的应 用程序文件。 0077 在本申请实施例中, 如果应用程序文件开发者库中未记录相应的开发者信息, 则 会将待识别的应用程序文件推送至模拟器的指定目录下。 其中, 该指定目录通常指代模拟 器的安装目录。 0078 而模拟器会实时监控指定目录下是否有新的应用程序文件存在; 如果该指定目录 下存在新的应用程序文件, 则模拟器会解压缩、 安装并运行该应用程序文件, 即运行前述待 识别的应用程序文件。 0079 204、 模拟用户操作处于运行状态的待识别的应用程序文件, 获取待识。
32、别的应用程 序文件在运行过程中产生的网络流量信息。 0080 在本申请实施例中, 在待识别的应用程序的运行过程中, 模拟器会模拟用户操作 该应用程序文件。 其中, 模拟用户操作的方法可以有多种, 本申请实施例对此不进行具体限 定。 作为一个示例, 可以模拟用户操作在模拟器呈现的显示屏幕上随机进行点击操作、 或键 盘输入操作、 或手势滑动操作等; 另外, 以安卓运行环境为例, 也可以通过分析APK文件中 AndroidManifest.xml配置文件的内容来对全部Activity逐个进行触发。 0081 其中, 网络流程信息在本申请实施例中指代应用程序文件在运行过程中产生的网 络访问请求。 00。
33、82 在模拟用户操作处于运行状态的上述应用程序文件时, 该应用程序文件会产生许 多的网络访问请求, 而网络代理作为网络信息的中转站, 会不断监控上述应用程序文件在 说明书 6/11 页 9 CN 110213234 A 9 运行过程中产生的网络访问请求, 当网络代理收集到的网络访问请求满足特定条件时, 模 拟器停止模拟用户操作上述应用程序文件, 否则, 模拟器将持续模拟用户操作上述应用程 序文件。 0083 在一种可能的实现方式中, 上述特定条件通常包含两个维度, 分别为数量维度和 时间维度。 即, 获取待识别的应用程序文件在运行过程中产生的网络流量信息包括下述两 个步骤: 0084 2041。
34、、 获取待识别的应用程序文件在运行过程中产生的网络访问请求, 直至收集 到的网络访问请求数量达到预设阈值; 将数量达到预设阈值的网络访问请求作为上述网络 流量信息。 0085 针对该步骤, 简言之当收集到的URL条数多于M条时, 模拟器停止模拟用户操作待 识别的应用程序文件。 0086 其中, 预设阈值即M的取值可为100, 本申请实施例对此不进行具体限定。 作为一个 示例, 当网络代理收集到的URL条数达到100条时, 模拟器停止模拟用户操作待识别的应用 程序文件, 之后, 本申请实施例基于这100条URL来分析待识别的应用程序文件的开发者信 息。 0087 2042、 在待识别的应用程序文。
35、件的运行过程中, 获取预设时长内该应用程序文件 产生的网络访问请求; 将预设时长内产生的网络访问请求作为上述网络流量信息。 0088 针对该步骤, 简言之当收集的时间超过预设时长T时, 模拟器停止模拟用户操作待 识别的应用程序文件。 0089 其中, T的取值可为5分钟, 本申请实施例对此不进行具体限定。 作为一个示例, 当 网络代理收集URL的时间超过5分钟时, 模拟器停止模拟用户操作待识别的应用程序文件, 之后, 本申请实施例基于这5分钟内收集到的URL来分析待识别的应用程序文件的开发者信 息。 0090 在一种可能的实现方式中, 在待识别的应用程序文件的运行过程中, 网络代理会 对监控到。
36、的网络访问请求进行记录, 并存入图1所示的网络访问请求记录库, 其中, 网络访 问请求记录库在本文中也称之为第三数据库。 作为一个示例, 网络代理对网络访问请求记 录方式可如前述的表1所示, 本申请实施例对此不进行具体限定。 即, 本申请实施例还包括 下述步骤: 0091 对于网络代理收集到的每个网络访问请求, 建立待识别的应用程序文件与该网络 访问请求、 相应访问时间、 相应域名信息、 相应网站运营者信息之间的对应关系, 并将建立 的对应关系存储至第三数据库, 即网络访问请求记录库。 0092 205、 基于网络流量信息, 获取待识别的应用程序文件的开发者信息。 0093 在本申请实施例中,。
37、 基于网络流量信息获取待识别的应用程序文件的开发者信 息, 包括以下步骤: 0094 2051、 获取网络流量信息中各个网络访问请求的域名信息。 0095 针对该步骤, 对于网络收集到的全部URL, 本申请实施例会逐个获取其域名信息。 作为一个示例, 对于http:/news.ABC.com/local/index.html这一URL来说, 其域名为 ABC.com。 0096 2052、 对于每个网络访问请求, 在第二数据库中查询与该网络访问请求的域名信 说明书 7/11 页 10 CN 110213234 A 10 息匹配的网站运营者信息。 0097 其中, 第二数据库用于存储域名与网站运。
38、营者之间的对应关系, 即第二数据库在 本文中指代图1中示出的ICP备案库。 即本步骤用于在ICP备案库中查找网站运营者信息。 0098 2053、 在获取到的全部网站运营者信息中, 统计相同网站运营者信息的出现次数。 0099 针对该步骤, 待识别的应用程序文件在运行过程中可能会访问多个不同的域名, 而每个域名对应不同的网站运营者, 为了确定待识别的应用程序文件的开发者信息, 本申 请实施例会统计相同网站运营者信息的出现次数。 0100 2054、 将出现次数满足预设条件的网站运营者信息, 作为待识别的应用程序文件 的开发者信息。 0101 在本申请实施例中, 预设条件包括但不限于下述两种: 。
39、0102 第一种、 按照多数优先规则选取出现次数最多的网站运营者信息, 将该网站运营 者信息作为待识别的应用程序文件的开发者信息。 换一种表达方式, 该种方式是将出现次 数排在首位的网站运营者信息, 作为待识别的应用程序文件的开发者信息。 作为一个示例, 以下述表4为例, 0103 表4 0104 访问URL域名信息网站运营者信息 http:/www.A.com/news/index.htmlA.comA公司 http:/www.A.com/news/index2.htmlA.comA公司 https:/www.F.com/page.htmlF.comF公司 https:/www.A.com/。
40、index2.htmlA.comA公司 0105 其中, 上述表4中, 有三个URL属于A公司经营, 一个URL属于F公司经营, 按照多数优 先规则, 则判定待识别的应用程序文件的开发者为A公司。 0106 另外, 在确定待识别的应用程序文件的开发者信息后, 本申请实施例还会并将确 定的开发者信息存入第一数据库, 即应用程序文件开发者库中, 形成一个如上述表3所示的 信息条目。 0107 第二种、 同时设置多个开发者信息, 即允许对一个应用程序文件同时设置多个作 者标签。 作为一个示例, 可将出现次数排在前N位的网站运营者信息, 作为待识别的应用程 序文件的开发者信息, N的取值为正整数。 如。
41、上述表4所示, 可以将待识别的应用程序文件的 开发者确定为A公司和F公司。 0108 本申请实施例提供的方法至少具有如下有益效果: 0109 1、 本申请实施例实现了全自动化地对应用程序文件的开发者进行识别, 无需人工 干预, 省时省力, 避免了人工搜集时存在的耗时耗力的情况。 0110 2、 本申请实施例部署简单, 无需再额外购买物理设备, 比如无需再额外购买安卓 设备, 在诸如电脑等计算机设备中即可大批量地对应用程序文件的开发者进行识别, 成本 较低。 0111 3、 本申请实施例通过对网络流量信息进行分析, 来辅助识别应用程序文件的开发 者, 该种识别方式较为精准, 能够有效降低应用程序。
42、文件的开发者信息的缺失率或错误率。 也即, 本申请实施例能够避免因人工搜集不全或不准而导致的开发者信息缺失或错误的情 说明书 8/11 页 11 CN 110213234 A 11 况, 以及获取到的开发者信息不准, 甚至无法获取开发者信息的情况。 0112 在另一个实施例中, 下面结合图3对本申请实施例提供的应用程序文件的开发者 识别方法的整体执行流程进行梳理。 0113 a、 启动网络代理, 以及启动模拟器, 模拟器设置网络代理。 0114 其中, 模拟器设置网络代理通常是设置网络代理的端口号等, 以跟网络代理进行 通信。 0115 b、 对于待识别的应用程序文件, 判断应用程序文件开发者。
43、库中是否已经存储了相 应的开发者信息; 如果否, 则执行下述步骤c; 如果是, 则处理流程至此结束。 0116 c、 推送该应用程序文件至模拟器的指定目录下。 0117 d、 模拟器监控指定目录下是否有新的应用程序文件存在。 0118 e、 如果有新的应用程序文件存在, 则解压缩、 安装、 运行该应用程序文件。 0119 f、 在该应用程序文件的运行过程中, 模拟器模拟用户操作该应用程序文件, 网络 代理不断监控该应用程序文件在运行过程中产生的网络访问请求, 网络代理连接ICP备案 库查询网站运营者信息, 形成对应关系并存储至网络访问请求记录库。 0120 g、 当网络代理收集到足够数量的网络。
44、访问请求或等待足够时间后, 模拟器停止模 拟用户操作该应用程序文件。 0121 h、 基于网络代理收集到的网络访问请求识别该应用程序文件的开发者, 并将相应 的开发者信息存储至应用程序文件开发者库中。 0122 i、 卸载和删除已识别的应用程序文件, 并继续执行上述步骤d。 0123 在另一个实施例中, 本申请实施例通过对应用程序文件的开发者进行识别, 可至 少应用在如下两种场景下: 0124 示例一、 当识别出应用程序文件的开发者为恶意开发者时, 聚合与该开发者相关 的全部应用程序文件, 并对与该开发者相关的全部应用程序文件执行去除处理。 0125 针对该步骤, 在基于网络流量信息自动分析一。
45、个应用程序文件的开发者后, 如果 确定该应用程序文件的开发者有违法行为, 即该开发者为恶意开发者, 则在应用市场或应 用商店或应用商城中可及时下架相关的应用程序文件, 以保护用户安全。 0126 以图4和图5为例, 参见图4, 假设*网涉嫌非法集资(隶属*网络科技有限公司), 则通过将图5中示出的应用程序文件与*网络科技有限公司匹配, 可以确定图5示出的应用 程序文件为有害应用程序文件, 对其执行下架处理。 即, 本申请实施例提供的开发者识别方 法可以辅助及时发现应用市场或应用商店或应用商城中有害的应用程序文件。 0127 示例二、 在基于网络流量信息自动分析一个应用程序文件的开发者后, 如果。
46、确定 该应用程序文件的开发者为安全开发者, 即该开发者提交给应用市场或应用商店或应用商 城的应用程序文件为正常的应用程序文件, 则通过对开发者进行自动分析识别, 可以聚合 同一开发者的不同应用程序文件。 当某一用户访问这些应用程序文件中的其中一个时, 应 用市场或应用商店或应用商城可以向该用户推荐该开发者的其他应用程序文件, 不仅提高 了用户体验, 也提升了与之相关的应用程序文件的用户触达率, 从而可以帮助应用市场或 应用商店或应用商城吸引更多用户和开发者。 作为一个示例, 参见图6, 假设在某一应用商 店与同一开发者相关的应用程序文件有5个, 分别以应用A至应用E指代, 则在用户浏览或访 问。
47、其中的应用A时, 如图6所示, 还可以向该用户推荐应用B至应用E。 说明书 9/11 页 12 CN 110213234 A 12 0128 图7是本申请实施例提供的一种应用程序文件的开发者识别装置的结构示意图。 参见图7, 该装置包括: 0129 第一获取模块701, 用于获取待识别的应用程序文件; 0130 查询模块702, 用于在第一数据库中查询与所述应用程序文件匹配的开发者信息, 所述第一数据库用于存储应用程序文件与开发者信息之间的对应关系; 0131 第一处理模块703, 用于当未查询到与所述应用程序文件匹配的开发者信息时, 运 行所述应用程序文件; 0132 第一处理模块703, 。
48、还用于模拟用户操作处于运行状态的所述应用程序文件; 0133 第二获取模块704, 用于获取所述应用程序文件在运行过程中产生的网络流量信 息; 0134 识别模块705, 用于基于所述网络流量信息, 获取所述应用程序文件的开发者信 息。 0135 本申请实施例提供的装置, 在获取到待识别的应用程序文件后, 会先在第一数据 库中查询与待识别的应用程序文件匹配的开发者信息, 当在第一数据库中未查询到与该应 用程序文件匹配的开发者信息时, 会运行该应用程序文件并模拟用户操作处于运行状态的 该应用程序文件, 之后, 获取该应用程序文件在运行过程中产生的网络流量信息, 进而基于 网络流量信息获取该应用程。
49、序文件的开发者信息, 基于以上描述可知, 本申请实施例通过 对网络流量信息进行分析, 来辅助识别应用程序文件的开发者, 该种识别方式较为精准, 能 够有效降低应用程序文件的开发者信息的缺失率或错误率。 也即, 本申请实施例能够避免 因人工搜集不全或不准而导致的开发者信息缺失或错误的情况, 以及获取到的开发者信息 不准, 甚至无法获取开发者信息的情况。 0136 在一种可能的实现方式中, 第二获取模块704, 还用于获取所述应用程序文件在运 行过程中产生的网络访问请求, 直至收集到的网络访问请求数量达到预设阈值; 将数量达 到所述预设阈值的网络访问请求作为所述网络流量信息。 0137 在一种可能。
50、的实现方式中, 第二获取模块704, 还用于在所述应用程序文件的运行 过程中, 获取预设时长内所述应用程序文件产生的网络访问请求; 0138 将所述预设时长内产生的网络访问请求作为所述网络流量信息。 0139 在一种可能的实现方式中, 识别模块705, 还用于获取所述网络流量信息中各个网 络访问请求的域名信息; 对于每个所述网络访问请求, 在第二数据库中查询与所述网络访 问请求的域名信息匹配的网站运营者信息, 所述第二数据库用于存储域名与网站运营者之 间的对应关系; 在获取到的网站运营者信息中统计相同网站运营者信息的出现次数; 将出 现次数满足预设条件的网站运营者信息, 作为所述待识别的应用程。
- 内容关键字: 应用程序 文件 开发者 识别 方法 装置 设备 存储 介质
介孔蛋黄壳纳米颗粒及其在构建分泌物代谢指纹谱图中的应用和用其筛选的代谢标志物.pdf
制袋机的放卷机构.pdf
双枪激光焊机.pdf
锂离子正极材料异常料筛分装置.pdf
用于芯片开盖的可调整平台.pdf
防腐伸缩蝶阀.pdf
可分离式检修插座箱.pdf
自承重保温复合屋面板.pdf
螺杆钻具定子壳体打磨装置.pdf
提升机机尾增压防尘结构.pdf
简易分条机构.pdf
煤矿探水钻孔快速密封装置.pdf
新能源电池储能充电用触发控制电路.pdf
加速植株晾干设备.pdf
高可靠电容切换开关.pdf
散热器翅片的冲片装置.pdf
可拆式偏心加强撑.pdf
农业种植用可调节式农业种植架.pdf
饮品和冰棒的新型包装袋.pdf
卧式搅拌反应釜.pdf
平板玻璃切割加工系统.pdf
器件复用的射频收发电路及其控制方法.pdf
基于单片FPGA的PET正弦图数据压缩存储方法、系统及设备.pdf
风机轴承剩余有效寿命优化方法、设备及介质.pdf
远程控制车辆分享解锁方法及系统.pdf
多轴分布式电驱车辆转向控制方法及车辆.pdf
无对照HRD检测方法、系统及装置.pdf
人工植入物以及介入系统.pdf
实心分割铝导体高压电缆制备方法.pdf
基于图像处理的影动方向计算系统及屈光度估计系统.pdf
热塑性复合工程材料缸盖罩自动校平装置及校平方法.pdf
多尺寸的晶圆传输装置、方法及电子设备.pdf
藉由图像分析以调整测试治具的系统及其方法.pdf
一种结合跨媒体融合的信息摘要提取方法.pdf
一种基于商用货架产品的航天软加固系统.pdf
总线压力测试系统及其方法.pdf
一种表单处理的方法及装置.pdf
星载导航接收机授时方法和授时型星载导航接收机以及星载导航应用系统.pdf
一种文本的对照显示方法、系统和装置.pdf
快捷外设互联标准的选择设定系统及微服务器.pdf
一种医学影像数据存储方法.pdf
用于在单个指令中执行移位和异或运算的方法和装置.pdf
一种持续保存FRU信息的设计方法.pdf
基本输入输出系统维护方法.pdf
输入系统及其方法.pdf
一种不平衡数据的分类方法.pdf
一种利用汉语数码语音输入计算机指令的方法及装置.pdf
基板管理控制器控制方法.pdf
一种轮齿表面弯曲变形量的计算方法.pdf
一种ERP系统中海量运维数据的采集方法.pdf
远端存取资产管理数据的系统及其方法.pdf