招标信息获取方法及装置.pdf
《招标信息获取方法及装置.pdf》由会员分享,可在线阅读,更多相关《招标信息获取方法及装置.pdf(16页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010311011.7 (22)申请日 2020.04.20 (71)申请人 北京中电普华信息技术有限公司 地址 100192 北京市海淀区清河小营东路 15号科研楼710室 (72)发明人 陈亮邱菊杨延杨敬宏 (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 杨华 (51)Int.Cl. G06F 16/951(2019.01) G06F 16/955(2019.01) (54)发明名称 一种招标信息获取方法及装置 (57)摘要 本申请公开了一种招。
2、标信息获取方法及装 置, 从招标网站上获取招标公告页面中的页面信 息, 页面信息至少包括项目名称。 使用预设规则 表达式, 获得项目名称的超链接。 通过超链接, 访 问招标项目的明细页面, 并从明细页面中抓取招 标项目的招标信息, 将招标信息存储至本地。 可 见, 本申请通过网络爬虫工具, 具体的网络爬虫 工具可以是Python语言中的Requests库, 获取招 标公告页面中的页面信息, 通过预设规则表达 式, 获取页面信息中项目名称的超链接, 通过超 链接访问招标项目的明细页面, 并从明细页面中 获取招标项目的招标信息, 本申请提供的招标信 息获取方案, 效率高, 并且能够实时监控招标网 。
3、站的招标情况, 即时记录招标网站提供的招标信 息。 权利要求书2页 说明书8页 附图5页 CN 111506795 A 2020.08.07 CN 111506795 A 1.一种招标信息获取方法, 其特征在于, 包括: 从招标网站上获取招标公告页面中的页面信息, 所述页面信息至少包括项目名称; 使用预设规则表达式, 获得所述项目名称的超链接; 通过所述超链接, 访问招标项目的明细页面; 从所述明细页面中抓取所述招标项目的招标信息; 将所述招标信息存储至本地。 2.根据权利要求1所述的方法, 其特征在于, 所述使用预设规则表达式, 获得所述项目 名称的超链接, 包括: 使用第一规则表达式, 过。
4、滤所述页面信息的原码中的空白字, 得到目标原码; 使用第二规则表达式, 过滤所述目标原码中不具备第一预设字符的字符串, 得到所述 项目名称的原码; 使用第三规则表达式, 过滤所述项目名称的所述原码中不具备第二预设字符的原码, 得到超链接的原码; 基于所述超链接的所述原码, 还原得到所述超链接。 3.根据权利要求1所述的方法, 其特征在于, 所述招标信息至少包括项目类型和项目公 告文件的文件下载地址。 4.根据权利要求3所述的方法, 其特征在于, 所述从所述明细页面中抓取所述招标项目 的招标信息之后, 还包括: 通过所述文件下载地址, 下载所述项目公告文件; 将所述项目公告文件存储至本地。 5.。
5、根据权利要求3所述的方法, 其特征在于, 所述从所述明细页面中抓取所述招标项目 的招标信息之后, 还包括: 判断所述项目类型是否与预设项目类型一致; 所述将所述招标信息存储至本地, 包括: 在所述项目类型与所述预设项目类型一致的情况下, 将所述项目类型所属的所述招标 项目的所述招标信息存储至本地。 6.根据权利要求1所述的方法, 其特征在于, 所述从所述明细页面中抓取所述招标项目 的招标信息之后, 还包括: 对所述招标信息进行关键词检索, 得到检索结果; 比较所述检索结果与预设关键词之间的相似度; 所述将所述招标信息存储至本地, 包括: 在所述相似度大于预设阈值的情况下, 将所述招标信息存储至。
6、本地。 7.一种招标信息获取装置, 其特征在于, 包括: 第一获取单元, 用于从招标网站上获取招标公告页面中的页面信息, 所述页面信息至 少包括项目名称; 第二获取单元, 用于使用预设规则表达式, 获得所述项目名称的超链接; 访问单元, 用于通过所述超链接, 访问招标项目的明细页面; 抓取单元, 用于从所述明细页面中抓取所述招标项目的招标信息; 第一存储单元, 用于将所述招标信息存储至本地。 权利要求书 1/2 页 2 CN 111506795 A 2 8.根据权利要求7所述的装置, 其特征在于, 还包括: 下载单元, 用于通过所述招标信息中项目公告文件的文件下载地址, 下载所述项目公 告文件。
7、; 第二存储单元, 用于将所述项目公告文件存储至本地。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质包括存储的程序, 其中, 所 述程序执行权利要求1-6任意一项所述的招标信息获取方法。 10.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线; 所述处理器与所述存储 器通过所述总线连接; 所述存储器用于存储程序, 所述处理器用于运行程序, 其中, 所述程序运行时执行权利 要求1-6任意一项所述的招标信息获取方法。 权利要求书 2/2 页 3 CN 111506795 A 3 一种招标信息获取方法及装置 技术领域 0001 本申请涉及信息收集技术领域, 尤其涉及一种招标。
8、信息获取方法及装置。 背景技术 0002 在进行业务处理工作中, 基于业务需求需要经常处理招标信息, 因此, 需要实时查 看招标网站中招标公告页面的最新发布情况。 由此需要安排专门的人员负责监控招标网 站, 但是受限于人工查看信息的低效率和工作时间, 招标信息的获取工作效率十分低效, 且 具有较大时延。 发明内容 0003 本申请提供了一种基于网络爬虫的招标信息获取方法及装置, 目的在于提高招标 信息获取工作的效率并降低招标信息的获取时延。 0004 为了实现上述目的, 本申请提供了以下技术方案: 0005 一种招标信息获取方法, 包括: 0006 从招标网站上获取招标公告页面中的页面信息, 。
9、所述页面信息至少包括项目名 称; 0007 使用预设规则表达式, 获得所述项目名称的超链接; 0008 通过所述超链接, 访问招标项目的明细页面; 0009 从所述明细页面中抓取所述招标项目的招标信息; 0010 将所述招标信息存储至本地。 0011 可选的, 所述使用预设规则表达式, 获得所述项目名称的超链接, 包括: 0012 使用第一规则表达式, 过滤所述页面信息的原码中的空白字, 得到目标原码; 0013 使用第二规则表达式, 过滤所述目标原码中不具备第一预设字符的字符串, 得到 所述项目名称的原码; 0014 使用第三规则表达式, 过滤所述项目名称的所述原码中不具备第二预设字符的原 。
10、码, 得到超链接的原码; 0015 基于所述超链接的所述原码, 还原得到所述超链接。 0016 可选的, 所述招标信息至少包括项目类型和项目公告文件的文件下载地址。 0017 可选的, 所述从所述明细页面中抓取所述招标项目的招标信息之后, 还包括: 0018 通过所述文件下载地址, 下载所述项目公告文件; 0019 将所述项目公告文件存储至本地。 0020 可选的, 所述从所述明细页面中抓取所述招标项目的招标信息之后, 还包括: 0021 判断所述项目类型是否与预设项目类型一致; 0022 所述将所述招标信息存储至本地, 包括: 0023 在所述项目类型与所述预设项目类型一致的情况下, 将所述。
11、项目类型所属的所述 招标项目的所述招标信息存储至本地。 说明书 1/8 页 4 CN 111506795 A 4 0024 可选的, 所述从所述明细页面中抓取所述招标项目的招标信息之后, 还包括: 0025 对所述招标信息进行关键词检索, 得到检索结果; 0026 比较所述检索结果与预设关键词之间的相似度; 0027 所述将所述招标信息存储至本地, 包括: 0028 在所述相似度大于预设阈值的情况下, 将所述招标信息存储至本地。 0029 一种招标信息获取装置, 包括: 0030 第一获取单元, 用于从招标网站上获取招标公告页面中的页面信息, 所述页面信 息至少包括项目名称; 0031 第二获。
12、取单元, 用于使用预设规则表达式, 获得所述项目名称的超链接; 0032 访问单元, 用于通过所述超链接, 访问招标项目的明细页面; 0033 抓取单元, 用于从所述明细页面中抓取所述招标项目的招标信息; 0034 第一存储单元, 用于将所述招标信息存储至本地。 0035 可选的, 还包括: 0036 下载单元, 用于通过所述招标信息中项目公告文件的文件下载地址, 下载所述项 目公告文件; 0037 第二存储单元, 用于将所述项目公告文件存储至本地。 0038 一种计算机存储介质, 所述计算机存储介质包括存储的程序, 其中, 所述程序执行 所述的招标信息获取方法。 0039 一种电子设备, 包。
13、括: 处理器、 存储器和总线; 所述处理器与所述存储器通过所述 总线连接; 0040 所述存储器用于存储程序, 所述处理器用于运行程序, 其中, 所述程序运行时执行 所述的招标信息获取方法。 0041 本申请提供的技术方案, 从招标网站上获取招标公告页面中的页面信息, 页面信 息至少包括项目名称。 使用预设规则表达式, 获得项目名称的超链接。 通过超链接, 访问招 标项目的明细页面, 并从明细页面中抓取招标项目的招标信息, 将招标信息存储至本地。 可 见, 本申请通过网络爬虫工具, 具体的网络爬虫工具可以是Python语言中的Requests库, 获 取招标公告页面中的页面信息, 通过预设规则。
14、表达式, 获取页面信息中项目名称的超链接, 通过超链接访问招标项目的明细页面, 并从明细页面中获取招标项目的招标信息, 本申请 提供的招标信息获取方案, 效率高, 并且能够实时监控招标网站的招标情况, 即时记录招标 网站提供的招标信息。 附图说明 0042 为了更清楚地说明本申请实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 申请的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。 0043 图1a为本申请实施例提供的一种招标公告页面; 0044 。
15、图1b为本申请实施例提供的一种招标项目的明细页面; 0045 图1c为本申请实施例提供的一种招标信息获取方法的示意图; 说明书 2/8 页 5 CN 111506795 A 5 0046 图1d为本申请实施例提供的一种页面信息原码的示意图; 0047 图2为本申请实施例提供的另一种招标信息获取方法的示意图; 0048 图3为本申请实施例提供的一种招标信息获取装置的结构示意图。 具体实施方式 0049 下面将结合本申请实施例中的附图, 对本申请实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本申请一部分实施例, 而不是全部的实施例。 基于 本申请中的实施例, 本领域普通。
16、技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例, 都属于本申请保护的范围。 0050 本申请实施例提供的流程应用于信息收集系统, 具体的, 可由服务器执行, 用于提 高招标信息获取工作的效率并降低招标信息的获取时延。 0051 需要说明的是, 在招标网站中, 招标公告页面如图1a所示, 包括项目状态、 项目编 号、 项目名称和创建时间(例如创建日期)等的页面信息。 在招标公告页面中, 通过项目名称 的超链接, 可以跳转至招标项目的明细页面, 明细页面包括项目状态、 项目编号、 项目名称 和报名截止日期等招标信息, 具体的, 可以参见图1b。 0052 如图1c所示, 为本申请实施例。
17、提供的一种招标信息获取方法的示意图, 包括如下 步骤: 0053 S101: 使用Python语言中Requests库的get()函数, 从招标网站上获取招标公告页 面中的页面信息。 0054 其中, Python语言是一种跨平台的计算机程序设计语言, 是一种面向对象的动态 类型语言, 用于编写自动化脚本。 Requests库是基于Python语言编写的一种HTTP库。 Requests库的get()函数的功能, 具体是通过rrequest.get(url)构造一个向服务器请 求资源的url。 此外, url由Requests库内部生成, url具体指的是: 通过http协议存取资源的 一个路。
18、径, 可以理解为是电脑中的一个文件的路径。 此时, r返回的是一个包含服务器资源 的Requests对象, Requests对象包含从服务器返回的所有的相关资源(即招标公告页面中 的页面信息)。 0055 具体的, 使用Requests库的get()函数, 从招标网站上获取招标公告页面中的页面 信息的实现代码为: 0056 import requests 0057 rrequests.get(url,timeout30)#根据url得到页面信息 0058 需要说明的是, 上述具体实现代码仅仅用于举例说明。 0059 S102: 使用预设规则表达式, 获得项目名称的超链接。 0060 其中, 规。
19、则表达式(Regular Expression, RE)为计算机科学的一种逻辑, 通常用于 检索、 替换符合预设规则的文本, 具体原理是: 对字符串操作的一种逻辑公式, 就是用事先 定义的各个特定字符、 以及各个特定字符的组合, 组成一个规则字符串, 该规则字符串用于 指示对字符串的一种过滤逻辑, 即用于检索符合预设规则(例如, 包含用于指示超链接的字 符)的文本。 0061 需要说明的是, 使用预设规则表达式, 获得项目名称的超链接的实现逻辑为: 0062 1、 使用第一规则表达式, 过滤页面信息的原码中的空白字(具体指的是空格和回 说明书 3/8 页 6 CN 111506795 A 6 。
20、车), 得到目标原码。 0063 以图1d示出的页面信息原码为例, 在图1d中,“正在招标” 的上一行和下一行均为 空白字, 故需过滤 “正在招标” 的上一行和下一行, 保留 “正在招标” 。 0064 2、 使用第二规则表达式, 过滤目标原码中不具备第一预设字符的字符串, 得到项 目名称的原码。 0065 具体的, 项目名称的原码中都具备 “title” 字符(即 “title” 字符为第一预设字 符), 因此, 目标原码中不具备 “title” 字符的字符串, 都是非项目名称的原码, 过滤非项目 名称的原码, 得到项目名称的原码。 0066 3、 使用第三规则表达式, 过滤项目名称的原码中。
21、不具备第二预设字符的原码, 得 到超链接的原码。 0067 具体的, 超链接的原码中都具备 “onclick” 字符(即 “onclick” 字符为第二预设字 符), 因此, 项目名称的原码中不具备 “onclick” 字符的字符串, 都是非超链接的原码, 过滤 非超链接的原码, 得到超链接的原码。 0068 4、 基于超链接的原码, 还原得到超链接。 0069 具体的, 在超链接的原码基础上, 增加 “.html” 字符, 从而得到完整的超链接。 0070 具体的, 使用预设规则表达式, 获得项目名称的超链接的实现代码参见下述: 0071 tdListre.findall(r(.*? ),r。
22、.text,re.S| re.M) 0072 rList 0073 for iin tdList: 0074 ire.sub(rs*,” ,i)#使用第一规则表达式, 过滤页面信息的原码中的空白 字, 得到目标原码 0075 iftitleini: 0076 titlere.findall(rtitle(.*? ),i)#使用第二规则表达式, 过滤目标原 码中不具备第一预设字符的字符串, 得到项目名称的原码 0077 onclickre.findall(ronclick(.*? ),i)#使用第三规则表达式, 过滤项 目名称的原码中不具备第二预设字符的原码, 得到超链接的原码 0078 pro。
23、ject_detailre.findall(r(.*? )” ,i) 0079 detail_urlproject_detail1+.html#基于超链接的原码, 还原得到超链接 rList.append(title0) 0080 rList.append(detail_url) 0081 rList.extend(getZbgg_detail(detail_url)#getZbgg_detail(url)为用于访 问超链接对应的明细页面的函数 0082 else: 0083 rList.append(i) 0084 需要说明的是, 上述具体实现代码仅仅用于举例说明。 0085 S103: 通。
24、过项目名称的超链接, 访问招标项目的明细页面, 并从明细页面中抓取招 标项目的招标信息。 0086 其中, 从明细页面中获取17项招标信息, 以图1b示出的明细页面为例, 17项招标信 说明书 4/8 页 7 CN 111506795 A 7 息具体为: 项目状态、 项目编号、 项目名称、 报名截止日期、 截标时间、 开标时间、 项目类型、 标书费用形式、 标书购买截止时间、 项目介绍、 项目公告文件的文件下载地址、 招标人、 代理 机构、 联系人、 联系电话、 传真、 以及E-MAIL。 0087 具体的, 从明细页面中获取17项招标信息的实现代码为: 0088 defgetZbgg_det。
25、ail(url):#访问超链接对应的明细页面 0089 try: 0090 rrequests.get(url,timeout30) 0091 r.encodingutf-8 0092 tdListre.findall(r(.*? ),r.text,re.S|re.M) 0093 list17 #从明细页面中获取17项招标信息 0094 for j in range(7,len(tdList),2): 0095 stdListj.replace(r,” ).replace(n,” ).replace(t,” ).strip() 0096 ifhrefin s: 0097 zip_detailr。
26、e.findall(r(.*? ),s) 0098 downfilezip_detail0#获取项目公告文件中的文件下载地址 0099 list17.append(downfile) 0100 else: 0101 list17.append(s) 0102 return list17 0103 需要说明的是, 上述具体实现代码仅仅用于举例说明。 0104 S104: 将招标信息存储至预设的excel表格。 0105 其中, 将招标信息存储至预设的excel表格的具体实现逻辑为: 定义用于存储招标 信息的写入函数, 写入函数包括预设的文件写入路径, 在写入函数的调用过程中, 通过文件 写入路径。
27、, 将招标信息写入预设的存储空间。 0106 具体的, 将招标信息存储至预设的excel表格的实现代码为: 0107 def write_excel(path,value):#write_excel(path,value)为写入函数, value 为文件写入路径 0108 indexlen(value) 0109 workbookopenpyxl.Workbook() 0110 sheetworkbook.active 0111 for iin range(0,index): 0112 for j in range(0,len(valuei): 0113 sheet.cell(rowi+1,c。
28、olumnj+1,valuestr(valueij) 0114 workbook.save(path) 0115 需要说明的是, 上述具体实现代码仅仅用于举例说明。 0116 S105: 通过项目公告文件的文件下载地址, 下载项目公告文件, 并将项目公告文件 存储至本地。 0117 其中, 项目公告文件指示包括招标方提供的用于指示招标详情的文件。 0118 具体的, 通过项目公告文件的文件下载地址, 下载项目公告文件的实现代码为: 说明书 5/8 页 8 CN 111506795 A 8 0119 def downloadzip(downfile):#downfile为文件下载地址 0120 。
29、fzipdownfile12: 0121 pathd:/+fzip 0122 rrequests.get(downfile) 0123 with open(path,wb)as f: 0124 f.write(r.content) 0125 f.close() 0126 需要说明的是, 上述具体实现代码仅仅用于举例说明。 0127 综上所述, 使用Python语言中Requests库的get()函数, 从招标网站上获取招标公 告页面中的页面信息。 使用预设规则表达式, 获得项目名称的超链接。 通过项目名称的超链 接, 访问招标项目的明细页面, 并从明细页面中抓取招标项目的招标信息。 将招标信息。
30、存储 至预设的excel表格, 通过项目公告文件的文件下载地址, 下载项目公告文件, 并将项目公 告文件存储至本地。 可见, 本实施例通过网络爬虫工具, 具体的网络爬虫工具可以是Python 语言中的Requests库, 获取招标公告页面中的页面信息, 通过预设规则表达式, 获取页面信 息中项目名称的超链接, 通过超链接访问招标项目的明细页面, 并从明细页面中获取招标 项目的招标信息, 本实施例提供的招标信息获取方案, 效率高, 并且能够实时监控招标网站 的招标情况, 即时记录招标网站提供的招标信息。 0128 需要说明的是, 上述实施例中, 使用Python语言中Requests库的get(。
31、)函数, 从招 标网站上获取招标公告页面中的页面信息, 仅仅是获取页面信息的一种具体表现方式。 此 外, 将招标信息存储至预设的escel表格, 也仅仅是将招标信息存储至本地的一种具体表现 方式。 上述实施例中的招标信息获取方法, 可以概括为图2所示的流程。 0129 如图2所示, 为本申请实施例提供的另一种招标信息获取方法的示意图, 包括如下 步骤: 0130 S201: 从招标网站上获取招标公告页面中的页面信息。 0131 其中, 页面信息至少包括项目名称。 0132 需要说明的是, S201的具体执行过程和实现原理, 与上述实施例中S101的具体执 行过程和实现原理一致, 这里不再赘述。。
32、 0133 S202: 使用预设规则表达式, 获得项目名称的超链接。 0134 其中, S202的具体执行过程和实现原理, 与上述实施例中S102的具体执行过程和 实现原理一致, 这里不再赘述。 0135 S203: 通过超链接, 访问招标项目的明细页面。 0136 其中, 通过超链接, 访问招标项目的明细页面的具体实现过程为: 调用预设的用于 访问超链接对应的明细页面的函数, 例如, 上述实施例中提出的getZbgg_detail(url)。 0137 S204: 从明细页面中抓取招标项目的招标信息。 0138 其中, 招标信息至少包括项目类型和项目公告文件的文件下载地址。 0139 需要说。
33、明的是, S204的具体执行过程和实现原理, 与上述实施例中S103的具体执 行过程和实现原理一致, 这里不再赘述。 0140 S205: 将招标信息存储至本地。 0141 其中, S205的具体执行过程和实现原理, 与上述实施例中S104的具体执行过程和 说明书 6/8 页 9 CN 111506795 A 9 实现原理一致, 这里不再赘述。 0142 需要说明的是, 由于招标网站上提供的招标信息种类繁杂, 并不都是都需要, 因此 需要有针对性的筛选招标信息。 0143 可选的, 在从明细页面中抓取招标项目的招标信息之后, 判断项目类型是否与预 设项目类型一致。 在项目类型与预设项目类型一致。
34、的情况下, 将项目类型所属的招标项目 的招标信息存储至本地。 0144 具体的, 如果只需要项目类型为道路维修的招标项目, 则只将属于道路维修招标 项目的招标信息存储至本地。 0145 可选的, 在从明细页面中抓取招标项目的招标信息之后, 对招标信息进行关键词 检索, 得到检索结果。 比较检索结果与预设关键词之间的相似度。 在相似度大于预设阈值的 情况下, 将招标信息存储至本地。 0146 需要说明的是, 对招标信息进行关键词检索, 依据检索结果与预设关键词之间的 相似度, 依据相似度存储招标信息, 能够更有针对性的筛选招标项目。 0147 综上所述, 从招标网站上获取招标公告页面中的页面信息。
35、, 页面信息至少包括项 目名称。 使用预设规则表达式, 获得项目名称的超链接。 通过超链接, 访问招标项目的明细 页面, 并从明细页面中抓取招标项目的招标信息, 将招标信息存储至本地。 可见, 本实施例 通过网络爬虫工具, 具体的网络爬虫工具可以是Python语言中的Requests库, 获取招标公 告页面中的页面信息, 通过预设规则表达式, 获取页面信息中项目名称的超链接, 通过超链 接访问招标项目的明细页面, 并从明细页面中获取招标项目的招标信息, 本实施例提供的 招标信息获取方案, 效率高, 并且能够实时监控招标网站的招标情况, 即时记录招标网站提 供的招标信息。 0148 与上述本申请。
36、实施例提供的招标信息获取方法相对应, 如图3所示, 为本申请实施 例提供的一种招标信息获取装置的结构示意图, 包括: 0149 第一获取单元100, 用于从招标网站上获取招标公告页面中的页面信息, 页面信息 至少包括项目名称。 0150 第二获取单元200, 用于使用预设规则表达式, 获得项目名称的超链接。 0151 其中, 第二获取单元200使用预设规则表达式, 获得项目名称的超链接的具体实现 过程, 包括: 使用第一规则表达式, 过滤页面信息的原码中的空白字, 得到目标原码。 使用第 二规则表达式, 过滤目标原码中不具备第一预设字符的字符串, 得到项目名称的原码。 使用 第三规则表达式, 。
37、过滤项目名称的原码中不具备第二预设字符的原码, 得到超链接的原码。 基于超链接的原码, 还原得到超链接。 0152 访问单元300, 用于通过超链接, 访问招标项目的明细页面。 0153 抓取单元400, 用于从明细页面中抓取招标项目的招标信息。 0154 其中, 抓取单元400从明细页面中抓取的招标信息至少包括项目类型和项目公告 文件的文件下载地址。 0155 第一存储单元500, 用于将招标信息存储至本地。 0156 其中, 第一存储单元500将招标信息存储至本地的具体实现过程, 包括: 在项目类 型与预设项目类型一致的情况下, 将项目类型所属的招标项目的招标信息存储至本地。 在 相似度大。
38、于预设阈值的情况下, 将招标信息存储至本地。 说明书 7/8 页 10 CN 111506795 A 10 0157 下载单元600, 用于通过招标信息中项目公告文件的文件下载地址, 下载项目公告 文件。 0158 第二存储单元700, 用于将项目公告文件存储至本地。 0159 判断单元800, 用于判断招标信息中的项目类型是否与预设项目类型一致。 0160 比较单元900, 用于对招标信息进行关键词检索, 得到检索结果, 比较检索结果与 预设关键词之间的相似度。 0161 综上所述, 从招标网站上获取招标公告页面中的页面信息, 页面信息至少包括项 目名称。 使用预设规则表达式, 获得项目名称。
39、的超链接。 通过超链接, 访问招标项目的明细 页面, 并从明细页面中抓取招标项目的招标信息, 将招标信息存储至本地。 可见, 本实施例 通过网络爬虫工具, 具体的网络爬虫工具可以是Python语言中的Requests库, 获取招标公 告页面中的页面信息, 通过预设规则表达式, 获取页面信息中项目名称的超链接, 通过超链 接访问招标项目的明细页面, 并从明细页面中获取招标项目的招标信息, 本实施例提供的 招标信息获取方案, 效率高, 并且能够实时监控招标网站的招标情况, 即时记录招标网站提 供的招标信息。 0162 本申请还提供了一种计算机存储介质, 计算机存储介质包括存储的程序, 其中, 程 。
40、序执行上述本申请提供的招标信息获取方法。 0163 本申请还提供了一种电子设备, 包括: 处理器、 存储器和总线。 处理器与存储器通 过总线连接, 存储器用于存储程序, 处理器用于运行程序, 其中, 程序运行时执行上述本申 请提供的招标信息获取方法。 0164 本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产 品销售或使用时, 可以存储在一个计算设备可读取存储介质中。 基于这样的理解, 本申请实 施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来, 该软件产品存储在一个存储介质中, 包括若干指令用以使得一台计算设备(可以是个人计 算机, 服务器, 。
41、移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部 分步骤。 而前述的存储介质包括: U盘、 移动硬盘、 只读存储器(ROM, Read-Only Memory)、 随 机存取存储器(RAM, Random Access Memory)、 磁碟或者光盘等各种可以存储程序代码的介 质。 0165 本说明书中各个实施例采用递进的方式描述, 每个实施例重点说明的都是与其它 实施例的不同之处, 各个实施例之间相同或相似部分互相参见即可。 0166 对所公开的实施例的上述说明, 使本领域专业技术人员能够实现或使用本申请。 对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 。
42、本文中所定义的 一般原理可以在不脱离本申请的精神或范围的情况下, 在其它实施例中实现。 因此, 本申请 将不会被限制于本文所示的这些实施例, 而是要符合与本文所公开的原理和新颖特点相一 致的最宽的范围。 说明书 8/8 页 11 CN 111506795 A 11 图1a 说明书附图 1/5 页 12 CN 111506795 A 12 图1b 说明书附图 2/5 页 13 CN 111506795 A 13 图1c 说明书附图 3/5 页 14 CN 111506795 A 14 图1d 说明书附图 4/5 页 15 CN 111506795 A 15 图2 图3 说明书附图 5/5 页 16 CN 111506795 A 16 。
- 内容关键字: 招标 信息 获取 方法 装置
防水接线结构.pdf
在线测量散状物料真密度的装置.pdf
适用于室内装修的工作架.pdf
套管施工辅助装置.pdf
防水开关.pdf
水循环增氧轮虫培养池.pdf
新型的包装袋.pdf
建筑涂料搅拌设备.pdf
薄膜生产用加热定型装置.pdf
电机转子线圈绕线机.pdf
激光器保护电路、激光器驱动电源和电子设备.pdf
养殖场通风管道生产用法兰冲孔机.pdf
分子筛吸附分离能力检测系统.pdf
寄存器、寄存器配置方法及芯片.pdf
信号质量检测方法及信号质量检测电路.pdf
基于自适应卷积核和级联检测头的土地覆盖变化检测方法.pdf
运梁炮车自动化调姿系统和方法.pdf
RPA流程操作异常检测方法、设备及存储设备.pdf
适用于PEEK材料的高温3D打印机高温舱结构.pdf
户用电池储能系统.pdf
空气质量预报评估方法、装置、存储介质及电子设备.pdf
基于环境嵌入的分布式光纤入侵预警方法及系统.pdf
显示模组拆解装置和显示模组拆解方法.pdf
安全检测方法、装置、终端设备及计算机可读存储介质.pdf
自清洁式铝合金门窗及清洁方法.pdf
基于pipeline流程的业务管理方法及装置.pdf
警力资源调度方法、装置、电子设备和计算机可读介质.pdf
离子氮化炉罩自动升降行走机构.pdf
蓝牙耳机及其存储收纳充电装置.pdf
X射线管.pdf
用于飞机蒙皮精密激光焊接工艺的快速冷却装置.pdf
生物资产监控方法、装置、设备及存储介质.pdf