配置化的文件解析方法及装置.pdf

上传人:倪** 文档编号:10200384 上传时间:2021-06-10 格式:PDF 页数:16 大小:678.86KB
收藏 版权申诉 举报 下载
配置化的文件解析方法及装置.pdf_第1页
第1页 / 共16页
配置化的文件解析方法及装置.pdf_第2页
第2页 / 共16页
配置化的文件解析方法及装置.pdf_第3页
第3页 / 共16页
文档描述:

《配置化的文件解析方法及装置.pdf》由会员分享,可在线阅读,更多相关《配置化的文件解析方法及装置.pdf(16页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010916887.4 (22)申请日 2020.09.03 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 方曦赵奇孙伟 (74)专利代理机构 北京三友知识产权代理有限 公司 11127 代理人 吕俊刚吴学锋 (51)Int.Cl. G06F 8/36(2018.01) (54)发明名称 配置化的文件解析方法及装置 (57)摘要 本发明公开一种配置化的文件解析方法及 装置, 其中该方法包括: 根据文本文件的结构, 。

2、配 置节点、 节点处理类和节点处理规则; 节点为文 本文件每一行的抽象, 节点处理类为处理节点的 类, 节点处理规则为节点的解析规则; 根据节点 的结构, 配置单元、 单元处理类和单元处理规则; 单元为文本文件中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理规则为单 元的解析规则; 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析; 对文本文件, 根据单元处理规则, 通过单元处理类对单元进行 解析; 根据节点的解析结果, 以及单元的解析结 果, 构建文本文件的解析结果。 本发明可以提高 代码的复用性、 可读性和扩展性, 并易于维护。 权利要求书3页 说明书7页 。

3、附图5页 CN 112051998 A 2020.12.08 CN 112051998 A 1.一种配置化的文件解析方法, 其特征在于, 包括: 根据文本文件的结构, 配置节点、 节点处理类和节点处理规则; 其中, 节点为文本文件 每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为节点的解析规则; 根据节点的结构, 配置单元、 单元处理类和单元处理规则; 其中, 单元为文本文件中每 一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理规则为单元的解析规则; 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析; 对文本文件, 根据单元处理规则, 通过单元处理类对单元。

4、进行解析; 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果。 2.如权利要求1所述的方法, 其特征在于, 节点包括起始节点、 汇总节点、 明细节点和结 束节点; 其中, 起始节点为文本文件起始行信息, 汇总节点为文本文件汇总行信息, 明细节 点为文本文件明细信息, 结束节点为文本文件结束行信息。 3.如权利要求1所述的方法, 其特征在于, 还包括: 根据文本文件的结构, 配置节点预处理规则; 节点预处理规则为节点的预解析规则; 所述对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析之前, 还包括: 根据节点预处理规则, 通过节点处理类对节点进行预解析。 4.如权。

5、利要求1所述的方法, 其特征在于, 还包括: 根据文本文件的结构, 配置节点后处理规则; 节点后处理规则为节点的后解析规则; 所述对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析之后, 还包括: 根据节点后处理规则, 通过节点处理类对节点进行后解析。 5.如权利要求1所述的方法, 其特征在于, 还包括: 根据节点的结构, 配置单元预处理规则; 单元预处理规则为单元的预解析规则; 所述对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析之前, 还包括: 根据单元预处理规则, 通过单元处理类对单元进行预解析。 6.如权利要求1所述的方法, 其特征在于, 还包括: 根据节点的。

6、结构, 配置单元后处理规则; 单元后处理规则为单元的后解析规则; 所述对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析之后, 还包括: 根据单元后处理规则, 通过单元处理类对单元进行后解析。 7.如权利要求1所述的方法, 其特征在于, 配置节点处理类, 包括: 在节点处理类中配置节点相关信息; 其中, 节点相关信息包括节点中的列信息和/或分 隔符。 8.如权利要求1至7任一项所述的方法, 其特征在于, 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析, 包括: 对属于同一类别的多个文本文件, 并行对节点进行 解析; 对文本文件, 根据单元处理规则, 通过单元处理类对。

7、单元进行解析, 包括: 对属于同一 类别的多个文本文件, 并行对单元进行解析; 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果, 包括: 对属于 同一类别的多个文本文件, 并行构建文本文件的解析结果; 其中, 所述同一类别的多个文本文件的结构相同。 9.一种配置化的文件解析装置, 其特征在于, 包括: 权利要求书 1/3 页 2 CN 112051998 A 2 节点配置模块, 用于根据文本文件的结构, 配置节点、 节点处理类和节点处理规则; 其 中, 节点为文本文件每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为节点的解 析规则; 单元配置模块, 用于根据节点的。

8、结构, 配置单元、 单元处理类和单元处理规则; 其中, 单 元为文本文件中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理规则 为单元的解析规则; 节点解析模块, 用于对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解 析; 单元解析模块, 用于对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解 析; 结果构建模块, 用于根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析 结果。 10.如权利要求9所述的装置, 其特征在于, 节点包括起始节点、 汇总节点、 明细节点和 结束节点; 其中, 起始节点为文本文件起始行信息, 汇总节点为文本文件汇总行信。

9、息, 明细 节点为文本文件明细信息, 结束节点为文本文件结束行信息。 11.如权利要求9所述的装置, 其特征在于, 节点配置模块, 还用于: 根据文本文件的结 构, 配置节点预处理规则; 节点预处理规则为节点的预解析规则; 所述装置还包括: 节点预解析模块, 用于在节点解析模块对节点进行解析之前, 根据节点预处理规则, 通 过节点处理类对节点进行预解析。 12.如权利要求9所述的装置, 其特征在于, 节点配置模块, 还用于: 根据文本文件的结 构, 配置节点后处理规则; 节点后处理规则为节点的后解析规则; 所述装置还包括: 节点后解析模块, 用于在单元解析模块对单元进行解析之后, 根据节点后处。

10、理规则, 通 过节点处理类对节点进行后解析。 13.如权利要求9所述的装置, 其特征在于, 单元配置模块, 还用于: 根据节点的结构, 配 置单元预处理规则; 单元预处理规则为单元的预解析规则; 所述装置还包括: 单元预解析模块, 用于在单元解析模块对单元进行解析之前, 根据单元预处理规则, 通 过单元处理类对单元进行预解析。 14.如权利要求9所述的装置, 其特征在于, 单元配置模块, 还用于: 根据节点的结构, 配 置单元后处理规则; 单元后处理规则为单元的后解析规则; 所述装置还包括: 单元后解析模块, 用于在单元解析模块对单元进行解析之后, 根据单元后处理规则, 通 过单元处理类对单元。

11、进行后解析。 15.如权利要求9所述的装置, 其特征在于, 节点配置模块, 具体用于: 在节点处理类中配置节点相关信息; 其中, 节点相关信息包括节点中的列信息和/或分 隔符。 16.如权利要求9至15任一项所述的装置, 其特征在于, 节点解析模块, 具体用于: 对属 权利要求书 2/3 页 3 CN 112051998 A 3 于同一类别的多个文本文件, 并行对节点进行解析; 单元解析模块, 具体用于: 对属于同一类别的多个文本文件, 并行对单元进行解析; 结果构建模块, 具体用于: 对属于同一类别的多个文本文件, 并行构建文本文件的解析 结果; 其中, 所述同一类别的多个文本文件的结构相同。

12、。 17.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至8任一所述方 法。 18.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有执行权利 要求1至8任一所述方法的计算机程序。 权利要求书 3/3 页 4 CN 112051998 A 4 配置化的文件解析方法及装置 技术领域 0001 本发明涉及文件处理技术领域, 尤其涉及配置化的文件解析方法及装置。 背景技术 0002 本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。 此处的描述 不因为包括在本部分中就承认。

13、是现有技术。 0003 在使用一些系统时, 文本文件解析是常用的一类操作, 所以, 文本文件解析经常是 一个新建系统(网站、 应用软件等)不可避免要解决的一个问题。 一般情况下, 软件工程师按 照系统支持的各类文件, 针对每一文件, 开发一套文件解析处理程序。 而实际情况是, 系统 中各类文件格式比较相近或相似, 文件解析存在大量相同或相近处理, 按照不同的文件编 写解析程序, 即使文件结构差距较小, 相同的处理过程也要编写多次, 无法进行复用; 而且, 文件解析常使用面向过程的处理方法, 解析过程混乱, 导致代码可读性差、 扩展性差、 难维 护。 发明内容 0004 本发明实施例提供一种配置。

14、化的文件解析方法, 用以提高代码的复用性、 可读性 和扩展性, 并易于维护, 该方法包括: 0005 根据文本文件的结构, 配置节点、 节点处理类和节点处理规则; 其中, 节点为文本 文件每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为节点的解析规则; 0006 根据节点的结构, 配置单元、 单元处理类和单元处理规则; 其中, 单元为文本文件 中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理规则为单元的解析 规则; 0007 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析; 0008 对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析; 。

15、0009 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果。 0010 本发明实施例还提供一种配置化的文件解析装置, 用以提高代码的复用性、 可读 性和扩展性, 并易于维护, 该装置包括: 0011 节点配置模块, 用于根据文本文件的结构, 配置节点、 节点处理类和节点处理规 则; 其中, 节点为文本文件每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为节 点的解析规则; 0012 单元配置模块, 用于根据节点的结构, 配置单元、 单元处理类和单元处理规则; 其 中, 单元为文本文件中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理 规则为单元的解析规。

16、则; 0013 节点解析模块, 用于对文本文件, 根据节点处理规则, 通过节点处理类对节点进行 解析; 0014 单元解析模块, 用于对文本文件, 根据单元处理规则, 通过单元处理类对单元进行 说明书 1/7 页 5 CN 112051998 A 5 解析; 0015 结果构建模块, 用于根据节点的解析结果, 以及单元的解析结果, 构建文本文件的 解析结果。 0016 本发明实施例还提供一种计算机设备, 包括存储器、 处理器及存储在存储器上并 可在处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现上述配置化的文 件解析方法。 0017 本发明实施例还提供一种计算机可读存储介质, 所。

17、述计算机可读存储介质存储有 执行上述配置化的文件解析方法的计算机程序。 0018 本发明实施例中, 根据文本文件的结构, 配置节点、 节点处理类和节点处理规则; 根据节点的结构, 配置单元、 单元处理类和单元处理规则; 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析, 根据单元处理规则, 通过单元处理类对单元进行解析; 根 据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果, 与现有技术中使用面 向过程的处理方法针对每一文件开发一套文件解析程序的技术方案相比, 通过配置化的方 式实现文件解析, 只要文件结构没有变化, 就无需修改配置, 可以提高代码的复用性、 可读。

18、 性和扩展性, 并易于维护。 附图说明 0019 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。 在附图中: 0020 图1为本发明实施例中配置化的文件解析方法的示意图; 0021 图2为本发明实施例中配置化的文件解析方法的一具体实例图; 0022 图3为本发明实施例中并行解析文本文件的一具体示例图; 0023 图4为本发明实施例中配置化的文件解析装置的示意图; 002。

19、4 图5为本发明实施例中配置化的文件解析装置的一具体示例图; 0025 图6为本发明实施例中计算机设备的示意图。 具体实施方式 0026 为使本发明实施例的目的、 技术方案和优点更加清楚明白, 下面结合附图对本发 明实施例做进一步详细说明。 在此, 本发明的示意性实施例及其说明用于解释本发明, 但并 不作为对本发明的限定。 0027 发明人发现, 现有技术中, 对于文件解析的程序编写, 常用处理方法是读取文件 后, 按照文件的格式, 编写面向过程的处理方法, 对于文件解析处理融合在一起, 而且由于 每个人的编程方式不同, 最后, 文件解析可以实现, 但可能出现以下问题: 1、 不可复用: 文件。

20、 解析按照不同类型的文件编写解析程序, 即使文件结构差距较小, 相同的处理过程也要编 写多次, 无法进行复用, 代码冗余。 2、 可读性差: 如果不借助注释或者说明文档, 很难理解文 件解析过程; 特别是, 当文件结构比较复杂时, 解读或走查时成本高。 3、 可扩展性差: 当解析 规则调整时, 由于规则处理分散在文件解析整个过程中, 不易于定位和分析规则调整影响, 说明书 2/7 页 6 CN 112051998 A 6 更不方便更改处理规则。 4、 可维护性差: 修改或删除现有文件解析某个处理规则时, 很难分 析修改方法或定位问题原因。 0028 发明人为了解决上述问题, 让软件工程师将更多。

21、精力关注在业务逻辑上, 在本发 明实施例中提出一种配置化的文件解析方法。 图1为本发明实施例中配置化的文件解析方 法的示意图, 如图1所示, 该方法可以包括: 0029 步骤101、 根据文本文件的结构, 配置节点、 节点处理类和节点处理规则; 其中, 节 点为文本文件每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为节点的解析规 则; 0030 步骤102、 根据节点的结构, 配置单元、 单元处理类和单元处理规则; 其中, 单元为 文本文件中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处理规则为单 元的解析规则; 0031 步骤103、 对文本文件, 根据节点处理规则。

22、, 通过节点处理类对节点进行解析; 0032 步骤104、 对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析; 0033 步骤105、 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果。 0034 由图1所示流程可以得知, 本发明实施例与现有技术中使用面向过程的处理方法 针对每一文件开发一套文件解析程序的技术方案相比, 通过配置化的方式实现文件解析, 只要文件结构没有变化, 就无需修改配置, 可以提高代码的复用性、 可读性和扩展性, 并易 于维护。 0035 对于文本文件解析前的配置, 只需要配置一次, 即可按配置实现相同结构文本文 件的解析, 在文本文件结构发。

23、生变化前, 不需要修改配置。 当文本文件结构发生变化时, 调 整文本文件解析前的配置即可, 方便扩展及维护。 实施例中, 可以由一名熟悉文本文件结构 的软件工程师, 完成对文本文件解析前的配置; 其他软件工程师只需要了解节点或单元的 处理规则, 减少了开发前的学习成本; 对于开发过程中发现的问题, 按解析前的配置, 很容 易定位至某个节点或单元, 提升问题解决效率。 0036 实施例中文本文件可以是一种由若干行字符构成的计算机文件, 文本文件存储的 信息为由分隔符分割的指定格式的文件, 常用的文件格式例如可以是TXT文件。 0037 实施例中, 根据文本文件的结构, 配置节点、 节点处理类和节。

24、点处理规则, 其中节 点可以包括起始节点、 汇总节点、 明细节点和结束节点; 其中, 起始节点为文本文件起始行 信息, 汇总节点为文本文件汇总行信息, 明细节点为文本文件明细信息, 结束节点为文本文 件结束行信息。 明细节点为文本文件解析处理的主要内容。 0038 实施例中, 还可以根据文本文件的结构, 配置节点预处理规则; 节点预处理规则为 节点的预解析规则。 节点的预解析一般指在对节点进行解析之前, 对节点进行预检。 例如可 以包括按设定的规则检查节点是否符合解析的条件。 后续在对文本文件, 根据节点处理规 则, 通过节点处理类对节点进行解析之前, 还可以包括: 根据节点预处理规则, 通过。

25、节点处 理类对节点进行预解析。 0039 实施例中, 还可以根据文本文件的结构, 配置节点后处理规则; 节点后处理规则为 节点的后解析规则。 节点的后解析一般指在对节点及单元进行解析之后, 对节点及单元的 解析结果再进行检查。 例如可以包括按设定的规则检查节点及单元的解析结果是否符合构 建文本文件解析结果的条件。 后续在对文本文件, 根据单元处理规则, 通过单元处理类对单 说明书 3/7 页 7 CN 112051998 A 7 元进行解析之后, 还可以包括: 根据节点后处理规则, 通过节点处理类对节点进行后解析。 0040 实施例中, 还可以根据节点的结构, 配置单元预处理规则; 单元预处理。

26、规则为单元 的预解析规则。 单元的预解析一般指在对单元进行解析之前, 对单元进行预检。 例如可以包 括按设定的规则检查单元是否符合解析的条件。 后续在对文本文件, 根据单元处理规则, 通 过单元处理类对单元进行解析之前, 还可以包括: 根据单元预处理规则, 通过单元处理类对 单元进行预解析。 0041 实施例中, 还可以根据节点的结构, 配置单元后处理规则; 单元后处理规则为单元 的后解析规则。 单元的后解析一般指在对单元进行解析之后, 对单元的解析结果再进行检 查。 例如可以包括按设定的规则检查单元的解析结果是否符合设定的条件。 后续在对文本 文件, 根据单元处理规则, 通过单元处理类对单元。

27、进行解析之后, 还可以包括: 根据单元后 处理规则, 通过单元处理类对单元进行后解析。 0042 实施例中, 配置节点处理类, 可以包括: 在节点处理类中配置节点相关信息; 其中, 节点相关信息包括节点中的列信息和/或分隔符等。 0043 对于结构相同的同一类别的多个文本文件, 还可以实现这些文本文件的并行解 析, 实现多名软件工程师并行开发。 即在上述实施例中: 0044 对文本文件, 根据节点处理规则, 通过节点处理类对节点进行解析, 可以包括: 对 属于同一类别的多个文本文件, 并行对节点进行解析; 0045 对文本文件, 根据单元处理规则, 通过单元处理类对单元进行解析, 可以包括: 。

28、对 属于同一类别的多个文本文件, 并行对单元进行解析; 0046 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果, 可以包 括: 对属于同一类别的多个文本文件, 并行构建文本文件的解析结果; 0047 其中, 所述同一类别的多个文本文件的结构相同。 0048 图2为本发明实施例中配置化的文件解析方法的一具体实例图, 如图2所示, 本例 中配置化的文件解析方法可以包括: 0049 步骤201、 在文本文件解析开始后, 根据文本文件的结构, 配置节点、 节点处理类、 节点处理规则、 节点预处理规则和节点后处理规则; 根据节点的结构, 配置单元、 单元处理 类、 单元处理规则、 。

29、单元预处理规则和单元后处理规则。 0050 步骤202、 根据节点预处理规则, 通过节点处理类对节点进行预解析; 若预解析结 果正常, 继续执行步骤203; 若预解析结果异常, 解析过程结束。 0051 步骤203、 根据节点处理规则, 通过节点处理类对节点进行解析; 若解析结果正常, 继续执行步骤204; 若解析结果异常, 解析过程结束。 0052 步骤204、 根据单元预处理规则, 通过单元处理类对单元进行预解析; 若预解析结 果正常, 继续执行步骤205; 若预解析结果异常, 解析过程结束。 0053 步骤205、 根据单元处理规则, 通过单元处理类对单元进行解析; 若解析结果正常, 继。

30、续执行步骤206; 若解析结果异常, 解析过程结束。 0054 步骤206、 根据单元后处理规则, 通过单元处理类对单元进行后解析; 若后解析结 果正常, 继续执行步骤207; 若后解析结果异常, 解析过程结束。 0055 步骤207、 根据节点后处理规则, 通过节点处理类对节点进行后解析; 若后解析结 果正常, 继续执行步骤208; 若后解析结果异常, 解析过程结束。 说明书 4/7 页 8 CN 112051998 A 8 0056 步骤208、 检查是否存在未解析节点, 若是, 返回步骤202处理下一未解析节点; 否 则执行步骤209; 0057 步骤209、 根据节点的解析结果, 以及。

31、单元的解析结果, 构建文本文件的解析结果, 解析过程结束。 0058 图3为本发明实施例中并行解析文本文件的一具体示例图, 如图3所示, 对于结构 相同的同一类别的多个文本文件(下载文件1N), 实现这些文本文件的并行解析, 其中包 括并行进行节点的解析; 并行进行单元的解析; 并行构建文本文件的解析结果。 需要说明的 是, 节点的预解析和后解析, 单元的预解析和后解析, 对于同一类别的多个结构相同的文本 文件, 均是可以并行执行的, 图3中未示出。 0059 本发明实施例中还提供了一种配置化的文件解析装置, 如下面的实施例所述。 由 于该装置解决问题的原理与配置化的文件解析方法相似, 因此该。

32、装置的实施可以参见配置 化的文件解析方法的实施, 重复之处不再赘述。 0060 图4为本发明实施例中配置化的文件解析装置的示意图, 如图4所示, 该装置可以 包括: 0061 节点配置模块401, 用于根据文本文件的结构, 配置节点、 节点处理类和节点处理 规则; 其中, 节点为文本文件每一行的抽象, 节点处理类为处理节点的类, 节点处理规则为 节点的解析规则; 0062 单元配置模块402, 用于根据节点的结构, 配置单元、 单元处理类和单元处理规则; 其中, 单元为文本文件中每一行按分隔符拆分后的列, 单元处理类为处理单元的类, 单元处 理规则为单元的解析规则; 0063 节点解析模块40。

33、3, 用于对文本文件, 根据节点处理规则, 通过节点处理类对节点 进行解析; 0064 单元解析模块404, 用于对文本文件, 根据单元处理规则, 通过单元处理类对单元 进行解析; 0065 结果构建模块405, 用于根据节点的解析结果, 以及单元的解析结果, 构建文本文 件的解析结果。 0066 一个实施例中, 节点可以包括起始节点、 汇总节点、 明细节点和结束节点; 其中, 起 始节点为文本文件起始行信息, 汇总节点为文本文件汇总行信息, 明细节点为文本文件明 细信息, 结束节点为文本文件结束行信息。 0067 一个实施例中, 节点配置模块401, 还可以用于: 根据文本文件的结构, 配置。

34、节点预 处理规则; 节点预处理规则为节点的预解析规则; 0068 如图5所示, 图4所示装置还可以包括: 0069 节点预解析模块501, 用于在节点解析模块403对节点进行解析之前, 根据节点预 处理规则, 通过节点处理类对节点进行预解析。 0070 一个实施例中, 节点配置模块401, 还可以用于: 根据文本文件的结构, 配置节点后 处理规则; 节点后处理规则为节点的后解析规则; 0071 如图5所示, 图4所示装置还可以包括: 0072 节点后解析模块502, 用于在单元解析模块404对单元进行解析之后, 根据节点后 处理规则, 通过节点处理类对节点进行后解析。 说明书 5/7 页 9 。

35、CN 112051998 A 9 0073 一个实施例中, 单元配置模块402, 还可以用于: 根据节点的结构, 配置单元预处理 规则; 单元预处理规则为单元的预解析规则; 0074 如图5所示, 图4所示装置还可以包括: 0075 单元预解析模块503, 用于在单元解析模块404对单元进行解析之前, 根据单元预 处理规则, 通过单元处理类对单元进行预解析。 0076 一个实施例中, 单元配置模块402, 还可以用于: 根据节点的结构, 配置单元后处理 规则; 单元后处理规则为单元的后解析规则; 0077 如图5所示, 图4所示装置还可以包括: 0078 单元后解析模块504, 用于在单元解析。

36、模块404对单元进行解析之后, 根据单元后 处理规则, 通过单元处理类对单元进行后解析。 0079 需要说明的是, 节点预解析模块501、 节点后解析模块502、 单元预解析模块503、 单 元后解析模块504其中之一或任意组合均可设置于图4所示装置中。 图5仅示出了四者均设 置于图4所示装置的一种示例。 0080 一个实施例中, 节点配置模块401, 具体可以用于: 0081 在节点处理类中配置节点相关信息; 其中, 节点相关信息包括节点中的列信息和/ 或分隔符。 0082 一个实施例中, 节点解析模块403, 具体可以用于: 对属于同一类别的多个文本文 件, 并行对节点进行解析; 0083。

37、 单元解析模块404, 具体可以用于: 对属于同一类别的多个文本文件, 并行对单元 进行解析; 0084 结果构建模块405, 具体可以用于: 对属于同一类别的多个文本文件, 并行构建文 本文件的解析结果; 0085 其中, 所述同一类别的多个文本文件的结构相同。 0086 本发明实施例还提供一种计算机设备, 图6为本发明实施例中计算机设备的示意 图, 该计算机设备能够实现上述实施例中的配置化的文件解析方法中全部步骤, 所述计算 机设备具体包括如下内容: 0087 处理器(processor)601、 存储器(memory)602、 通信接口(Communications Interface)。

38、603和通信总线604; 0088 其中, 所述处理器601、 存储器602、 通信接口603通过所述通信总线604完成相互间 的通信; 所述通信接口603用于实现相关设备之间的信息传输; 0089 所述处理器601用于调用所述存储器602中的计算机程序, 所述处理器执行所述计 算机程序时实现上述实施例中的配置化的文件解析方法中的全部步骤。 0090 本发明实施例还提供一种计算机可读存储介质, 所述计算机可读存储介质存储有 执行上述配置化的文件解析方法的计算机程序。 0091 综上所述, 本发明实施例中, 根据文本文件的结构, 配置节点、 节点处理类和节点 处理规则; 根据节点的结构, 配置单。

39、元、 单元处理类和单元处理规则; 对文本文件, 根据节点 处理规则, 通过节点处理类对节点进行解析, 根据单元处理规则, 通过单元处理类对单元进 行解析; 根据节点的解析结果, 以及单元的解析结果, 构建文本文件的解析结果, 与现有技 术中使用面向过程的处理方法针对每一文件开发一套文件解析程序的技术方案相比, 通过 说明书 6/7 页 10 CN 112051998 A 10 配置化的方式实现文件解析, 只要文件结构没有变化, 就无需修改配置, 可以提高代码的复 用性、 可读性和扩展性, 并易于维护。 0092 本领域内的技术人员应明白, 本发明的实施例可提供为方法、 系统、 或计算机程序 产。

40、品。 因此, 本发明可采用完全硬件实施例、 完全软件实施例、 或结合软件和硬件方面的实 施例的形式。 而且, 本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器、 CD-ROM、 光学存储器等)上实施的计算机程序产 品的形式。 0093 本发明是参照根据本发明实施例的方法、 设备(系统)、 和计算机程序产品的流程 图和/或方框图来描述的。 应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、 以及流程图和/或方框图中的流程和/或方框的结合。 可提供这些计算机程序 指令到通用计算机、 专用计算机、 嵌入式处理机或其他可编程数据处。

41、理设备的处理器以产 生一个机器, 使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。 0094 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中, 使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品, 该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。 0095 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上, 使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理, 。

42、从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。 0096 以上所述的具体实施例, 对本发明的目的、 技术方案和有益效果进行了进一步详 细说明, 所应理解的是, 以上所述仅为本发明的具体实施例而已, 并不用于限定本发明的保 护范围, 凡在本发明的精神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包含在本 发明的保护范围之内。 说明书 7/7 页 11 CN 112051998 A 11 图1 说明书附图 1/5 页 12 CN 112051998 A 12 图2 说明书附图 2/5 页 13 CN 112051998 A 13 图3 图4 说明书附图 3/5 页 14 CN 112051998 A 14 图5 说明书附图 4/5 页 15 CN 112051998 A 15 图6 说明书附图 5/5 页 16 CN 112051998 A 16 。

展开阅读全文
内容关键字: 配置 文件 解析 方法 装置
关于本文
本文标题:配置化的文件解析方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10200384.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1