LZSS压缩数据误码检测方法及装置.pdf

上传人:南*** 文档编号:11008221 上传时间:2021-08-30 格式:PDF 页数:17 大小:1.13MB
收藏 版权申诉 举报 下载
LZSS压缩数据误码检测方法及装置.pdf_第1页
第1页 / 共17页
LZSS压缩数据误码检测方法及装置.pdf_第2页
第2页 / 共17页
LZSS压缩数据误码检测方法及装置.pdf_第3页
第3页 / 共17页
文档描述:

《LZSS压缩数据误码检测方法及装置.pdf》由会员分享,可在线阅读,更多相关《LZSS压缩数据误码检测方法及装置.pdf(17页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911203029.9 (22)申请日 2019.11.29 (71)申请人 中国人民解放军战略支援部队信息 工程大学 地址 450000 河南省郑州市高新区科学大 道62号 (72)发明人 王刚靳彦青彭华周玉梅 许漫坤李天昀汪然刘倩 张光伟丰一伟 (74)专利代理机构 郑州大通专利商标代理有限 公司 41111 代理人 周艳巧 (51)Int.Cl. H03M 7/30(2006.01) (54)发明名称 LZSS压缩数据误码检测方法及装置 (57)摘要 本发明属于数据压。

2、缩存储技术领域, 特别涉 及一种LZSS压缩数据误码检测方法及装置, 针对 待检测的LZSS压缩数据, 获取压缩数据单元结 构, 无损数据压缩过程中前视窗口和搜索窗口两 者长度, 及码字(d,l)中d和l的二进制编码长度, d为搜索窗口中匹配字符串的起始位置到搜索窗 口结束位置的距离, l为搜索到的最长匹配字符 串的长度; 依据前视窗口、 搜索窗口、 码字中二进 制编码及压缩数据单元结构, 对压缩数据错误编 码进行检测。 本发明直接从压缩数据中获取的单 元结构及窗口码字长度, 不添加任何的附加位完 成误码检测, 解决传统编码数据检错方法需要插 入额外比特、 降低压缩效率等问题, 提高误码检 测。

3、效率和检错性能, 对数据压缩误码检测技术具 有重要的指导意义。 权利要求书2页 说明书11页 附图3页 CN 110868222 A 2020.03.06 CN 110868222 A 1.一种LZSS压缩数据误码检测方法, 用于对LZSS压缩数据进行误码检测, 其特征在于, 包含: 针对待检测的LZSS压缩数据, 获取压缩数据单元结构, 无损数据压缩过程中前视窗口 和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为搜索窗口中匹配字符串 的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字符串的长度; 依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元结构,。

4、 对压缩数据错误编 码进行检测。 2.根据权利要求1所述的LZSS压缩数据误码检测方法, 其特征在于, 无损数据压缩过程 中, 依据最小匹配长度确定编码结果的码字类型, 使用1比特标志位对码字类型进行指示。 3.根据权利要求1或2所述的LZSS压缩数据误码检测方法, 其特征在于, 无损数据压缩 过程中, 通过寻找存储在前视窗口和搜索窗口中的最长匹配字符串, 如果最长匹配字符串 的长度不小于最小匹配长度L, 则输出类型为码字(d,l), 前视窗口和搜索窗口分别向后滑 动l个字符; 如果最长匹配字符串的长度小于L, 则输出类型为存储在前视窗口中的第一个 字符c, 前视窗口和搜索窗口分别向后滑动1个。

5、字符; 重复执行, 直到前视窗口变为空为止。 4.根据权利要求1或2所述的LZSS压缩数据误码检测方法, 其特征在于, 压缩数据被分 割若干单元结构, 每个单元结构包含标志子单元和存放编码数据子单元, 其中, 标志子单元 中的每个比特位用于指示存放编码数据子单元存放编码数据的码字类型。 5.根据权利要求4所述的LZSS压缩数据误码检测方法, 其特征在于, 对压缩数据错误编 码进行检测中, 依次依据前视窗口和搜索窗口长度是否满足比特被充分利用的条件, 单元 结构中标志子单元获取的数据单元长度与存放编码数据子单元获取的数据单元长度是否 一致, 及 搜索窗口、 前视窗口是否均不小于码字中d和l的二进。

6、制编码长度的大小关系, 若均满 足, 则判定压缩数据无错误, 结束检测, 若依次执行中有其中一项不满足, 则直接判定压缩 数据有错并结束检测。 6.根据权利要求5所述的LZSS压缩数据误码检测方法, 其特征在于, 比特被充分利用的 条件表示为: 2M-1Q2M,2N-1W2N, 其中, M、 N分别表示码字(d,l)中d、 l的二进制编码长度, W、 Q分别表示前视窗口、 搜索窗口长度。 7.根据权利要求5所述的LZSS压缩数据误码检测方法, 其特征在于, 单元结构中, 设定 标 志 子 单 元 长 度 为 8比 特 , 则 获 取 的 数 据 单 元 长 度 一 致 性 判 定 条 件 表 。

7、示 为 : 其中, Fi表示标志子单元中的第i个标志位的取值, Li表示Fi对应的第i个 存放编码数据子单元的长度。 8.根据权利要求5所述的LZSS压缩数据误码检测方法, 其特征在于, 搜索窗口、 前视窗 口及码字中二进制编码长度大小关系判定中, 依次判定是否满足: lW、 dQ及ld 若均满足, 则判定压缩数据无错误, 结束检测, 若依次执行中有其中一项不满足, 则直 接判定压缩数据有错并结束检测, 其中, W、 Q分别表示前视窗口、 搜索窗口长度。 9.一种LZSS压缩数据误码检测装置, 用于对LZSS压缩数据进行误码检测, 其特征在于, 权利要求书 1/2 页 2 CN 1108682。

8、22 A 2 包含: 数据获取模块和编码检测模块, 其中, 数据获取模块, 用于针对待检测的LZSS压缩数据, 获取压缩数据单元结构, 无损数据压 缩过程中前视窗口和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为搜索 窗口中匹配字符串的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字符串 的长度; 编码检测模块, 用于依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元结 构, 对压缩数据错误编码进行检测。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求18任一项所述的LZSS压缩数据误码。

9、检测方法。 权利要求书 2/2 页 3 CN 110868222 A 3 LZSS压缩数据误码检测方法及装置 技术领域 0001 本发明属于数据压缩存储技术领域, 特别涉及一种LZSS压缩数据误码检测方法及 装置。 背景技术 0002 对于任何形式的通信来说, 只有当信息的发送方和接受方都能够理解编码机制的 时候压缩数据通信才能够工作。 在压缩过程中, 在不丢失有用信息的前提下, 缩减数据量以 减少存储空间, 提高其传输、 存储和处理效率, 或按照一定的算法对数据进行重新组织, 减 少数据的冗余和存储的空间的一种技术方法。 数据压缩包括有损压缩和无损压缩。 典型的 无损压缩算法LZSS压缩文件。

10、在错误检测与纠正过程中, 可通过对标志位和匹配长度作为错 误敏感部分采用一元编码并插入同步序列, 移至压缩编码开头的位置; 还有采用不等错误 保护方案, 通过使用RS编码来进行错误检测, 但是插入了额外比特来检错, 降低了压缩率, 改变了LZSS标准算法; 或根据LZSS压缩准则进行错误检测, 不需要插入额外比特, 提高压缩 比, 但有三个缺点: 一是只使用了LZSS编码规则进行检测, 错误检测率低, 二是没有提出可 行的纠正损坏文件错误比特的方案, 三是采用的检测方法基于一种修改过的LZSS压缩算 法, 不适用标准算法, 不具有通用性, 无法适用于其他类型的压缩文件; 基于LZW的容错解压 。

11、算法中, 采用0阶马尔可夫模型作为语法模型检测压缩数据, 通过源文件和压缩文件两种先 验信息, 但0阶马尔可夫模型对英文字母的错误检测以及纠正来说不够精确, 其容错解压结 果的性能无法达到一般要求。 发明内容 0003 为此, 本发明提供一种LZSS压缩数据误码检测方法及方法, 不需要添加任何的附 加位实现压缩数据中误码的检测, 完全不会影响压缩性能, 提高压缩数据检测的处理效率 和准确度, 降低存储设备的能耗。 0004 按照本发明所提供的设计方案, 提供一种LZSS压缩数据误码检测方法, 用于对 LZSS压缩数据进行误码检测, 包含: 0005 针对待检测的LZSS压缩数据, 获取压缩数据。

12、单元结构, 无损数据压缩过程中前视 窗口和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为搜索窗口中匹配字 符串的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字符串的长度; 0006 依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元结构, 对压缩数据错 误编码进行检测。 0007 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 无损数据压缩过程中, 依据 最小匹配长度确定编码结果的码字类型, 使用1比特标志位对码字类型进行指示。 0008 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 无损数据压缩过程中, 通过 寻找存储在前视窗口和搜。

13、索窗口中的最长匹配字符串, 如果最长匹配字符串的长度不小于 最小匹配长度L, 则输出类型为码字(d,l), 前视窗口和搜索窗口分别向后滑动l个字符; 如 说明书 1/11 页 4 CN 110868222 A 4 果最长匹配字符串的长度小于L, 则输出类型为存储在前视窗口中的第一个字符c, 前视窗 口和搜索窗口分别向后滑动1个字符; 重复执行, 直到前视窗口变为空为止。 0009 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 压缩数据被分割若干单元 结构, 每个单元结构包含标志子单元和存放编码数据子单元, 其中, 标志子单元中的每个比 特位用于指示存放编码数据子单元存放编码数据的码字。

14、类型。 0010 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 对压缩数据错误编码进行 检测中, 依次依据前视窗口和搜索窗口长度是否满足比特被充分利用的条件, 单元结构中 标志子单元获取的数据单元长度与存放编码数据子单元获取的数据单元长度是否一致, 及 搜索窗口、 前视窗口是否均不小于码字中d和l的二进制编码长度的大小关系, 若均满足, 则 判定压缩数据无错误, 结束检测, 若依次执行中有其中一项不满足, 则直接判定压缩数据有 错并结束检测。 0011 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 比特被充分利用的条件表 示为: 2M-1Q2M,2N-1W2N, 其中, M。

15、、 N分别表示码字(d,l)中d、 l的二进制编码长度, W、 Q分 别表示前视窗口、 搜索窗口长度。 0012 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 单元结构中, 设定标志子单 元长度为8比特, 则获取的数据单元长度一致性判定条件表示为:其中, Fi (1i8)表示标志子单元中的第i个标志位的取值, Li(1i8)表示Fi对应的第i个存放 编码数据子单元的长度。 0013 作为本发明的LZSS压缩数据误码检测方法, 进一步地, 搜索窗口、 前视窗口及码字 中二进制编码长度大小关系判定中, 依次判定是否满足: 0014 lW、 dQ及ld 0015 若均满足, 则判定压缩数据。

16、无错误, 结束检测, 若依次执行中有其中一项不满足, 则直接判定压缩数据有错并结束检测, 其中, W、 Q分别表示前视窗口、 搜索窗口长度 0016 进一步地, 本发明还提供一种基于LZSS压缩数据误码检测装置, 用于对LZSS压缩 数据进行误码检测, 包含: 数据获取模块和编码检测模块, 其中, 0017 数据获取模块, 用于针对待检测的LZSS压缩数据, 获取压缩数据单元结构, 无损数 据压缩过程中前视窗口和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为 搜索窗口中匹配字符串的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字 符串的长度; 0018 编码检测。

17、模块, 用于依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元 结构, 对压缩数据错误编码进行检测。 0019 进一步地, 本发明还提供一种计算机可读存储介质, 其上存储有计算机程序, 其特 征在于, 所述计算机程序被处理器执行时实现上述的LZSS压缩数据误码检测方法。 0020 本发明的有益效果: 0021 本发明利用直接从压缩数据中获取的单元结构及窗口码字长度, 不添加任何的附 加位来检测压缩数据中的误码, 完全不会影响压缩性能, 解决传统编码数据检错方法需要 插入额外比特、 降低压缩效率等的问题, 进一步提高误码检测效率和检错性能, 对数据压缩 误码检测技术具有重要的指导意义。 。

18、说明书 2/11 页 5 CN 110868222 A 5 附图说明: 0022 图1为本发明实施例中误码检测方法流程示意图; 0023 图2为本发明实施例中比特分配示意图; 0024 图3为本发明实施例中LZSS压缩数据的单元结构示意图; 0025 图4为本发明实施例中编码结果示意; 0026 图5为本发明实施例中编码检测算法示意图; 0027 图6为本发明实施例中误码检测装置示意图; 0028 图7为本发明实施例压缩性能验证中不同编码方式下压缩率大小折线图; 0029 图8为本发明实施例检错性能验证中错误检出率与比特数关系示意图; 0030 图9为本发明实施例运行时间分析中方案对比折线图。。

19、 具体实施方式: 0031 为使本发明的目的、 技术方案和优点更加清楚、 明白, 下面结合附图和技术方案对 本发明作进一步详细的说明。 0032 LZ77通过输出实际字符解决了在窗口中没有找到匹配字符串的问题, 但是这种压 缩算法仍然有冗余存在, 它的压缩率也可以进一步地提高。 LZ77的冗余主要体现在两个方 面, 一是空指针的情况, 另一个是编码器可能输出额外的字符, 由于LZ77算法匹配到字符串 后输出匹配后前向缓冲区中的第一个字符, 该字符可能包含在下一个匹配串中。 LZSS有效 解决了这个问题, 降低了这种冗余, 如果匹配串的长度比最小匹配长度长, 就输出指针, 否 则输出真实的字符。。

20、 针对现有压缩编码错误检测中存在的问题, 本发明实施例中, 提供一种 LZSS压缩数据误码检测方法, 用于对LZSS压缩数据进行误码检测, 参见图1所示, 包含: 0033 S101、 针对待检测的LZSS压缩数据, 获取压缩数据单元结构, 无损数据压缩过程中 前视窗口和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为搜索窗口中匹 配字符串的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字符串的长度; 0034 S102、 依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元结构, 对压缩 数据错误编码进行检测。 0035 为了不降低压缩性能和编码效率, 通。

21、过直接从压缩数据中获取的单元结构及窗口 码字长度, 不添加任何的附加位来检测压缩数据中的误码, 在不影响压缩性能的前提下完 成编码误码检测。 0036 LZSS无损数据压缩中输出的数据流包含指针和真实字符, 需要额外的标志位进行 区分, 即flag位。 当在前向缓冲区和搜索窗中找到匹配串, 标志位flag置0, 输出匹配串第一 位字符在前向缓冲区和搜索窗中的距离d以及匹配串的长度m; 当没有找到匹配串时, 标志 位置1, 输出真实字符。 为将LZSS实用化, 定义其标准算法的参数, 搜索窗的大小为4078字 节, 前向缓冲区的大小为18字节, 最小匹配长度为3。 标志位为1bit, 输出指针和。

22、匹配长度为 2个字节计16bits, 其对应比特如图2所示, 其中, 以第二个字节的低四位表示匹配长度, 由 于当匹配长度大于等于3时, 才会输出匹配长度这一参数, 因此输出m-3, m的范围由015改 变为318, 匹配长度的范围扩大。 编码时以8个标志位为一组, 构成一个字节, 后跟8个单 元, 标志位flag0, 对应单元的数据为(di,mi),iZ+占2个字节; 标志位flag1, 对应单元 数据为真实字符, 占1个字节或2个字节。 说明书 3/11 页 6 CN 110868222 A 6 0037 在LZSS压缩算法中使用了两个滑动窗口, 分别是前视窗口和搜索窗口。 当进行压 缩时。

23、, LZSS算法会寻找存储在前视窗口和搜索窗口中的最长匹配字符串。 如果最长匹配字 符串的长度不小于规定的最小匹配长度L, 则算法输出码字(d,l), 前视窗口和搜索窗口分 别向后滑动l个字符, 其中d为搜索窗口中匹配字符串的起始位置到搜索窗口结束位置的距 离, l为搜索到的最长匹配字符串的长度。 如果最长匹配字符串的长度小于L, 则算法输出存 储在前视窗口中的第一个字符c, 前视窗口和搜索窗口分别向后滑动1个字符。 上述压缩过 程会重复执行, 直到前视窗口变为空为止。 由于LZSS算法依据最小匹配长度确定编码结果 的类型是(d,l)还是c, 因此需要使用1比特标志位指示对应的码字代表(d,l。

24、)还是c。 0038 LZSS算法把编码数据分成若干单元结构, 每个单元结构由9个子单元构成, 第1子 单元为1个字节的标志子单元F, 其余8个子单元存放编码数据, 标志子单元的8位比特依次 分别指示随后8个子单元存放的是(d,l)还是c。 当标志比特为0, 相应子单元为码字(d,l), 当标志比特为1, 相应子单元为单字符c。 LZSS压缩数据按照图3所示的单元结构进行存储和 传输, 根据编码规则和数据格式可知, 单元结构的长度是不固定的。 当输入数据流为 “abcacbabcaccac” 时, 前视窗口和搜索窗口的大小分别设置为9和12, 最小匹配长度设为3, 使用LZSS算法进行无损数据。

25、压缩, 图4给出了编码结果, 其对应的十六进制数据为 “FC 61 62 63 61 63 62 36 35 33 33” 。 0039 进一步, 采用LZSS算法压缩编码的过程可表示为如下内容: 0040搜索窗口 0041原始数据区域 0042 0043 0044 第一步: 在搜索窗口中未找到匹配的字符串, 输出字符 “A” 对应ASCII码0X65H, flag1。 0045 0046 0047 第二步: 未找到匹配的字符串, 输出字符 “B” , 0X66H, flag1。 0048 说明书 4/11 页 7 CN 110868222 A 7 0049 0050 第三步: 在搜索窗口中找。

26、到匹配的字符串 “AB” , 但匹配长度小于3, 不符合要求, 输 出字符 “A” , flag1。 0051 0052 0053 第四步: 未找到匹配的字符串, 输出字符 “B” , flag1。 0054 0055 0056 第五步: 未找到匹配的字符串, 输出字符 “C” , flag1。 0057 0058 0059 第六步: 在搜索窗口中找到匹配的字符串 “BAB” , 距离为4, 匹配长度等于3, 输出 (d1,m1)0X0400H, flag0。 0060 0061 0062 第七步: 在搜索窗口中找到匹配的字符串 “ABC” , 距离为6, 匹配长度等于3, 输出 (d1,m1。

27、)0X0600H, flag0。 0063 0064 说明书 5/11 页 8 CN 110868222 A 8 0065 第八步: 同前面过程, 在搜索窗口中未找到匹配的字符串, 输出字符 “A”“D” 对应 ASCII码, flag1。 0066 进一步地, 本发明实施例中, 对压缩数据错误编码进行检测中, 依次依据前视窗口 和搜索窗口长度是否满足比特被充分利用的条件, 单元结构中标志子单元获取的数据单元 长度与存放编码数据子单元获取的数据单元长度是否一致, 及搜索窗口、 前视窗口是否均 不小于码字中d和l的二进制编码长度的大小关系, 若均满足, 则判定压缩数据无错误, 结束 检测, 若依。

28、次执行中有其中一项不满足, 则直接判定压缩数据有错并结束检测。 0067 在LZSS压缩算法中, 可分别用M比特和N比特表示码字(d,l)中d和l的二进制编码 的长度, 则(d,l)的总长度为(M+N)比特, 采用美国信息交换标准码(American Standard Code for Information Interchange:ASCII)的c用8比特表示。 根据LZSS的压缩机制, 以及 通过分析LZSS压缩数据的结构可以发现, LZSS压缩数据中的码字存在5种关系模式, 即需要 满足5个条件: 0068 设前视窗口和搜索窗口的长度分别为W和Q, 为了充分利用每个比特, M、 N与W、。

29、 Q 之间需要满足下式给定的条件: 0069 2M-1Q2M,2N-1W2N (1) 0070 在LZSS压缩数据的单元结构中, 通过标志子单元F的8位比特计算得到的数据单 元长度, 需要与其余8个子单元的总长度一致, 这种情况可表示为: 0071 0072 其中, Fi(1i8)表示标志子单元中的第i个标志位的取值, Li(1i8)表示Fi 对应的第i个压缩数据子单元的长度。 0073 匹配字符的数量l的上限是前视窗口的起始位置与结束位置之间的距离, 即前 视窗口的长度。 所以, l应当不大于前视窗口W的大小, 如下式所示: 0074 lW (3) 0075 匹配字符的距离d的上限是搜索窗口。

30、的起始位置与结束位置之间的距离, 即搜 索窗口的长度。 所以, d应当不大于搜索窗口Q的大小, 如下式所示: 0076 dQ (4) 0077 为了实现有效压缩, 压缩过程中前视窗口的长度必定小于搜索窗口的长度, 因 此l应当不大于d, 这种情况可表示为: 0078 ld (5) 0079 如果没有出现错误, 则LZSS压缩数据必定满足式(1)-式(5)所示的5种关系模式。 5 种关系中只要有1个未满足, 则LZSS压缩数据中一定存在错误。 因此, 这5个表达式可作为发 现误码的条件, 用于检测LZSS压缩数据中是否存在错误。 图5显示了本发明实施例中所提出 的错误检测算法的流程图, LZSS。

31、算法把压缩数据分成若干单元结构, 每个单元结构由标志 子单元和数据子单元组成, 进一步地, 实施例中, 首先判断前视窗口的长度和搜索窗口的长 度是否满足式(1), 然后从LZSS压缩数据中获取标志子单元和数据子单元的相关信息, 检测 标志子单元所指示的数据单元长度与数据子单元的总长度是否满足式(2), 若不满足则确 定数据中有误码, 若满足则依次获取表示二进制编码码字C(d,l)的(M+N)个比特, M比特 是d的二进制编码, N比特是l的二进制编码。 然后检查d和l是否满足式(3)-式(5)规定的关 说明书 6/11 页 9 CN 110868222 A 9 系模式。 重复执行这些过程, 直。

32、到所有单元结构中的压缩数据全部处理完毕。 在错误检测期 间, 5种关系模式中只要有1种不满足, 则确定LZSS压缩数据中存在误码。 0080 基于上述的方法, 本发明实施例还提供一种LZSS压缩数据误码检测装置, 用于对 LZSS压缩数据进行误码检测, 参见图6所示, 包含: 数据获取模块和编码检测模块, 其中, 0081 数据获取模块, 用于针对待检测的LZSS压缩数据, 获取压缩数据单元结构, 无损数 据压缩过程中前视窗口和搜索窗口两者长度, 及码字(d,l)中d和l的二进制编码长度, d为 搜索窗口中匹配字符串的起始位置到搜索窗口结束位置的距离, l为搜索到的最长匹配字 符串的长度; 0。

33、082 编码检测模块, 用于依据前视窗口、 搜索窗口、 码字中二进制编码及压缩数据单元 结构, 对压缩数据错误编码进行检测。 0083 为验证本发明技术方案的有效性, 下面通过具体实验数据做进一步解释说明: 0084 设置相同条件下, LZSS压缩文件分别采用本发明实施例中提出的检错方法和重复 码、 偶校验、 汉明码的方法进行比较。 LZSS采用标准算法参数, 最小长度选择最优值3, 重复 码重复次数为2, 偶校验码为每4bits添加一位偶校验位。 汉明码采用(7,4)汉明码。 表7-4和 表7-5分别列出了Calgary语料库、 Canterbury语料库四种校验码的压缩率。 压缩率为压缩 。

34、后文件大小比未压缩文件大小。 0085 表7-4Calgary语料库压缩率分析 0086 0087 表7-5Canterbury语料库压缩率分析 说明书 7/11 页 10 CN 110868222 A 10 0088 0089 图7表示了Calgary语料库和Canterbury语料库中各文件LZSS编码与重复码、 偶校 验码三种编码方式下文件压缩率大小关系的折线图, 其中纵坐标表示压缩率, 横坐标依次 表示语料库中的文件, 四条折线表示了四种不同的编码方式。 0090 根据两个语料库的实验结果, 均可以说明, 在利用压缩编码规则得到的检错条件 是压缩效果最好的, 无论是重复码, 还是偶校验。

35、码、 汉明码, 都不可避免的增加了额外比特, 使得本身就不高的压缩比再次降低。 0091 为了评估每个LZSS压缩编码检错和重复码、 偶校验码、 汉明码三种方案的检错性 能, 定义错误检测率为RateNd/Nt*100。 Nd是所有正确检测到的损坏数据的数量, Nt是损 坏数据的总数。 图8中, (a)和(b)表示了在最小匹配长度为3的条件下, 以Calgary语料库和 Canterbury语料库中的文件为样本进行实验得到的错误检测率与错误比特数的关系。 图 中, 省略了每个语料库r2的重复码、 n4的偶校验位以及k4的汉明码传统校验方案的 实验结果。 所有语料库的传统校验方案错误检测率均为1。

36、00。 在r2的重复码中, 如果一 个比特及其相应的重复位都发生错误, 则错误检测失败。 但是, 这两位很少同时出错, 因为 错误不是顺序发生的, 而是在仿真中随机且独立地发生的。 在n4的偶校验位中, 当由于错 误导致出现偶数个错误比特时, 该方案不能检测是否出错。 在实验中发现每五个比特执行 的偶校验几乎总是检测到错误比特, 这是因为在五个比特中很少同时出现偶数个错误比 特。 另外, 使用k4,3个校验位的汉明码也几乎总是检测到比特流中是否存在错误。 当错误 比特数小于等于6时, 本发明实施例中所提出的方案落后于传统方案。 当错误比特数较小, 可能误码后的数据仍然符合三个条件, 则无法发现。

37、错误。 当错误比特数大于等于7时, 所提 出的错误检测模型几乎总能检测到比特流中的错误。 但是, 传统校验方案都需要利用额外 比特, 本发明实施例中的检测方案不需要额外比特, 当错误比特数大于等于7时, 该方案的 性能优于传统校验方案。 0092 为了评估本发明实施例中所提的检测方法与重复码、 偶校验码、 汉明码的运行时 间性能, 分别统计用四种方案进行校验所需的时间, 统计时间从读取压缩文件开始, 到检错 完成结束, 时间单位为秒。 为保证数据的准确性, 降低偶然性因素的影响, 将记录100次实验 的运行时间并取均值, 以下表格7-7和7-8中的数据均为取均值的结果。 0093 表7-7 C。

38、algary语料库实验结果 说明书 8/11 页 11 CN 110868222 A 11 0094 0095 表7-8Canterbury语料库实验结果 0096 0097 折线图参见图9中, (a)所示Calgary语料库实验结果, (b)所示Canterbury语料库 实验结果。 根据实验结果, 可以得出运用本发明实施例中所提的错误检测方案运行时间最 短。 根据编码规则分析得到的三个条件进行检错, 相比较重复两次的重复码、 每4比特添加 一位校验位的偶校验码和(7,4)汉明码, 具有最短的运行时间, 算法性能明显由于传统的校 验方案。 0098 通过以上实验数据, 可进一步验证本发明实施。

39、例中技术方案相比较于传统的检错 方法, 如重复码, 汉明码等, 最大的优势是不添加额外比特, 不会降低压缩率, 在解决传统检 错方法面临的插入额外比特、 降低压缩效率等的问题时, 并进一步提高检错性能。 0099 除非另外具体说明, 否则在这些实施例中阐述的部件和步骤的相对步骤、 数字表 达式和数值并不限制本发明的范围。 0100 基于上述的方法, 本发明实施例还提供一种服务器, 包括: 一个或多个处理器; 存 储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实现上述的方法。 说明书 9/11 页 12 CN 110868222 A。

40、 12 0101 基于上述的方法, 本发明实施例还提供一种计算机可读介质, 其上存储有计算机 程序, 其中, 该程序被处理器执行时实现上述的方法。 0102 本发明实施例所提供的系统/装置, 其实现原理及产生的技术效果和前述方法实 施例相同, 为简要描述, 系统/装置实施例部分未提及之处, 可参考前述方法实施例中相应 内容。 0103 所属领域的技术人员可以清楚地了解到, 为描述的方便和简洁, 上述描述的系统/ 装置的具体工作过程, 可以参考前述方法实施例中的对应过程, 在此不再赘述。 0104 在这里示出和描述的所有示例中, 任何具体值应被解释为仅仅是示例性的, 而不 是作为限制, 因此, 。

41、示例性实施例的其他示例可以具有不同的值。 0105 应注意到: 相似的标号和字母在下面的附图中表示类似项, 因此, 一旦某一项在一 个附图中被定义, 则在随后的附图中不需要对其进行进一步定义和解释。 0106 附图中的流程图和框图显示了根据本发明的多个实施例的系统、 方法和计算机程 序产品的可能实现的体系架构、 功能和操作。 在这点上, 流程图或框图中的每个方框可以代 表一个模块、 程序段或代码的一部分, 所述模块、 程序段或代码的一部分包含一个或多个用 于实现规定的逻辑功能的可执行指令。 也应当注意, 在有些作为替换的实现中, 方框中所标 注的功能也可以以不同于附图中所标注的顺序发生。 例如。

42、, 两个连续的方框实际上可以基 本并行地执行, 它们有时也可以按相反的顺序执行, 这依所涉及的功能而定。 也要注意的 是, 框图和/或流程图中的每个方框、 以及框图和/或流程图中的方框的组合, 可以用执行规 定的功能或动作的专用的基于硬件的系统来实现, 或者可以用专用硬件与计算机指令的组 合来实现。 0107 在本申请所提供的几个实施例中, 应该理解到, 所揭露的系统、 装置和方法, 可以 通过其它的方式实现。 以上所描述的装置实施例仅仅是示意性的, 例如, 所述单元的划分, 仅仅为一种逻辑功能划分, 实际实现时可以有另外的划分方式, 又例如, 多个单元或组件可 以结合或者可以集成到另一个系统。

43、, 或一些特征可以忽略, 或不执行。 另一点, 所显示或讨 论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口, 装置或单元的间接 耦合或通信连接, 可以是电性, 机械或其它的形式。 0108 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显 示的部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个 网络单元上。 可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。 0109 另外, 在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以 是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元。

44、中。 0110 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时, 可以 存储在一个处理器可执行的非易失的计算机可读取存储介质中。 基于这样的理解, 本发明 的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件 产品的形式体现出来, 该计算机软件产品存储在一个存储介质中, 包括若干指令用以使得 一台计算机设备(可以是个人计算机, 服务器, 或者网络设备等)执行本发明各个实施例所 述方法的全部或部分步骤。 而前述的存储介质包括: U盘、 移动硬盘、 只读存储器(ROM, Read- Only Memory)、 随机存取存储器(RAM, Random Acc。

45、ess Memory)、 磁碟或者光盘等各种可以 说明书 10/11 页 13 CN 110868222 A 13 存储程序代码的介质。 0111 最后应说明的是: 以上所述实施例, 仅为本发明的具体实施方式, 用以说明本发明 的技术方案, 而非对其限制, 本发明的保护范围并不局限于此, 尽管参照前述实施例对本发 明进行了详细的说明, 本领域的普通技术人员应当理解: 任何熟悉本技术领域的技术人员 在本发明揭露的技术范围内, 其依然可以对前述实施例所记载的技术方案进行修改或可轻 易想到变化, 或者对其中部分技术特征进行等同替换; 而这些修改、 变化或者替换, 并不使 相应技术方案的本质脱离本发明实施例技术方案的精神和范围, 都应涵盖在本发明的保护 范围之内。 因此, 本发明的保护范围应所述以权利要求的保护范围为准。 说明书 11/11 页 14 CN 110868222 A 14 图1 图2 图3 图4 说明书附图 1/3 页 15 CN 110868222 A 15 图5 图6 说明书附图 2/3 页 16 CN 110868222 A 16 图7 图8 图9 说明书附图 3/3 页 17 CN 110868222 A 17 。

展开阅读全文
内容关键字: LZSS 压缩 数据 检测 方法 装置
关于本文
本文标题:LZSS压缩数据误码检测方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11008221.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1