书签分享收藏举报版权申诉 / 8

立即下载加入VIP,免费下载

当前位置：首页 > 电学 > 基本电子电路 > 输电线路故障行波数据压缩方法.pdf

输电线路故障行波数据压缩方法.pdf

上传人：t****

文档编号：4322720

上传时间：2018-09-13

格式：PDF

页数：8

大小：398.35KB

《输电线路故障行波数据压缩方法.pdf》由会员分享，可在线阅读，更多相关《输电线路故障行波数据压缩方法.pdf（8页完整版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102571101 A (43)申请公布日 2012.07.11 C N 1 0 2 5 7 1 1 0 1 A *CN102571101A* (21)申请号 201110415946.0 (22)申请日 2011.12.12 H03M 7/30(2006.01) (71)申请人海南电力技术研究院地址 570125 海南省海口市龙华区滨海大道 123-8号信恒大厦十三层申请人武汉三相电力科技有限公司 (72)发明人黄松邢铀孔武陈钦柱姚冬王思捷全业生余阳钱冠军张国清 (54) 发明名称输电线路故障行波数据压缩方法 (57) 摘要本发明提供一种输。

2、电线路故障行波数据压缩方法。所述方法包括：获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式；根据差分序列的特性分成8类符号串，得到它们的概率值即冗余数据量；对数据使用前缀码的方式按类进行变长编码把符号串的特征信息表现在编码的最前面，尽可能避免保存冗余信息；获得压缩比的计算公式。本发明提供的对连续曲线的数据利用差分和前缀码方式进行变长压缩的方法可实现对用16进制表示的大型数据文本的无损压缩，提高压缩效率，节省大量的存储资源，而且算法简单易于实现。 (51)Int.Cl. 权利要求书1页说明书4页附图2页 (19)中华人民共和国国家知识产权局 (12)发明。

3、专利申请权利要求书 1 页说明书 4 页附图 2 页 1/1页 2 1.一种输电线路故障行波数据压缩方法，其特征在于，包括以下步骤：步骤S-1，获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式；步骤S-2，根据差分序列的特性分成8类符号串，得到它们的概率值即冗余数据量；步骤S-3，确定各类16进制符号串对应的前缀码；步骤S-4，对数据按类进行变长编码把符号串的特征信息表现在编码的最前面，尽可能的避免保存冗余信息；步骤S-5，获得压缩比的计算公式。 2.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于获取原始数据的差值序列：一个数据序列s(i)，i1。

4、，2，N可以用相邻数据间的差值序列表达出来，默认最初的数据s(0)为0，那么第一个数据s(1)便是第一个差值： d(1)s(1)，d(2)s(2)-s(1)，d(3)s(3)-s(2)，d(N)s(N)-s(N-1)。 3.如权利要求2所述的输电线路故障行波数据压缩方法，其特征在于获得差分序列 d(i)后仅通过加法计算就可以恢复原来的数据，差值的数据与原始数据的位数相同，则每个s(i)和d(i)的建立和恢复都是可逆的，令s(0)0那么： s(1)d(1)，s(2)d(2)+s(1)，s(3)d(3)+s(2)，s(N)d(N)+s(N-1)。 4.如权利要求1所述的输电线路故障行波数据压缩。

5、方法，其特征在于根据差分序列的特性分成8类符号串，得到它们的概率值：由于曲线的连续特性，95以上的相邻数据间的差值集中在-2、-1、0、1、2之间，对这样的用补码的16进制形式保存的差分序列，95以上的符号串为000X，FFFX，0000，0001，0002，FFFE，FFFF，它们的概率分别为：p000X，pFFFX， p0000，p0001，p0002，pFFFE，pFFFF，而不符合以上7种情况的符号串记为XXXX，概率为 PXXXX。 5.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于对8类16进制符号串设计它们对应的前缀码：8种情况可以用3位二进制数表示，则000。

6、0，0001，0002，FFFE， FFFF，000X，FFFX的前缀码分别为000，001，010，011，100，101，110，符号串XXXX的前缀码为 111，把这些前缀码统称为TAG段。 6.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于对差分序列中的所有数据按类进行变长编码：编码包含TAG段和数据，符号串000X，FFFX编码为TAG段和剩下的4位二进制编码共7位；符号串0002，0001，0000，FFFF，FFFE编码仅为TAG段共3位；符号串XXXX其编码为TAG段和本身的16位二进制编码共19位。 7.如权利要求1所述的输电线路故障行波数据压缩方法，其特征。

7、在于对差分序列中的所有数据按类进行变长编码：在变长编码中，若码字长度严格按照所对应符号出现概率的大小逆序排列，则其平均长度为最小，数据中0002，0001，0000，FFFF，FFFE占的比例最大而码字长度最短；其次是000X，FFFX；XXXX型符号串在所有数据中占的比例最小码字长度最长，所以上述编码方式码子平均长度最小，达到了最大压缩效率。 8.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于简单快速的获得压缩比的计算公式：根据各类符号串的概率和编码长度计算压缩比P，权利要求书CN 102571101 A 1/4页 3 输电线路故障行波数据压缩方法技术领域。

8、0001 本发明涉及对大量数据进行编码处理以达到数据压缩存储的技术领域，尤其涉及利用曲线的连续特性对其16进制数据文本进行差分和变长编码的数据压缩方法。背景技术 0002 随着计算机技术的快速发展，各种系统数据量越来越大，给信息存储特别是网络传输带来诸多的困难，已成为有效获取和使用信息的瓶颈。为了节省信息的存储空间和提高信息的传输效率，必须对大量的实际数据进行压缩。 0003 数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度，达到增大数据密度，最终使数据的存储空间减少的技术。数据压缩就是将字符串的一种表示方式转换为另一种表示方式，新的表示方式包含相同的信息量，但是长度。

9、比原来的方式尽可能的短。压缩的理论基础是信息论，从信息的角度来看，压缩就是去除掉信息中的冗余，即去除掉确定的或可推知的信息，而保留不确定的信息，也就是用一种更接近信息本质的描述来代替原有的冗余的描述，这个本质的东西就是信息量。 0004 数据压缩跟编码技术联系紧密，压缩的实质就是根据数据的内在联系将数据从一种编码映射为另一种编码。数据压缩按压缩的失真度分为无损压缩与有损压缩。无损压缩技术主要有哈夫曼(Huffman)编码、算术(Arithmetiic)编码、游程编码(RLE)、LZ编码。 0005 数据压缩主要应用于两个方面：(1)传输。通过压缩发送端的原始数据，并在接受端将压缩数。

10、据解码恢复，这样可有效地减少传输时间，增加信道带宽。(2)存储。在存储时压缩原始数据，而在使用时解压，这将大量减小存储介质的存储量。发明内容 0006 本发明要解决的技术问题是对连续曲线的16进制数据文本进行编码压缩，能够实现无损压缩，获得的压缩比小于0.25，达到显著减小存储介质存储量的目的。 0007 为解决上述技术问题，本发明提供一种输电线路故障行波数据压缩方法，所述方法利用曲线的连续特性对16进制数据文本进行连续差分获得用补码的16进制表示的差分序列，将差分序列中的符号串分成8类分别用3位前缀码标识，然后对各类符号串进行变长编码以减少数据存储量。 0008 一种输电线路故障。

11、行波数据压缩方法，包括以下步骤：获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式；根据差分序列的特性分成8类符号串，得到它们的概率值；对数据使用前缀码的方式按类进行变长编码把符号串的特征信息表现在编码的最前面；获得压缩比的计算公式。 0009 进一步地，利用曲线的连续特性获得的差分序列数值集中在-2、-1、0、1、2之间，而用差值补码的16进制表示的数据主要含有000X，FFFX，0000，0001，0002，FFFE，FFFF，很容易的将所有数据分成8类进行编码，不用穷举数据中所有可能的信号避免了多次遍历数据文本，与现有的文本压缩算法相比简单易于实现。在存储和传输。

12、过程中若中间某一位发说明书CN 102571101 A 2/4页 4 生误码至多影响一个数据的解码，对后续数据的解码没有影响可靠性高。在源数据中出现概率越高的符号即0000，0001，0002，FFFE，FFFF，相应码字长度越短共3位；出现概率越小的符号即XXXX型，相应码子长度越长共19位，从而达到用尽可能少的码符号来表示源数据，达到压缩的效果，提高压缩率。附图说明 0010 图1是本发明输电线路故障行波数据压缩方法的步骤流程图； 0011 图2是本发明的分类编码图。 0012 具体实施步骤 0013 请参阅图1，图1是本发明一种输电线路故障行波数据压缩方法的步骤流程图。 0。

13、014 所述压缩方法包括以下步骤： 0015 步骤S-1，获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式。 0016 在本步骤中，截取一条曲线上连续的150个点，组成一个数据序列s(i)，i1， 2，150，数据序列为： 0017 s(150)003D 003E 0040 003E 003D 003E 003E 003D 0040 0040 0042 0042 0018 0041 0041 0043 0043 0043 0047 0047 0046 0049 004B 004A 0049 0048 004A 0019 004C 004E 004E 004F 0050 005。

14、1 004F 0050 0050 0053 0050 0051 0052 0052 0020 0052 0052 0050 0051 0054 0051 0050 0052 0051 0051 0052 0050 004F 004F 0021 0051 0050 004F 004E 004A 004B 004C 004B 004E 004A 004B 004B 004C 004B 0022 0049 004A 004A 004A 004A 0049 004B 004B 004B 004B 004C 004B 004D 004B 0023 004C 004E 004D 004B 004E 004。

15、E 004E 004E 004D 004E 004F 0050 004F 0051 0024 004F 0050 004F 0051 0051 0050 004E 004F 004D 0051 0052 0051 0050 004F 0025 004E 004E 004E 004B 004F 004C 004F 004F 004D 004D 004D 004B 004C 004D 0026 004B 004C 004A 004C 004C 004E 004E 004C 004E 004D 004D 004E 004E 004F 0027 0050 0051 0050 0051 0052 005。

16、2 0053 0053 0053 0054 0055 0056 0028 求相邻数据间的差值序列，默认最初的数据s(0)为0，那么第一个数据s(1)便是第一个差值： 0029 d(1)s(1)，d(2)s(2)-s(1)，d(3)s(3)-s(2)，d(150) s(150)-s(N149)，保存差值补码的16进制形式，差分序列为： 0030 d(150)003D 0001 0002 FFFE FFFF 0001 0000 FFFF 0003 0000 0002 0000 0031 FFFF 0000 0002 0000 0000 0004 0000 FFFF 0003 0002 FFFF 。

17、FFFF FFFF 0002 0032 0002 0002 0000 0001 0001 0001 FFFE 0001 0000 0003 FFFD 0001 0001 0000 0033 0000 0000 FFFE 0001 0003 FFFD FFFF 0002 FFFF 0000 0001 FFFE FFFF 0000 0034 0002 FFFF FFFF FFFF FFFC 0001 0001 FFFF 0003 FFFC 0001 0000 0001 FFFF 0035 FFFE 0001 0000 0000 0000 FFFF 0002 0000 0000 0000 0001 。

18、FFFF 0002 FFFE 0036 0001 0002 FFFF FFFE 0003 0000 0000 0000 FFFF 0001 0001 0001 FFFF 0002 0037 FFFE 0001 FFFF 0002 0000 FFFF FFFE 0001 FFFE 0004 0001 FFFF FFFF FFFF 0038 FFFF 0000 0000 FFFD 0004 FFFD 0003 0000 FFFE 0000 0000 FFFE 0001 0001 说明书CN 102571101 A 3/4页 5 0039 FFFE 0001 FFFE 0002 0000 000。

19、2 0000 FFFE 0002 FFFF 0000 0001 0000 0001 0040 0001 0001 FFFF 0001 0001 0000 0001 0000 0000 0001 0001 0001 0041 获得差分序列d(i)后仅通过加法计算就可以恢复原来的数据，差值的数据与原始数据的位数相同，则每个s(i)和d(i)的建立和恢复都是可逆的，那么： 0042 s(1)d(1)，s(2)d(2)+s(1)，s(3)d(3)+s(2)，s(150) d(150)+s(149)。 0043 步骤S-2，根据差分序列的特性分成8类符号串，得到它们的概率值即冗余数据量。 0044 。

20、在本步骤中，由于曲线的连续特性，选取的连续150个点的16进制数据中99.3 的相邻数据间的差值集中在-2、-1、0、1、2之间。对这样的用补码的16进制形式保存的差分序列，可以将其符号串分成8类。符号串中主要含有000X，FFFX，0000，0001，0002，FFFE， FFFF，它们的概率分别为： 0045 0046 0047 步骤S-3，确定各类16进制符号串对应的前缀码。 0048 在本步骤中，8种情况可以用3位二进制数表示，则0000，0001，0002，FFFE，FFFF， 000X，FFFX的前缀码分别为000，001，010，011，100，101，110，符号串XXXX的。

21、前缀码为111。把这些前缀码统称为TAG段。 0049 步骤S-4，对数据按类进行变长编码，请参阅图2。把符号串的特征信息表现在编码的最前面，尽可能的避免保存冗余信息。 0050 在本步骤中，编码包含TAG段和数据段： 0051 TAG段数据段 0052 对8类符号串进行分类编码： 0053 第1类，0000编码为000仅包含TAG段共3位； 0054 000 代表0000，不用发送数据位 0055 第2类，0001编码为001仅包含TAG段共3位； 0056 001 代表0001，不用发送数据位 0057 第3类，0002编码为010仅包含TAG段共3位； 0058 010 代表000。

22、2，不用发送数据位 0059 第4类，FFFE编码为011仅包含TAG段共3位7； 0060 说明书CN 102571101 A 4/4页 6 011 代表FFFE，不用发送数据位 0061 第5类，FFFF编码为100仅包含TAG段共3位； 0062 100 代表FFFF，不用发送数据位 0063 第6类，000X编码为101加4位二进制数据共7位； 0064 101 000X除去000后剩下的4位二进制编码 0065 第7类，FFFX编码为110加4位二进制数据共7位； 0066 110 FFFX除去000后剩下的4位二进制编码 0067 第8类，XXXX编码为111加16位二进制数据。

23、共19位。 0068 111 原16位二进制编码 0069 在变长编码中，若码字长度严格按照所对应符号出现概率的大小逆序排列，则其平均长度为最小，数据中0002，0001，0000，FFFF，FFFE占得比例最大为88.7，码字长度最短仅有3位；其次是000X，FFFX所占比例为10.7，码字长度共7位；XXXX型数据在150个数据中占的比例最小为0.6，而码字长度最长共19为，所以上述编码方式符合两者之间的逆序排列，码子平均长度最小，提高了压缩效率，而且算法简单易于实现。 0070 步骤S-5，获得压缩比的计算公式。 0071 在本步骤中，根据各类符号串的概率和编码长度，所截取曲线的连续150个点组成的数据序列的压缩比：P0.22083，节省了大量的存储空间。说明书CN 102571101 A 1/2页 7 图1 说明书附图CN 102571101 A 2/2页 8 图2 说明书附图CN 102571101 A 。

摘要
申请专利号：	CN201110415946.0	申请日：	2011.12.12
公开号：	CN102571101A	公开日：	2012.07.11
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):H03M 7/30申请公布日:20120711\|\|\|实质审查的生效IPC(主分类):H03M 7/30申请日:20111212\|\|\|公开
IPC分类号：	H03M7/30	主分类号：	H03M7/30
申请人：	海南电力技术研究院; 武汉三相电力科技有限公司
发明人：	黄松; 邢铀; 孔武; 陈钦柱; 姚冬; 王思捷; 全业生; 余阳; 钱冠军; 张国清
地址：	570125 海南省海口市龙华区滨海大道123-8号信恒大厦十三层
优先权：
专利代理机构：		代理人：
PDF完整版下载：	PDF下载

内容摘要

本发明提供一种输电线路故障行波数据压缩方法。所述方法包括：获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式；根据差分序列的特性分成8类符号串，得到它们的概率值即冗余数据量；对数据使用前缀码的方式按类进行变长编码把符号串的特征信息表现在编码的最前面，尽可能避免保存冗余信息；获得压缩比的计算公式。本发明提供的对连续曲线的数据利用差分和前缀码方式进行变长压缩的方法可实现对用16进制表示的大型数据文本的无损压缩，提高压缩效率，节省大量的存储资源，而且算法简单易于实现。

权利要求书

1.一种输电线路故障行波数据压缩方法，其特征在于，包括以下步骤：步骤S-1，获取原始数据序列相邻数据间的差分序列，保存差值补码的16进制形式；步骤S-2，根据差分序列的特性分成8类符号串，得到它们的概率值即冗余数据量；步骤S-3，确定各类16进制符号串对应的前缀码；步骤S-4，对数据按类进行变长编码把符号串的特征信息表现在编码的最前面，尽可能的避免保存冗余信息；步骤S-5，获得压缩比的计算公式。2.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于获取原始数据的差值序列：一个数据序列s(i)，i＝1，2，......，N可以用相邻数据间的差值序列表达出来，默认最初的数据s(0)为0，那么第一个数据s(1)便是第一个差值：d(1)＝s(1)，d(2)＝s(2)-s(1)，d(3)＝s(3)-s(2)，......，d(N)＝s(N)-s(N-1)。3.如权利要求2所述的输电线路故障行波数据压缩方法，其特征在于获得差分序列d(i)后仅通过加法计算就可以恢复原来的数据，差值的数据与原始数据的位数相同，则每个s(i)和d(i)的建立和恢复都是可逆的，令s(0)＝0那么：s(1)＝d(1)，s(2)＝d(2)+s(1)，s(3)＝d(3)+s(2)，......，s(N)＝d(N)+s(N-1)。4.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于根据差分序列的特性分成8类符号串，得到它们的概率值：由于曲线的连续特性，95％以上的相邻数据间的差值集中在-2、-1、0、1、2之间，对这样的用补码的16进制形式保存的差分序列，95％以上的符号串为000X，FFFX，0000，0001，0002，FFFE，FFFF，它们的概率分别为：p000X，pFFFX，p0000，p0001，p0002，pFFFE，pFFFF，而不符合以上7种情况的符号串记为XXXX，概率为PXXXX。5.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于对8类16进制符号串设计它们对应的前缀码：8种情况可以用3位二进制数表示，则0000，0001，0002，FFFE，FFFF，000X，FFFX的前缀码分别为000，001，010，011，100，101，110，符号串XXXX的前缀码为111，把这些前缀码统称为TAG段。6.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于对差分序列中的所有数据按类进行变长编码：编码包含TAG段和数据，符号串000X，FFFX编码为TAG段和剩下的4位二进制编码共7位；符号串0002，0001，0000，FFFF，FFFE编码仅为TAG段共3位；符号串XXXX其编码为TAG段和本身的16位二进制编码共19位。7.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于对差分序列中的所有数据按类进行变长编码：在变长编码中，若码字长度严格按照所对应符号出现概率的大小逆序排列，则其平均长度为最小，数据中0002，0001，0000，FFFF，FFFE占的比例最大而码字长度最短；其次是000X，FFFX；XXXX型符号串在所有数据中占的比例最小码字长度最长，所以上述编码方式码子平均长度最小，达到了最大压缩效率。8.如权利要求1所述的输电线路故障行波数据压缩方法，其特征在于简单快速的获得压缩比的计算公式：根据各类符号串的概率和编码长度计算压缩比P， P = ( p 000 X + pFFFX ) * 7 + ( p 0000 + p 0001 + p 0002 + pFFFE + pFFFF ) * 3 + pelse * 19 16 . ]]>

说明书

输电线路故障行波数据压缩方法

技术领域

本发明涉及对大量数据进行编码处理以达到数据压缩存储的技术领域，
尤其涉及利用曲线的连续特性对其16进制数据文本进行差分和变长编码的数
据压缩方法。

背景技术

随着计算机技术的快速发展，各种系统数据量越来越大，给信息存储特
别是网络传输带来诸多的困难，已成为有效获取和使用信息的瓶颈。为了节
省信息的存储空间和提高信息的传输效率，必须对大量的实际数据进行压缩。

数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余
度，达到增大数据密度，最终使数据的存储空间减少的技术。数据压缩就是
将字符串的一种表示方式转换为另一种表示方式，新的表示方式包含相同的
信息量，但是长度比原来的方式尽可能的短。压缩的理论基础是信息论，从
信息的角度来看，压缩就是去除掉信息中的冗余，即去除掉确定的或可推知
的信息，而保留不确定的信息，也就是用一种更接近信息本质的描述来代替
原有的冗余的描述，这个本质的东西就是信息量。

数据压缩跟编码技术联系紧密，压缩的实质就是根据数据的内在联系将
数据从一种编码映射为另一种编码。数据压缩按压缩的失真度分为无损压缩
与有损压缩。无损压缩技术主要有哈夫曼(Huffman)编码、算术(Arithmetiic)编
码、游程编码(RLE)、LZ编码。

数据压缩主要应用于两个方面：(1)传输。通过压缩发送端的原始数据，
并在接受端将压缩数据解码恢复，这样可有效地减少传输时间，增加信道带
宽。(2)存储。在存储时压缩原始数据，而在使用时解压，这将大量减小存储
介质的存储量。

发明内容

本发明要解决的技术问题是对连续曲线的16进制数据文本进行编码压
缩，能够实现无损压缩，获得的压缩比小于0.25，达到显著减小存储介质存
储量的目的。

为解决上述技术问题，本发明提供一种输电线路故障行波数据压缩方法，
所述方法利用曲线的连续特性对16进制数据文本进行连续差分获得用补码的
16进制表示的差分序列，将差分序列中的符号串分成8类分别用3位前缀码
标识，然后对各类符号串进行变长编码以减少数据存储量。

一种输电线路故障行波数据压缩方法，包括以下步骤：获取原始数据序
列相邻数据间的差分序列，保存差值补码的16进制形式；根据差分序列的特
性分成8类符号串，得到它们的概率值；对数据使用前缀码的方式按类进行
变长编码把符号串的特征信息表现在编码的最前面；获得压缩比的计算公式。

进一步地，利用曲线的连续特性获得的差分序列数值集中在-2、-1、0、1、
2之间，而用差值补码的16进制表示的数据主要含有000X，FFFX，0000，0001，
0002，FFFE，FFFF，很容易的将所有数据分成8类进行编码，不用穷举数据中
所有可能的信号避免了多次遍历数据文本，与现有的文本压缩算法相比简单
易于实现。在存储和传输过程中若中间某一位发生误码至多影响一个数据的
解码，对后续数据的解码没有影响可靠性高。在源数据中出现概率越高的符
号即0000，0001，0002，FFFE，FFFF，相应码字长度越短共3位；出现概率越小
的符号即XXXX型，相应码子长度越长共19位，从而达到用尽可能少的码符
号来表示源数据，达到压缩的效果，提高压缩率。

附图说明

图1是本发明输电线路故障行波数据压缩方法的步骤流程图；

图2是本发明的分类编码图。

具体实施步骤

请参阅图1，图1是本发明一种输电线路故障行波数据压缩方法的步骤流
程图。

所述压缩方法包括以下步骤：

步骤S-1，获取原始数据序列相邻数据间的差分序列，保存差值补码的16
进制形式。

在本步骤中，截取一条曲线上连续的150个点，组成一个数据序列s(i)，
i＝1，2，......，150，数据序列为：

s(150)＝003D 003E 0040 003E 003D 003E 003E 003D 0040 0040 0042 0042

0041 0041 0043 0043 0043 0047 0047 0046 0049 004B 004A 0049 0048 004A

004C 004E 004E 004F 0050 0051 004F 0050 0050 0053 0050 0051 0052 0052

0052 0052 0050 0051 0054 0051 0050 0052 0051 0051 0052 0050 004F 004F

0051 0050 004F 004E 004A 004B 004C 004B 004E 004A 004B 004B 004C 004B

0049 004A 004A 004A 004A 0049 004B 004B 004B 004B 004C 004B 004D 004B

004C 004E 004D 004B 004E 004E 004E 004E 004D 004E 004F 0050 004F 0051

004F 0050 004F 0051 0051 0050 004E 004F 004D 0051 0052 0051 0050 004F

004E 004E 004E 004B 004F 004C 004F 004F 004D 004D 004D 004B 004C 004D

004B 004C 004A 004C 004C 004E 004E 004C 004E 004D 004D 004E 004E 004F

0050 0051 0050 0051 0052 0052 0053 0053 0053 0054 0055 0056

求相邻数据间的差值序列，默认最初的数据s(0)为0，那么第一个数据
s(1)便是第一个差值：

d(1)＝s(1)，d(2)＝s(2)-s(1)，d(3)＝s(3)-s(2)，......，d(150)＝s(150)-s(N149)，
保存差值补码的16进制形式，差分序列为：

d(150)＝003D 0001 0002 FFFE FFFF 0001 0000 FFFF 0003 0000 0002 0000

FFFF 0000 0002 0000 0000 0004 0000 FFFF 0003 0002 FFFF FFFF FFFF 0002

0002 0002 0000 0001 0001 0001 FFFE 0001 0000 0003 FFFD 0001 0001 0000

0000 0000 FFFE 0001 0003 FFFD FFFF 0002 FFFF 0000 0001 FFFE FFFF 0000

0002 FFFF FFFF FFFF FFFC 0001 0001 FFFF 0003 FFFC 0001 0000 0001 FFFF

FFFE 0001 0000 0000 0000 FFFF 0002 0000 0000 0000 0001 FFFF 0002 FFFE

0001 0002 FFFF FFFE 0003 0000 0000 0000 FFFF 0001 0001 0001 FFFF 0002

FFFE 0001 FFFF 0002 0000 FFFF FFFE 0001 FFFE 0004 0001 FFFF FFFF FFFF

FFFF 0000 0000 FFFD 0004 FFFD 0003 0000 FFFE 0000 0000 FFFE 0001 0001

FFFE 0001 FFFE 0002 0000 0002 0000 FFFE 0002 FFFF 0000 0001 0000 0001

0001 0001 FFFF 0001 0001 0000 0001 0000 0000 0001 0001 0001

获得差分序列d(i)后仅通过加法计算就可以恢复原来的数据，差值的数据
与原始数据的位数相同，则每个s(i)和d(i)的建立和恢复都是可逆的，那么：

s(1)＝d(1)，s(2)＝d(2)+s(1)，s(3)＝d(3)+s(2)，......，s(150)＝d(150)+s(149)。

步骤S-2，根据差分序列的特性分成8类符号串，得到它们的概率值即冗
余数据量。

在本步骤中，由于曲线的连续特性，选取的连续150个点的16进制数据
中99.3％的相邻数据间的差值集中在-2、-1、0、1、2之间。对这样的用补码
的16进制形式保存的差分序列，可以将其符号串分成8类。符号串中主要含
有000X，FFFX，0000，0001，0002，FFFE，FFFF，它们的概率分别为：

P 0000 = 37 150 , ]]> P 0001 = 36 150 , ]]> P 0002 = 17 150 , ]]> PFFFE = 15 150 , ]]> PFFFF = 28 150 ]]>

P 000 X = 10 150 , ]]> PFFFX = 6 150 , ]]> PXXXX = 1 150 . ]]>

步骤S-3，确定各类16进制符号串对应的前缀码。

在本步骤中，8种情况可以用3位二进制数表示，则0000，0001，0002，FFFE，
FFFF，000X，FFFX的前缀码分别为000，001，010，011，100，101，110，符号串
XXXX的前缀码为111。把这些前缀码统称为TAG段。

步骤S-4，对数据按类进行变长编码，请参阅图2。把符号串的特征信息
表现在编码的最前面，尽可能的避免保存冗余信息。

在本步骤中，编码包含TAG段和数据段：

TAG段
数据段

对8类符号串进行分类编码：

第1类，0000编码为000仅包含TAG段共3位；

000
代表0000，不用发送数据位

第2类，0001编码为001仅包含TAG段共3位；

001
代表0001，不用发送数据位

第3类，0002编码为010仅包含TAG段共3位；

010
代表0002，不用发送数据位

第4类，FFFE编码为011仅包含TAG段共3位7；

011
代表FFFE，不用发送数据位

第5类，FFFF编码为100仅包含TAG段共3位；

100
代表FFFF，不用发送数据位

第6类，000X编码为101加4位二进制数据共7位；

101
000X除去000后剩下的4位二进制编码

第7类，FFFX编码为110加4位二进制数据共7位；

110
FFFX除去000后剩下的4位二进制编码

第8类，XXXX编码为111加16位二进制数据共19位。

111
原16位二进制编码

在变长编码中，若码字长度严格按照所对应符号出现概率的大小逆序排
列，则其平均长度为最小，数据中0002，0001，0000，FFFF，FFFE占得比例最
大为88.7％，码字长度最短仅有3位；其次是000X，FFFX所占比例为10.7％，
码字长度共7位；XXXX型数据在150个数据中占的比例最小为0.6％，而码
字长度最长共19为，所以上述编码方式符合两者之间的逆序排列，码子平均
长度最小，提高了压缩效率，而且算法简单易于实现。

步骤S-5，获得压缩比的计算公式。

在本步骤中，根据各类符号串的概率和编码长度，所截取曲线的连续150
个点组成的数据序列的压缩比：P＝0.22083，节省了大量的存储空间。