您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

超级简单的数据压缩算法—LZW算法

时间:2019-12-05 11:59:56  来源:  作者:

在字符串算法—数据压缩中,我们介绍了 赫夫曼树(Huffman)的构建和应用(编码、译码)哈夫曼压缩算法(Huffman compression), 本文将介绍 LZW算法 。

2. LZW算法

这个算法很简单,为了方便讲述,我们将采用16进制,写代码的时候在把它转回2进制就是了。

在16进制下:A:41; B:42; C:43; D:44;......

从例子入手:

超级简单的数据压缩算法—LZW算法

压缩表是边读数据边建立起来的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

首先从第一个数据开始读:

第一个字符为A, A在压缩表里已存在,值是41;

超级简单的数据压缩算法—LZW算法

下一个字符为B,B在压缩表里已存在,值是42;

前一个字符A与这个字符B结合成AB,给它一个值:81;(为什么是81?因为41~79都被字母用了)

把AB加到压缩表里:

超级简单的数据压缩算法—LZW算法

下一个字符为R,R在压缩表里已存在,值是52;

前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为A,A在压缩表里已存在,值是41;

前一个字符R与这个字符A结合成RA,给它一个值:83,加到压缩表中:

如此类推,一直到D那里:

超级简单的数据压缩算法—LZW算法

下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的AB也在压缩表里,我们取含字符最多的AB:

前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为R, R在压缩表里已存在,但下下一个字符为A,它们两组合而成的RA也在压缩表里,我们取含字符最多的RA;

前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为B, B在压缩表里已存在,但下下一个字符为R,它们两组合而成的BR也在压缩表里,我们取含字符最多的BR;

前一个字符串RA与这个字符串的首字符B结合成RAB,给它一个值:89,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的BR也在压缩表里; 但下下下一个字符为R,它们三组合而成的ABR也在压缩表里,我们取含字符最多的ABR;

前一个字符串BR与这个字符串的首字符A结合成BRA,给它一个值:8A,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为A, A在压缩表里已存在,值为41;

前一个字符串BRA与这个字符A结合成ABRA,给它一个值:8B,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个字符为空,说明数据已经压缩完了,给个值80作为终止标记:

超级简单的数据压缩算法—LZW算法

压缩后的数据就是上述的值的组合,压缩表直接删除。

压缩后的数据S:41425241434144818382884180。

压缩的方法讲完了,那么如何解压呢?

我们也是边解压边建表:

现有压缩数据S:41425241434144818382884180。

超级简单的数据压缩算法—LZW算法

同样的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

首先从第一个数据开始读:

第一个值为41,对应字符A:

超级简单的数据压缩算法—LZW算法

下一个数据为42,对应字符B;

前一个字符A与这个字符B结合成AB,给它一个值:81,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个数据为52,对应字符R;

前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

超级简单的数据压缩算法—LZW算法

如此类推,一直读到81:

超级简单的数据压缩算法—LZW算法

下一个数据为81,对应字符串AB;

前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个数据为83,对应字符串RA;

前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

超级简单的数据压缩算法—LZW算法

如此类推,一直读到80:

超级简单的数据压缩算法—LZW算法

下一个数据为80,这是压缩的终止值,说明解压完成了,此时,把压缩表丢掉。

解压后得到原数据S:ABRACADABRABRABRA;

由于我们的压缩表都是动态生成的,我们省了保存它的时间和空间。

解压和压缩都介绍完了,这个算法也就结束了,超级简单!

有时候解压时,会遇到些有趣的情形,如下图:

原数据压缩:

超级简单的数据压缩算法—LZW算法

解压时:

超级简单的数据压缩算法—LZW算法

下一个数据为81,对应字符串AB;

前一个字符B与这个字符串的首字符A结合成BA,给它一个值:82,加到压缩表中:

超级简单的数据压缩算法—LZW算法

下一个数据为83,嗯?83?83不在压缩表里啊,去哪找83?

容我们冷静分析一波:

首先,压缩表去到了82,下一个数据就是83。因为是83,所以肯定是个字符串。(81以上都是我们自己加的字符串!)

假设83对应的字符串为X:

超级简单的数据压缩算法—LZW算法

前一个字符串AB与这个字符串的首字符X 1 (假设X是由X 1 X 2 X 3 ...X N 组成)结合成ABX 1 ,给它一个值:83,加到压缩表中:

超级简单的数据压缩算法—LZW算法

即X=ABX 1 , X 1 是X的首字符(ABX 1 的首字符),即X 1 =A;

故得知X=ABA:

超级简单的数据压缩算法—LZW算法

下一个数据是80,解压完成。解压后的原数据为ABABABA;

至此,LZW算法介绍完毕。

实现代码:

超级简单的数据压缩算法—LZW算法


Tags:LZW算法   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
在字符串算法—数据压缩中,我们介绍了 赫夫曼树(Huffman)的构建和应用(编码、译码)哈夫曼压缩算法(Huffman compression), 本文将介绍 LZW算法 。2. LZW算法这个算法很简单,为了...【详细内容】
2019-12-05  Tags: LZW算法  点击:(124)  评论:(0)  加入收藏
▌简易百科推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Java技术那些事    Tags:时间轮   点击:(1)  评论:(0)  加入收藏
博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就...【详细内容】
2021-12-24  量子位    Tags:蒸馏法   点击:(11)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  老师明明可以靠颜值    Tags:算法   点击:(7)  评论:(0)  加入收藏
1. 基本概念希尔排序又叫递减增量排序算法,它是在直接插入排序算法的基础上进行改进而来的,综合来说它的效率肯定是要高于直接插入排序算法的;希尔排序是一种不稳定的排序算法...【详细内容】
2021-12-22  青石野草    Tags:希尔排序   点击:(6)  评论:(0)  加入收藏
ROP是一种技巧,我们对execve函数进行拼凑来进行system /bin/sh。栈迁移的特征是溢出0x10个字符,在本次getshell中,还碰到了如何利用printf函数来进行canary的泄露。ROP+栈迁移...【详细内容】
2021-12-15  星云博创    Tags:栈迁移   点击:(22)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15    晓掌柜丶韶华  Tags:排序算法   点击:(16)  评论:(0)  加入收藏
在了解golang的map之前,我们需要了解哈希这个概念。哈希表,又称散列表(Hash table),是根据键(key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算出一个键值的函数,将...【详细内容】
2021-12-07  一棵梧桐木    Tags:哈希表   点击:(14)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯·奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  小心程序猿QAQ    Tags:雪花算法   点击:(24)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  华章科技    Tags:排序算法   点击:(40)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  有AI野心的电工和码农    Tags: KMP算法   点击:(36)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条