炉石灰烬使者:请大家谈谈你对数据压缩原理的认识

来源：百度文库编辑：查人人中国名人网时间：2024/05/03 05:34:12

别处的文章也行，我想知道数据压缩大概是怎么回事
谢谢

数据压缩技术就是对原始数据进行数据编码或压缩编码。

目前常用的压缩编码有：冗余压缩法（无损压缩法、熵编码）和熵压缩法（有损压缩法）两类。

无损压缩是可逆的；有损压缩是不可逆的。
变长编码

使用长度可变的代码来对以不同频率出现的样本进行编码。

1·Huffman编码

Huffman编码又称最佳编码。

Huffman编码过程是：

*将信源符号按概率递减顺序排列；

*把两个最小的概率加起来，作为新符号的概率；

*重复上述两步骤，直到概率的和达到1为止；

*在每次合并消息时，将被合并的消息赋予1和0或赋予0和1；

*寻找从每一信源符号到概率为1的路经，记录下路经上的1和0；

*对每一符号写出从码树的根到终结点1、0序列。

例：对信源

[X1，X2，X3，X4，X5，X6]=[0.25，0.25，0.20，0.15，0.10，0.05]

进行Huffman编码。

其中：X1=01；X2=10；X3=11；X4=000；X5=0010；X6=0011。

2·算术编码

算术编码是一种二元编码。

这种编码方法是在不考虑信源统计的情况下，只要监视一小段时间内码字出现的频率，不管统计是平稳的或非平稳的，编码的码率总能趋近于信源熵值，每次迭代的编码算法只处理一个数据符号，并且只有算术运算。

对二进制编码来说，信源符号只有两个。在算术编码的初级阶段，可设一个大概率Pe和小概率Qe，然后对被编码比特流符号进行判断。

模型编码

模型编码是指采用模型的方法对传输的图像进行参数估测。

模型编码有：随机马尔可夫场和分形图像编码。

1·分形的概念

分形的含义是其组成部分以某种方式与整体相似的形（一类无规则、混乱而复杂），其局部与整体有相似性的体系，即：自相似性体系。

2·分形编码

*基本原理：分形的方法是把一幅数字图像，通过一些图像处理技术将原始图像分成一些子图像，然后在分形集中查找这样的子图像。分形集存储许多迭代函数，通过迭代函数的反复迭代，可以恢复原来的子图像。

分形编码压缩的步骤：

第一步：把图像划分为互不重叠的、任意大小的的D分区；

第二步：划定一些可以相互重叠的、比D分区大的R分区；

第三步：为每个D分区选定仿射变换表。

分形编码解压步骤：

首先从文件中读取D分区划分方式的信息和仿射变换系数等数据；

然后划定两个同样大小的缓冲区给D图像和R图像，并把R初始化到任一初始阶段；

根据仿射变换系数把其相应的R分区做仿射变换，并用变换后的数据取代该D分区的原有数据；

对D中所有的D分区都进行上述操作，全部完成后就形成一个新的D图像；

再把新D图像的内容拷贝到R中，把新R当作D，D当作R，重复操作（迭代）。

。分形编码的特点：

压缩比高，压缩后的文件容量与图像像素数无关，在压缩时时间长但解压缩速度快

下面的连接是关于这方面的教程。。可以去这里看看，，可能就可以找到你所想要的信息。。。
网络地址复杂了点，但是没有病毒，可以放心打开。。
http://www.chis.com.cn/%D0%C2%CA%C0%BC%CD/%D2%BD%D4%BA/%B5%DA%C1%F9%C6%AA%20%20%B9%D8%BC%FC%B9%A4%B3%CC%A3%BA%B9%B9%D6%FE%D2%BD%D1%A7%D3%B0%CF%F1%B4%E6%B5%B5%BA%CD%CD%A8%D0%C5%CF%B5%CD%B3/%B5%DA%C8%FD%D5%C2%20%20%C8%C3%CA%FD%BE%DD%D1%B9%CB%F5%B3%C9%CE%AA%CD%BC%CF%F1%B4%AB%CA%E4%B5%C4%C7%BF%C1%A6%B7%A2%C9%E4%C6%F7/%B5%DA%B6%FE%BD%DA%20%20%CA%FD%BE%DD%D1%B9%CB%F5%B5%C4%BB%F9%B1%BE%D4%AD%C0%ED%BA%CD%D4%AD%D4%F2.htm

请大家谈谈你对数据压缩原理的认识请大家谈谈对ERP的认识? 请谈谈你对科学发展观的认识请大家谈谈对语文学习的认识！！！急需！！！请大家都来谈谈对保险的认识?谢谢! 运用新生事物是不可战胜的原理,谈谈你对社会主义命运及前途的认识谈谈你对物业管理工作的认识谈谈你对磁盘文件系统的认识联系实际谈谈你对社会主义的认识? 谈谈你对社会主义优越性的认识?