有损图象压缩基础Word格式.docx
- 文档编号:21992492
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:11
- 大小:696.43KB
有损图象压缩基础Word格式.docx
《有损图象压缩基础Word格式.docx》由会员分享,可在线阅读,更多相关《有损图象压缩基础Word格式.docx(11页珍藏版)》请在冰豆网上搜索。
失真准则:
D≤D*,D*是允许的最大平均失真度
失真度量方法:
均方误差
绝对误差
超视觉均方差:
d=(ai-bj)u
其中当|ai-bj|≥T时u=1,
当|ai-bj|<
T时u=0,
T为视觉阈值。
互信息
●指符号u和符号v相互传达的信息。
I(U;
V)=H(V)-H(V|U)=H(U)-H(U|V)
=ΣuΣvP(u,v)•log2(P(u,v)/(P(u)•P(v)))
●互信息的性质:
0≤I(U;
V)=I(V;
U)
V)≤H(U)
I(V;
U)≤H(V)
●信道编码:
信道容量就是收发端间最大的互信息量。
率-失真函数
●R(D*)=min{I(U;
V)}D≤D*
●R(D)是保证平均失真Davy小于允许的最大失真D*所能压缩编码的码率下界,也是所要求的最低传送比特率。
●典型的率-失真函数:
可以证明,H(U-V|V)=H(U|V)
故可有:
R(D*)=min{H(U)-H(U|V)}
=H(U)-max{H(U|V)}
=H(U)-max{H(U-V|V)}
D≤D*
理想的情况是信源编码产生的失真u-v与重建信号v统计独立,但这种情况并非总能满足。
●Shannon给出的编码下限:
R(D*)≥H(U)-maxH(U-V)
当数码率小于率失真函数时,无论采用何种编码方式,其平均失真必大于D。
上面的结论称为Shannon的信源编码逆定理(有失真时)。
3.3.2量化
损失来自量化。
量化有标量量化和矢量量化。
最基本的有损编码方法是标量量化。
标量量化(SQ)
把信源每个样点值f(连续有界B或离散有限)映射到一个重建值g
量化器:
量化的数目(重建值的数目)L(l=1,2,3,L),
分界值bl
重建值gl
量化函数:
Q(f)=gl,f属于Bl
量化器的失真:
Dq=∫Bd(f,Q(f))p(f)df
均方误差:
d(f,g)=(f-g)2
均匀量化:
相邻分界值间和相邻重建值间间隔相等
bl-bl-1=gl-gl-1=q,q:
量化步长
最佳量化器设计(最小均方误差MMSE)
选择bl和gl
均匀信源非均匀信源
矢量量化
多维空间分割
(参考王瑶的《视频处理与通信》第8章)。
3.3.3有损图像压缩的基本方法
两类:
基于抽样的(Sample-based)
基于块的(Block-based)
基于抽样的编码
逐个抽样压缩(SamplebySample)
抽样可以是空域的,也可以是频域的
一个简单的基于抽样的压缩方法是抽样值的预测编码
例:
差分脉码调制(DPCM)
对每个输入抽样xij,
1)由xij前面已编码的几个邻近的抽样预测出它的一个估计pij,(一般是前几个邻近的抽样解码值的加权和)
2)生成一个差值eij=xij-pij,
3)对eij量化
4)对量化结果编码
●如果图像是空间高相关的,pij将很接近xi,j,因而ei,j将很小。
●eij的方差将比xij的方差小,因而其量化失真也将很小。
●较低的方差对应较低的熵和较高的压缩比,因而DPCM编码将比对xij直接编码有效。
●一般来说,图像的协方差函数在距离超过8个象素后迅速衰减,因而不必用过多的相邻象素来预测,实践中常用最临近的3个象素预测当前象素,例如:
pi,j=w1x'
I,j-1+w2x'
i-1,j-1+w3x'
i-1,j
其中:
w1,w2,w3加权常数因子,而x'
ij=pi,j+qi,j是解码器对xi,j的估计。
●如果xi,j为8-bit,则ei,j和qi,j的范围均为[-255,255],但qi,j可以用较少的比特表示,因为量化级数少了。
比如量化为16级,则仅用4bits即可表示了。
xi,jei,jLi,j
+量化器
-
qij
pi,j
预测器
(a)编码框图
性能分析
理论上
假定:
相关系数0.95,上述预测方法,不考虑量化噪声影响,可优于不相关情况1.97bits
实际上
qij
eij
(b)量化器特性
不能不考虑量化噪声影响。
性能低于理论极限6-16db。
运算复杂度低:
4次乘,3次加
乘法可用查表,或移位加
基于块的编码
一个相邻的象素块作为一个整体(编码单元)进行编码处理。
●根据率失真理论,随着块尺寸的增大,可以找到一个编码方法满足R>
R(D)使得失真任意接近D。
换句话说,如果块无限大,则可以找到一个编码方法以码率R=R(D)达到失真不超过D。
●DPCM不可能达到R(D)边界
●块编码优于基于抽样的编码方法。
●已开发出了许多块编码方法,这些技术基本上可分为两类:
空间域块编码
变换域块编码
象素分组成块,然后对块在空间域压缩。
基于矢量量化(VQ)的压缩方法属于这一类。
VQ方法编码处理比解码处理复杂和量大。
从率失真的观点看,相同码率下,VQ方法至少能比DPCM方法有3dB的信噪比增益。
象素分组成块,由空间域变换到另一个域(例如频域),然后在该域压缩。
二维图像X,空域块NxN
定义2个NxN变换矩阵,分别对应列变换和行变换
Tc={tc(u,i)},u,i=0,1,2,…,n-1,
Tr={tr(v,j)},v,j=0,1,2,…,n-1,
X的一个二维线性变换可表示为:
Y=TcX(Tr)t。
Tc和Tr称为变换核或基函数。
对称核:
Tc=Tr=T,Y=TXTt
变换的目的是为了获的X的更紧凑的表示Y
基于变换的有失真压缩是通过变换到Y,然后舍弃Y中不重要的信息而实现的。
为能解压缩还原图像,变换必须是可逆的,即存在T-1=U,使
X=UYUt。
常用的一些变换(基函数)有DFT,DCT,DST,DHT,KLT等。
变换效果比较见图(集中能量的能力)
KLT最优,DHT最差
最优变换KLT
1、能量集中在Y中最少的一些元素中
2、最小化了序列的熵
3、完全去除了X中元素的相关性
缺点:
实现困难,基函数依赖具体图像
(其余变换的基函数则是独立于图像的)
DCT被认为是最接近KLT的,且符合人类视觉特性。
已被广泛用于图像压缩,并且是几乎所有基于变换的图像和视频压缩国际标准所选定的基函数。
基于DCT的编码
基本计算是NxN图像块的DCT变换。
压缩标准中,选择N=8,(新标准也有选择N=4的)
选择理由:
●从软硬件实现看:
存储要求不高,DCT的计算复杂度也为大部分计算平台可接受
●从紧缩能量的效果来看,块大于8x8并不能提供更显著的增益。
压缩标准中,选择DCT,理由:
●紧缩有效性。
对于相关系数1,2>
0.7的高相关图像数据,DCT的能量紧缩效率接近最优变换KLT。
●正交变换,Y=TXTt,则X=TtYT
●正反变换运算和运算量几乎是相同的,在硬件上也可用相同的运算单元
●变换的可分离性Z=TXt,Y=TZt=TXTt。
简化执行时的硬件需求。
●DCT基独立于图像
●易与人的视觉特性比较适配
●DCT可有快速算法
NxN二维DCT正变换(FDCT)定义:
其中u,v,x,y=0,1,2,...N-1
x,y空间域坐标,u,v频率域坐标,
C(u),C(v)=2-1/2u,v=0
1其它
NxN二维DCT反变换(IDCT)定义:
正变换的输入和反变换的输出是9bits的有符号数,变换系数12bits,动态范围是[-2048,2047]。
向量矩阵形式:
y=Tx
x,y是64维向量,64长的象素序列,符号序列。
T64x64矩阵,其元素就是上面公式中的乘积项。
64维空间,64个基,64个波形,分别代表不同的空间频率
每个8x8图像块被分解成64个基本图像块的加权叠加。
基于DCT的图像编码系统
系统基本结构
如右图所示。
●图像划分为不重叠的8x8象素块;
●对每个块做DCT变换;
●对变换系数进行量化;
●对量化系数熵编码
(行程编码+Huffman编码)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 有损 图象 压缩 基础
![提示](https://static.bdocx.com/images/bang_tan.gif)