数字视频信号源的编码器和解码器的研究5文档格式.docx
- 文档编号:22143400
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:18
- 大小:244.17KB
数字视频信号源的编码器和解码器的研究5文档格式.docx
《数字视频信号源的编码器和解码器的研究5文档格式.docx》由会员分享,可在线阅读,更多相关《数字视频信号源的编码器和解码器的研究5文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
3MPEG-2编码器原理10
3.1MPEG-2的编码方式10
3.2PAL解码器14
3.3MPEG-2视频编码器15
4MPEG-2解码器原理16
4.1视频基本码流结构16
4.2MPEG-2解码17
总结18
致谢19
参考文献20
1视频编码的发展和原理及数字电视简介
1.1数宇电视和高清晰度电视的含义
数字电视系统(Digit8lTelevision)就是电视信号的拍摄、编辑、制作、发射、传输、接收、处理显示等全过程都使用数字技术的电视系统,数字电视是未来家庭的数字多媒体处理和显示终端。
数字电视是一个大家庭,按照清晰度分为:
高清晰度数字电视HDTV、增强清晰度数字电视EDTV、标准清晰度数字电视SDTV和普通清晰度数字电视PDTV。
HDTV是目前数字电视的最高级别,不同清晰度级别的数字电视之间具有向下兼容性,高端产品可以兼容低端产品。
数字电视的图像格式主要有两种:
高清晰度电视和标准清晰度电视,其名称均包含着相应的技术要求。
1.高清晰度电视的含义主要包括:
(1)图像取样格式不低于1920×
1080i(隔行)或1280×
720P(逐行),图像水平清晰度大于700线,重放效果相当于16nun电影胶片图像质量水平。
(2)图像幅型比为16:
9,彩色显像管荫罩节距应小于0.6ram(以81cm彩色显像管为例)。
(3)图像、伴音信号传输方式为数字方式,并采用国际通用的数字电视信号压缩、编码、调制、解调方式。
(4)声音信号为独立多声道环绕立体声。
(5)具有符合高清晰度显示的扫描格式或行扫描频率达28KHz以上。
(6)具备足够的视频信号带宽,要求达到30MHz以上。
2.标准清晰度电视的含义主要包括:
(1)图像取样格式为720×
576i,图像水平清晰度大于500线,重放效果相当于DVD激光视盘机的质量水平。
(2)图像幅型比为4:
3(即传统CRT型彩色电视幅型比)。
(3)图像、伴音信号编码传输方式为数字方式,并采用国际通用的数字电视信号压缩、编码、调制、解调方式。
(4)声音信号为独立多声道环绕立体声,目前暂以双声道为主。
目前,我国各个省、市、自治区试播数字电视节目只在个别有线电视网内试播。
试播的电视节目,大多为标清晰度电视节目,其清晰度、图像质量、伴音质量与DVD激光视盘机相同。
因此,只在有试播任务的有线电视网内才能收看数字电视节目。
1.2数字电视的优点
传统模拟电视传送的图像信号和声音信号是连续变化的电压和电流,图像的亮暗变化、声音的大小都是以连续变化的电压、电流大小来表征。
数字电视传送的是不连续的“0”“1”脉冲信号,传输时首先要把连续变化的模拟信号经取样、量化、压缩编码后,变为不连续的二进制脉冲信号,其中包含着图像亮暗和声音大小的信息。
与传统模拟电视系统相比,数字电视的优点非常明显。
1.数字电视信号的噪波、失真与信号连续处理的次数无关,不会产生噪波、失真的累积。
同时,数字电视信号很容易实现检错与纠错,抗干扰能力强,图像、伴音信号传输质量很高。
标准清晰度的数字电视(SDTV),图像的清晰程度即达到DVD水平,伴音也达到环绕立体声效果。
2.数字电视信号很容易实现存储、控制与处理,存储时间与信号特性无关,并可实现数字特技效果。
例如冻结、放大、缩小、快放、慢放等特技处理。
3.数字电视信号可以合理利用频谱资源。
在一个8MHz的模拟电视频道内,可以传送一套频谱达27MHz的高清晰度电视节目或传送46套频谱为6MHz的标准清晰度电视节目。
也就是说,在现行750MHz的有线电视网络中,传送模拟电视最多只能容纳70—80套节目,而用于传送数字电视,节目容量可以超过500套,大大提高了用户对电视节目多样化、高质量的需求。
4.数字电视信号很容易实现信号的加密、解密,便于实现电视节目的条件接收。
例如:
付费电视、专用数据业务传送等。
5.数字电视系统具有可扩展性、可分级性和可操作性,便于实现各种交互式多媒体应用,能够为用户提供多元化资讯和数字增值服务。
例如:
视频点播(VOD)、股市行情实时查询及交易、互联网接人、网页浏览、电子邮件、网上购物等。
6.数字电视系统可以传输多声道环绕立体声伴音信号,提高了声音信号的立体感、空间环绕感,使收听者有身临其境的视听效果。
数字电视系统的音频信号信噪比高、失真小、动态范围大、频响宽,是高质量的电视伴音。
1.3数字电视的发展趋势
尽管媒体、企业及商家在2003年对数字电视进行声势浩大的宣传,但是数字电视的普及速度并不会像人们所预计的那样快,“模拟”和“数字高清”电视信号将在相当长的一段时间内(2015年之前)共存。
未来至少3年内传统彩电仍为主流产品,数字高清晰度电视消费还难以成为市场主流。
数字电视市场要在短短的一、两年内形成规模是不现实的,数字传输网络的带宽和速度、数字电视节目的数量和质量、国民收入和平均消费水平的高低,决定了数字电视的普及程度和发展趋势。
根据以往的规律,数字电视也和其他数字电子产品一样,从初始阶段到趋于完善、从模拟到数字的更新换代必将经历一个相对漫长的过程。
数字电视是当今世界广电业的发展潮流,没有人可以怀疑数字电视发展的必然趋势,同样也没有人能够明确地告诉你,数字电视到底何时能真正揭开那层扑朔迷离的面纱。
模拟电视被数字电视取代只是一个时问问题,数字电视未来的道路是漫长的,前途是光明的。
数字传输网络的带宽和速度、数字电视节目的数量和质量、国民收入和平均消费水平的高低,决定了数字电视的普及程度和发展趋势。
数字电视是当今世界广电业的发展潮流,根据以往的规律,数字电视也和其他数字电子产品一样,从初始阶段到趋于完善、从模拟到数字的更新换代必将经历一个相对漫长的过程。
同样也没有人能够明确地告诉你,数字电视到底何时能真正揭开那层扑朔迷离的面纱。
2视频压缩编码的方法
压缩编码的方法有几十种之多,并在编码过程中涉及较深的的数学里理论基础问题,在此仅介绍几种常用的压缩编码方法。
2.1莫尔斯码与信源编码
莫尔斯码即电报码,其精华之处在于用短码来表示常出现的英文字母,用长码来表示不常出现的字母,以减小码率。
2.2差值脉冲编码
其原理框图见图2.1(a)。
发端将当前样值和前一样值相减所得差值经量化后进行传输,收端将收到的差值与前一个样值相加得到当前样值。
在这个原理图中,输出的当前样值是输出的前一样值加上收到的差值,由于在当前差值中包括当前的量化误差,而输出的前一样值又包括前一样值的量化误差,这就造成了量化误差的积累。
因此实用电路为图2.1(b)。
这时输入当前样值不是与输入的前一样值相减,而是与输出的前一样值相减,因此在差值中已经包含了前一样值的量化误差的负值,在与输出的前一个样值相加时,这部分量化误差被抵消,只剩下当前的量化误差,这就避免了量化误差的积累。
图2.1差值脉冲编码
2.3预测编码基本原理
由于语音信号的相邻抽样点之间有一定的幅度关联性,所以,可根据以前时刻的样值来预测现时刻的样值,只要传预测值和实际值之差,而不需要每个样值都传输。
这种方法就是预测编码。
语音信号的样值可分为可预测和不可预测两部分。
可预测部分(相关部分)是由过去的一些权值加权后得到的;
不可预测的部分(非相关部分)可看成是预测误差。
这样,在数字通信中,就不用直接传送原始话音信号序列,而只传送差值序列。
因为差值序列的信息可以代替原始序列中的有效信息,而差值信号的能量远小于原样值,就可以使量化电平数减少,从而大大地压缩数码率。
在接收端,只要把差值序列叠加到预测序列上,就可以恢复原始序列。
图2.2给出了差值脉码调制(DPCM)系统原理框图。
图中输入样值信号
,接收端重建信号为
,
是输入信号与预测信号
的差值,
为量化后的差值,
是
经编码后输出的数字码。
图2.2DPCM原理方框图
编码器中的预测器与解码器中的预测器完全相同。
因此,在无传输误码的情况下,解码器输出的重建信号
和编码器的
完全相同。
DPCM的总量化误差
定义为输入信号
与解码器输出的重建信号
的差值。
即有
由上式可知,在这种DPCM系统中,总量化误差只和差值信号的量化误差有关。
图2.3说明了预测的原理。
图2.3DPCM预测原理
由图2.3可见,预测值跟踪输入信号抽样值变化。
DPCM的方框图如图2.3中,它是典型的线性预测方式。
设原始信号序列为
,其中
是序列
中现在的样值,而
的前
个样值。
若选用
的前N个样值来预测
,并用
表示预测值,则
其中,j为任意整数。
为预测系数或加权系数,
为预测阶数。
由上式可见,线性预测中,第n个预测值
是过去N个样值的线性组合。
2.4游程长度编码
读出数据和表示数据的方式也是减少码率的一个重要因素。
读出的方式可以有多种选择,如水平逐行读出、垂直逐列读出、之字型读出和交替读出等,其中之字型读出(Zig-Zag)是最常用的一种。
由于经DCT变换以后,系数大多数集中在左上角,即低频分量区,因此之字型读出实际上是按二维频率的高低顺序读出系数的,这样一来就为游程长度编码(RunlengthEncoding)创造了条件。
所谓游程长度编码是指一个码可同时表示码的值和前面几个零,这样就可以把之字型读出的优点显示出来了。
因为之字型读出在大多数情况下出现连零的机会比较多,尤其在最后,如果都是零,在读到最后一个数后只要给出“块结束”(EOB)码,就可以结束输出,因此节省了很多码率。
游程长度指的是由字构成的数据流中各个字符连续重复出现而形成字符串的长度。
基本的游程编码就是在数据流中直接用三个字符来给出上述三种信息,其数据结构如图2.4所示。
图2.4基本游程长度编码数据结构
CS表示有一个字符串在此位置,X代表构成串的字符,SC代表串的长度。
游程编码和哈夫曼编码等属于统计编码。
2.5霍夫曼编码
霍夫曼编码是可变字长编码(VLC)的一种。
Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。
下面引证一个定理,该定理保证了按字符出现概率分配码长,可使平均码长最短。
定理:
在变字长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度为最小。
现在通过一个实例来说明上述定理的实现过程。
设将信源符号按出现的概率大小顺序排列为:
给概率最小的两个符号a6与a7分别指定为“1”与“0”,然后将它们的概率相加再与原来的a1~a5组合并重新排序成新的原为:
对a5与a6′分别指定“1”与“0”后,再作概率相加并重新按概率排序得U″:
(0.260.200.190.180.17)…直到最后得U″″:
(0.610.39)分别给以“0”,“1”为止,如图2.5所示。
霍夫曼编码的具体方法:
先按出现的概率大小排队,把两个最小的概率相加,作为新的概率和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。
每次相加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。
图2.5霍夫曼编码过程
例如2.5所示a7从左至右,由U至U″″,其码字为0000;
a6按践线将所遇到的“0”和“1”按最低位到最高位的顺序排好,其码字为0001…用霍夫曼编码所得的平均比特率为:
Σ码长×
出现概率;
上例为:
0.2×
2+0.19×
2+0.18×
3+0.17×
3+0.15×
3+0.1×
4+0.01×
4=2.72bit;
可以算出本例的信源熵为2.61bit,二者已经是很接近了。
2.6运动估计的运动补偿编码
这是一种帧间编码的方法,其原理是利用帧间的空间相关性,减小空间冗余度。
帧间编码为什么可以减小冗余度,这是因为两帧之间有很大的相似性。
如果将前后两帧相减(移动物体作相应位移)得到的误差作编码所需比特要比帧内编码所需的比特少,帧间差集中在零附近,可以用短的码字传送。
实现帧间编码的方法是运动估计和运动补偿。
用图2.6来说明这个过程。
图2.6运动处理过程
当前帧在过去帧的窗口中寻找匹配部分,从中找到运动矢量;
根据运动矢量,将过去帧位移,求得对当前帧的估计;
将这个估计和当前帧相减,求得估计的误差值;
将运动矢量和估计的误差值送到接收端去。
接收端根据收到的运动矢量将过去帧作位移(也就是对当前帧的估计),再加上接收到的误差值,就是当前帧了。
图2.7宏块在上一帧搜索范围内寻找匹配
图2.8运动估计的全局搜索块匹配
图2.8运动估计的全局搜索块匹配实际上,在做运动估计和运动补偿时,是以16×
16的块(称宏块)逐个进行的,如图2.7所示,这是将当前帧划分为N×
N(16×
16)的块。
对每一块在过去帧中范围为的范围内进行搜索,以求得最优匹配,从而得到运动矢量的估值(dx,dy)。
衡量匹配好坏的准则可以是均方误差最小准则。
搜索方法可以是全局搜索法,即对搜索范围内的每一点都计算均方误差,选最小值即对应最优匹配,如图2.8所示。
3MPEG-2编码器原理
3.1MPEG-2的编码方式
MPEG-2有三种编码方式:
帧内压缩编码方式,见图3.1;
帧间压缩编码方式,见图3.2;
帧内及帧间压缩编码方式,见图3.3。
图3.1帧内压缩编码方式
压缩就是将视频信号中冗余减少的过程,首先必须识别每个视频场和帧中的冗余,这主要包括空间与时间上的冗余。
去除视频信号空间冗余可通过DCT变换来完成,DCT变换是一个无信号损失的双向数学过程。
它将空间分布的变化程度转变成重现空间分布所需的频率带宽。
变换所得到的系数值既可以代表不断增加的更高的垂直和水平空间频率,也可以代表不同的水平和垂直空间频率组合。
视频信号经过DCT变换后,较高的空间频率系数会变得非常细小,而据人眼的视觉特性,较高的空间频率系数可以少量的比特来表示,或者完全去掉而不影响图像质量。
在实际应用时为保持信号的可逆性和无损性,常常采用更多的比特来表示DCT系数。
去除视频信号时间冗余,可使用有运动补偿的帧间预测来完成。
对于活动图像多数情况下只是其中的很少一部分图像在运动,即使有大范围的活动部分,前后帧尽管有很大区别,但移动物体本身大多数情况下是相同的。
因此只需要找到图像中某一部分运动了多少就可以在前一帧找到相应图像的内容,这个查找过程称为运动估值,其表达方式是运动矢量;
而把前一帧相应的运动部分补过来,得到其剩余的不同部分的过程称为运动补偿。
就这样,采用运动补偿可以有效地去除视频信号在时间方向的重复信息,达到压缩的目的。
为了达到减少数据的目的,MPEG-2将4:
2:
2转换成4:
0,并且通过量化,将代表每一个系数的比特数目减少。
一般使用11比特来代表DCT系数,对于其他系数则采用较小的比特数目。
每一个或每组宏块都有不同的量化刻度,对每个宏块采用不同的量化因数,使只含帧内压缩的MPEG能提供比同样图像质量的M-JPEG多出10%—20%的压缩效果。
而相对于原来的DCT系数的数据,量化表及被量化的系数数据量要小得多。
图3.2帧间压缩编码方式
在量化过程后,无损数据压缩是通过可变长度编码VLC和游程长度编码RLC实现的。
VLC是在数据内寻找共同的图案或字符,采用较小数量的比特为经常出现的数值进行编码,而用较多数量的比特为较少出现的数值进行编码。
RLC是用一个字符代表一串一定数目的零。
总的目的只有一个,减少数据量。
量化表控制是一个决定如何量化DCT系数的过程;
输出缓存可维持数据流,并提供量化器的控制,从而限制或维持数据流在一个一定的水平。
在实实际应用中,当压缩数据被录像机记录时,需要提供一个持续不变的比特率,以使机械部分以稳定的速率旋转扫描机构。
而对于硬盘记录来说,又需要一个可变速的比特率。
通常,一个可变速比特率是提供一个持续不变质量水平的较好选择。
图3.3帧内及帧间压缩编码方式
帧间压缩一般是在未压缩的图像上进行,是一个无损过程。
在图3.4中,在参考帧帧存中有一副完全解析度,完整数据的前一副图像。
在预测帧帧存中拥有一个根据前一帧和运动矢量所建立的预测的当前帧。
输出是预测的当前帧与实际当前帧相减后的差值。
若没有运动或其他变化,当前帧便可得到完美的预测,差分帧输出为0(极易压缩)。
当前一帧和后一帧有点不同时,差分帧仍有少量数据需要压缩。
采用帧内压缩编码形成的图像称为I帧,形成过程见图3.3;
采用帧内及帧间压缩编码形成的图像称为B帧和P帧。
P帧为前向预测帧,是以前一个I帧为预测帧进行编码的。
在I帧和P帧中间可以插入若干个B帧,B帧是从相邻的最近的I帧或P帧作双向预测进行编码的。
形成P帧时参考帧帧存只要求存储一帧图象,而形成B帧时,参考帧帧存则需存储前后两帧图象。
由三种相互间有预测与生成关系的不同的帧数据,I帧P帧B帧数据按照不同的组合组成图像组(GOP),再加上序列起始码和序列头等数据组成图像序列或ES,ES再打包成PES;
PES再按188byte的固定长度加上各种参数组成传送码流TS。
3.2PAL解码器
主要功能是对输入的PAL复合信号进行解码,输出YCbCr分量信号(4:
2:
2)。
PAL解码器质量对整个处理系统的性能指标有非常重要的作用,并将影响最终的图像质量,在设计时常采用8倍色度负载波对输入的模拟信号进行采样,用数字梳状滤波器完成亮色分离。
同时为了避免视频信源的抖动影响后面的压缩处理部分,在PAL解码器与前处理模块之间有一帧的帧存进行信号隔离。
前处理模块该模块原理如图3.4所示。
主要功能:
<
1>
给PAL解码器和I帧编码器提供像素接口控制信号,其参数受CPU控制。
2>
对PAL解码器输出的视频信号进行必要的限幅,使其满足CCIR601的要求(Y:
16-235,C:
16-240),并对Cb和Cr信号做扣心(Coring)处理。
3>
提供D1接口,可和数字视频设备直接相连。
4>
在ES码流的目标码率较低时(如低于3Mbps),启动1个16阶的滤波器,对信号进行低通滤波,使其频带限制在3.5MHz左右,以降低解码恢复的图像中的块效应。
5>
产生一个锯齿波视频测试信号,在CPU的控制下和输入信号进行切换。
另外,为了适应不同的码组长度可使用截短的RS码,例如DVB和GA。
GA采用RS(207,187,10),即分组码符号长度为207个,187个信号符号,可检出207-187=20个错,可纠正(207-187)÷
2=10个错。
该码就是从RS(255,235,10)码截短而得到的,实际上可以看成255个符号中除207个有具体的值外,剩余的48个符号全部添零,可以用同样的电路进行编解码。
在DVCPRO、DVCAM、Digital-S格式中视、音频数据的内码组为RS(85.77)码,检错能力为85-77=8byte,纠错能力为(85-77)÷
2=4byte。
视频数据的外码组为RS(149.138),在内码组指出错误位置时能纠错149-138=11byte。
音频的外码组为RS(14.9)码,在内码组指出错误位置时14byte中有不多于14-9=5byte的错误都能得到纠正。
而BetacamSX的视频内码组为RS(124.112)外码组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字视频 信号源 编码器 解码器 研究
![提示](https://static.bdocx.com/images/bang_tan.gif)