视频音频基础知识合集Word文档下载推荐.docx
- 文档编号:20348838
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:38
- 大小:724.79KB
视频音频基础知识合集Word文档下载推荐.docx
《视频音频基础知识合集Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《视频音频基础知识合集Word文档下载推荐.docx(38页珍藏版)》请在冰豆网上搜索。
576)或CIF(352×
288)的标清视频格式过渡到1080P(1920×
1280)或720P(1280×
720)的高清视频格式
什么是高清
高清,英文为“HighDefinition”,意思是“高分辨率”。
一般所说的高清,有四个含义:
高清电视,高清设备,高清格式,高清电影。
高清电视
高清电视,又叫“HDTV”,是由美国电影电视工程师协会确定的高清晰度电视标准格式。
一般所说的高清,代指最多的就是高清电视了。
电视的清晰度,是以水平扫描线数作为计量的。
以下是几种常见的电视扫描格式:
D1为480i格式,和NTSC模拟电视清晰度相同,525条垂直扫描线,483条可见垂直扫描线,4:
3或16:
9,隔行/60Hz,行频为15.25KHz。
D2为480P格式,和逐行扫描DVD规格相同,525条垂直扫描线,480条可见垂直扫描线,4:
3或16:
9,分辨率为640×
480,逐行/60Hz,行频为31.5KHz。
D3为1080i格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:
9,分辨率为1920×
1080,隔行/60Hz,行频为33.75KHz。
D4为720p格式,是标准数字电视显示模式,750条垂直扫描线,720条可见垂直扫描线,16:
9,分辨率为1280×
720,逐行/60Hz,行频为45KHz。
D5为1080p格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:
1080逐行扫描,专业格式。
此外还有576i,是标准的PAL电视显示模式,625条垂直扫描线,576条可见垂直扫描线,4:
3或16:
9,隔行/50Hz,记为576i或625i。
高清电视,就是指支持1080i、720P和1080P的电视标准。
现在的大屏幕液晶电视机,一般都支持1080i和720P,而一些俗称的“全高清”(FullHD),则是指支持1080P输出的电视机。
目前的高清电视数字信号,最高支持720P,还没有能够支持1080P的。
高清设备
对于DVD播放机、摄像机、投影仪和显示器等显示设备来说,所谓的“高清”,一般就不仅仅是“720P”了,而是指“全高清”,也就是支持1920*1080分辨率的视频输出。
这些设备,通常价格昂贵。
高清格式
由于高清视频数据传输量巨大,所以需要有新的压缩算法。
现在的高清视频格式,主要有:
H.264、WMA-HD、MPEG2-TS、MPEG4和VC-1等。
其中,H.264格式目前最为流行。
所以,再购买高清碟机或者显卡的时候,一定搞清楚,设备是否支持H.264。
比如Nvidia的8400G显卡就不支持H.264,而8400GS则支持。
高清电影
所谓的高清电影,就是指以高清视频格式制作的全高清(1920*1080)视频文件。
比如蓝光DVD的视频文件,就是以h.264格式压缩的。
现在的高清视频播放,通常是通过计算机进行。
由于高清视频文件的算法复杂,计算量巨大,所以对CPU和显卡有比较高的要求。
通常情况下,一台播放高清视频的电脑,必须配备内置了硬件高清解码功能的显卡,因为完全的软解压对CPU的要求太高了。
分辨率
3022 2008-2-1511:
分辨率(Resolution)-影象清晰度或浓度的度量标准。
举例来说,分辨率代表垂直及水平显示的每英寸点(dpi)的数量。
BitWare可以用普通或标准(100乘200dpi)及精细分辨率(200乘200dpi)发送及接收传真文档。
分辨率是一个表示平面图像精细程度的概念,通常它是以横向和纵向点的数量来衡量的,表示成水平点数×
垂直点数的形式。
在一个固定的平面内,分辨率越高,意味着可使用的点数越多,图像越细致。
显示分辨率
显示分辨率是平板电视在显示图像时的分辨率,分辨率是用点来衡量的,显示器上这个“点”就是指像素(pixel)。
显示分辨率的数值是指整个显示器所有可视面积上水平像素和垂直像素的数量。
例如1366×
768的分辨率,是指在整个屏幕上水平显示800个像素,垂直显示600个像素。
显示分辨率的水平像素和垂直像素的总数总是成一定比例的,最常见的为16:
传统CRT电视所支持的分辨率较有弹性,而液晶电视的像素间距已经固定,所以支持的显示模式不像CRT电视那么多。
液晶电视的最佳分辨率,也叫最大分辨率,在该分辨率下,液晶电视才能显现最佳影像。
液晶电视呈现分辨率较低的显示模式时,有两种方式进行显示。
第一种为居中显示:
例如在XGA1024×
768的屏幕上显示SVGA800×
600的画面时,只有屏幕居中的800×
600个像素被呈现出来,其它没有被呈现出来的像素则维持黑暗。
目前该方法较少采用。
另一种称为扩展显示:
在显示低于最佳分辨率的画面时,各像素点通过差动算法扩充到相邻像素点显示,从而使整个画面被充满。
这样也使画面失去原来的清晰度和真实的色彩。
目前平板电视的分辨率主要有1366×
768和1920×
1080等几种,随着新品的不断涌现,分辨率也在提高中。
数字视频标准
虽然,早期基于复合信号(NTSC或PAL)取样的数字技术方面取得了许多经验,然而人们终于认识到.为了获得最好的质量效果。
还是必需采用分量的处理方式,第一个数字标准是分量标准,自从安培公司和索尼公司宣布了复合数字录像格式,就是后来的D-2格式,重新引起了从们对复合数字录像格式的举。
最初,这些录像机设计为模拟输入输出的设备.提供在现有模拟的N议和PAl‘环境下使用,利字输入和输出只是作为机对帆复制时使用;
然而,后期制作部门发现,如果在全数字的环境下使用,利用这些机器的多代复制性能,可以取得更大的效益。
REC601。
建议书ITU—RBT601(原先的CCIR建议书601)不是一种取样视频接口标准,而是一种取样标准。
REC601是SMPTE和EBU联合制定的,规定了525/59.94和625/50电视系统中数字分量视频信号的参数规定。
1981年SMPTE进行了一系列关键性的研究工作,结果得出了众所周知的CCIR601推荐书。
这个文件规定厂适用于525行和625行信号的取样方案。
其中规定:
亮度信号的正交取样频率为13.5MHZ两个色差信号Cb和Cr,的取样频率为6.75MHz:
Cb,Cr,与B—Y,R—Y之间有确定的比例关系:
这种取样结构又称为”4:
2:
2”。
这个术语的来出是:
早期把取样频率设定为NTSC副载频的若干整倍数。
后来,这个设想被放弃了。
但是用4来表示亮度信号的取样频率却保留下来了。
SMPTE/EBU工作小组详细考察厂从12MHz到14.3范围内的亮度取样频率,如果选定13.5MHz作为折中方案,这是因为2,25MHz是625行和525行系统的公共整倍数。
现在与取样系统有关的全部论述都是假定以4=13.5MHz为基础。
也就是说,取样基频是3。
375MHz。
某些扩展清晰度电视系统使用了一种分解力更高的格式,称为”8:
4:
4”视频取样,其带宽是4:
2的两倍。
并行分量数字标准
REC601阐述了信号的取样。
SMPTE和EBU分别制定厂适合于该取样的数据电信号接口规定。
MPTE制定厂525/59.94并行接口规定,称为SMPTE标准125M,(早期的RP—125版本),而EBUTEch3267则规定厂625/50接口(较早期的EBUTEch3246版本)。
两者都力CCIR所接受,并收入推荐书656。
这个文件定义了硬件接口。
并行接口使用11股绞线,25芯D型连接器。
(早期文件规定,连接器采用滑扣锁定方式。
后来,文件修改为使用4/40螺丝固定方式)。
这种接口按照Cb’,Y,Cr’。
Y,Cb”的顺序,将多路数据字组合起来,发送出去。
传送数据率是27M字/秒。
在每条线上都叠加定时时序SAV和EAV,以表示有效视频的起始点和终点。
有效数字行内包含720个亮度取样。
在有效行中包含了表示行消隐的区间。
REC601规定、表示视频信号的数据字的精度是8比特,在制定标准时,就有人曾经提出这个精度可能不够,应将接口精度扩展到10比特。
事实证明,在许多情况下,10比特精度确实带来好处。
因此最新版本的接口标准为10比特。
然而,也同时使用8比特的标准。
选择数—模变换器工作范围时,在峰值白电平以上和黑电平以下分别留有余量。
如图2—5所示
黑电平与白电平的量化是在8位的基础上加上两个”0”,这样就得到厂等于10位的量化级。
数值000—003和3FF—3FC保留给同步使用。
对于色差信号的量化,也采取了类似的规定。
如图2—6所示。
图2—7所示是取样位置与数字字相对于模拟水平行的位置关系,由于EAV和SAV代表了定时信息,因此没有必要传送通常的同步信号,行消隐区(也包含场消隐区中的行正程),可以用于传送辅助数据。
很显然,这个数据空间可以用来携带数字声音。
SMPTE制定了一个文件,声音数据包的格式和分配标准作了规定。
事实已经充分证明了REC601/656广泛适合于制作与后期制作设备的技术需要,一般来说,在大型设备系统中,许多常用设备都能够代替并行接口的作用。
REC601综合了数字和分量格式应用的优点。
选择该系统,可以获得525行和625行的最高质量。
并行复合数字系统
复合视频信号以4倍(NTSC;
或PAL)副载波频率进行取样对于NTSC:
得到的标称取样频率是14,3MHz,而PAL制为17.7MHz。
NTSC的接口标准是SMPTE244M。
在编写本文时,EBU正在制定关于PAL制的接口标准。
两种接口标准都规定为10比特的精度。
虽然D2和D3格式记录在磁带上的精度只有8比特,NTSC信号的量化规定是(示如图2。
8)100%彩条信号最高幅度上部留有适当余量同步顶以下留有较小余量,对于分量信号也具有类似的特征。
根据PAL复合数字信号的规定,为了减小量化噪声,充分利用厂最大可用的数字范围,
由图2—9可知,峰值模拟信号的值实际上已经超过厂数字的动态范围,这样就有可能出现错误。
由于规定歹取样轴,副载波和最高亮度条(如黄色条)相位的基准,所以取样决不会超出数字的动态范围。
所包含的数值如图2-10所示。
与分量接口—样,复合数字信号的有效行中足以表示模拟的有效行和模拟的消隐边沿信号,与分量接口不同的是,复合接口发送的数字信号表示的行消隐期间普通的同步和色同步信号。
在复合接口上,还传送表示场同步和均衡脉冲的数字信息。
复合数字设备具有数字处理和接口的各种优点,九其是数字录象的多代复制性能。
然而,也存在一些局限性。
由于是复合方式的信号就存在NTSC和PAL编码方式的烙印,其中包含这些编码方式所固有存在的窄带色度信息的问题。
例如在色键这样——类处理中,往往不能满足高质量制作的要求,必须分离出分星信号,取得健信号就必须进行分离处理。
在某些应用情况下,例如在数字特技中,为了便于处理,要求将信号解码成为分量倍·
号,最后再重新编码成为复合信今此外、在8比特录象机中,复合信号的满幅值表示成256级电平。
总而言之,与模拟方式的NTSC和PAL设备相比,复合数字方式能够提供更加有效的应用环境。
对于许多用户来说,花上这些代价还是值得的。
与分量数字方式——样,并行复合接[1使用多芯电缆和25芯“D”型连接器。
实践证明,对于/j1型和中型尺—寸的设备来说、这样的用法是满意的。
但对于大型设备系统来说,还是滞要使用串行接口。
关于D1格式全带宽数字电视系统的测试
---广东电视台邢卫东
一D1格式全带宽数字电视信号及其产生
全带宽数字电视是指未经压缩的数字电视。
D1格式是符合ITU-RBT601-2标准的全带宽数字分量电视信号格式。
我们着重讨论625行的D1格式信号。
数字电视系统分别在Y、B-Y和R-Y上取样和量化就形成了全带宽的数字分量电视信号。
按照ITU-RBT.601—2标准,D1格式的总取样频率为27MHz,其中分配给Y为13.5MHz、B-Y为6.75MHz、R-Y为6.75MHz。
我们知道,从CCD摄像机输出的RGB模拟分量信号(30MHz带宽以上),在采用隔行扫描方式及[YB-YR-Y]矩阵线性变换后,其带宽大致降至10MHz,其中亮度信号占了一半带宽。
所以,D1格式的取样在反映这样一种信号结构上是合理的。
D1格式信号最初采用8bit量化,后来修正为10bit量化,其并行输出码率为27Mb/s。
当D1格式使用串行输出时,必须引入一个时钟频率是D/A转换时钟频率10倍(270MHz)的移位寄存器进行并、串转换,使寄存器的移位对应10bit数据的每一位,并且与并行信号保持相同的速率。
D1格式的串行输出码率为270Mbit/s。
D1格式串行分量接口采用负极性的不归零变换编码(NRZI),从而使得数据流对极性不敏感,不管什么极性,只要有跳变,就可通过跳变来恢复信号。
换句话说,信号的上升沿和下降沿均可用来表示信号,这样即便是全“1”的信号,进行NRZI后的信号频率也仅是时钟频率的一半。
另外,在D1中,应用了扰码技术对串行流进行随机加扰,连“1”的信号几率减少,高频分量也就进一步减少。
经过扰码的数据“0”、“1”分布更加均匀,用于线路传输还可以去除直流分量。
D1格式的串行信号不需要专门的时钟,时钟信号从串行数据中即可恢复。
这就要保证串行数据有足够的上升沿和下降沿来满足时钟恢复的需求。
在实际应用中,数字电视系统通常以串行传输为主要手段。
这主要是因为串行连接更方便、传输距离更远(标准同轴电缆中的可靠传输距离为200米)。
二全带宽数字系统的一些重要特征
同模拟系统相比,全数字电视系统带来许多新的特征,也因此带来与模拟系统不同的测试要求。
我们从几个方面来论述这些特征。
1数字数据流及其误码
当模拟电视信号转换为数字信号后,我们考察数字串行系统,信号不再是类似模拟系统的载波信号。
在全数字系统中,数字串行信号不再被调制到载波上传输,而是直接在基带上传输,直接表现为高低电平间的转换。
在合适的示波器上观察,高低电平间的跳变产生的波形类似于“眼睛”(这是多次扫描的路径由于示波管的余辉而重叠的结果)。
当高、低电平之间的跳变幅度不够,或者波形沿时间轴的抖动过大,或者上升、下降沿因失真造成的畸变太严重时,都会造成“眼睛”闭合。
这种类似于眼睛的波形图称为眼图。
当眼图闭合时,系统可能不再能判断传输信号电平间的跳变,数字系统就会崩溃。
传输过程中数字电平的跳变错误称之为误码,系统崩溃是误码达到极限的一种反映。
数字视频的误码具有两个重要特征:
其一,它间隔出现,并形成在相同数据字上出现的误码群,其二,由于扰码的原因,单个比特误码也会影响到两个以上的取样值,且误码比特出现在数据字的最高位(MSE)或次高(MSE—1)位上并被发现的机会达70%以上。
一般而言,平均每场达到一次以上的误码是不可接受的。
所以,可以用视频场为单位检查误码出现的状况,如果检测到视频场的校验错误即认为出现一次误码情形。
如果用每秒节目中出现误码的次数来统计一个误码群,称之为误码秒。
2数字电视系统对信号幅值有更严格的要求
全带宽的数字电视对信号的幅值有相当严格的规定,这是因为要将10bit的数据位合理地分配给要表示的信号内容。
图4是D1格式信号的亮度和色度量化电平分配规定。
可以看到,对亮度信号的黑电平(在“040h”)和白电平(在“3ACh”),以及在黑、白电平两端留出的幅值空余都有明确的表示,信号正向峰值不能超出766.3mv(用3FFh表示),负向峰值不能超过-51.1mv(用000h表示)。
色差信号也对最正(350mv)和最负(一350mv)以及信号两端留出的空余做出了严格规定。
除了信号本身,串行视频携带的一些数字数据(如4码字的定时数据“3FF000000XYZ”)也充分利用了对电平级的这些规定。
所以,在数字系统中,A/D或D/A单元对量化电平级的准确判别非常重要,否则将造成图像损伤。
除了电平级的判别外,模拟系统和全带宽数字系统连接时,还会产生一些突出的问题。
譬如当模拟信号的幅值超过上述规定峰值时,就不能用数字信号表示。
这时,超过正向峰值的信号用“1111111111(3FFh)”表示,超过负向峰值的信号用“000h”表示。
这会带来两种不同的问题。
当连“1”的数据太长,即便经过扰码,数字信号中的高频分量也大大增加,不利于传输。
当连“0”的数据太长,则对数字时钟的恢复带来困难。
这两种情形都加重了对系统的性能要求。
3模拟失真和数字失真
增益、相位和频率响应这些对于模拟系统非常敏感的问题,在数字电视系统中不再成为问题。
一般来讲,利用数字方式进行分配时,信号会保持稳定的增益、相位和频率响应。
这主要得益于,数字信号很容易自动地保持合适的均衡度,从均衡的串行信号中可完整地恢复数字信号。
另外,数字信号在分配与切换过程中,足以在各种条件下保持信号的完整性,从而消除了群延时、行或场的时间畸变、微分增益和微分相位等失真积累问题。
值得注意的是,数字电视系统在消除这些模拟失真的同时,引入了一种数字失真,即量化误差。
量化误差是高阶非线性失真的产物,其失真表现类似于噪声,有很宽的频谱,所以也称之为量化噪声。
量化噪声不是随机的,它是数字系统固有的,量化越精细,量化噪声就越小。
另外,量化器还会产生非线性失真。
一般用信噪比来衡量数字系统的量化失真。
对于双极性的声音信号,若以n个比特量化,可达到的最大信噪比为
Smax/NQ=6.02n+1.76(dB)
单极性的视频信号,常用图像信号的峰峰值与量化误差的均方根的比值来表示信噪比
Smax/NQ=6.02n+10.80(dB)
D1格式对视频信号10bit的量化己足够精细,在量化器线性良好的情形下量化失真对信号不构成什么影响。
音频对量化失真相对敏感。
4电缆均衡和时钟再生
事实上,传输通道中存在着对数字信号造成影响的模拟失真。
譬如由电缆衰减造成的频响滚降失真、相位失真、噪声、以及由于交流耦合造成的基线漂移等。
尤其是,由于串行数字信号的时钟是从信号本身恢复而来,模拟失真会引起串行数字信号的时钟抖动。
长电缆传输是造成信号失真的主要原因,当使用传统的模拟同轴电缆进行串行数字视频传输时,由于其频响不佳,引起的损耗和失真更大。
传输通道中的其他模拟部件也会对数字信号造成损伤,一些模拟部件在D1格式下基本不能工作。
数字信号本身具有很强的纠错能力,从而能够在相当的范围内补偿这些损耗,这是数字电视系统重要特征。
通常,大多数数字设备(包括D/A转换器)都会对输入信号进行某种形式的均衡和再生处理,从送来的信号中恢复数据,并使用一个相对稳定的时钟,以清晰的波形继续传送信号,从而补偿传输中的损耗。
如图5所示,数字信号经自动均衡之后,脉冲幅度与波形得到明显改善,通过PLL(锁相环路)之后,使时钟信号获得再生。
数字视频的时钟再生包括串行再生和并行再生,串行再生相对简单,但其再生环路的带宽较大,PPL环路带宽内的抖动也可再生和积累。
并行再生则相对复杂,但其带宽和固有抖动都比串行再生小得多。
当数字系统的串行再生环节比较多时(比如达数十次),通常需要通过并行再生来消除串行再生的的PPL环带内的抖动积累。
5抖动及其容限
尽管可以再生时钟,抖动仍然是数字视频挥之不去的固有特征。
不仅仅是电缆传输,数字分配放大器、数字矩阵、连接器等无源器件及其它工作于数字串行格式的信号发生器、接收器和处理设备都会造成抖动以及其它失真。
一般说来,当时钟(准确地说是从抖动的串行信号中恢复的时钟)的正向跳变沿能够确定在眼图的中间位置或其附近,保证其正确的触发时,抖动就是可以承受的,或者说是容许的。
图7反映了接收机对抖动的灵敏度。
从图中可以看出,接收机对10Hz以下的低频抖动(即摆动)不太敏感,可以承受2个眼图宽度(UI:
UnitInterval)的抖动,这主要是因为低频抖动在一定程度上可能对时钟边沿确定在眼图的中间位置有利;
随着抖动频率的增加,接收机对抖动的承受力降低,到了10kHz,接收机只能承受0.24UI。
6崩溃点特性和系统的承载能力
崩溃点特性是数字电视系统的一个非常典型的特性,即直到出现崩溃(cliff)状态之前,节目信号仍然保持完好无缺。
在崩溃点出现时,系统的承载能力达到极限,视频信号重现质量突然恶化。
这同模拟系统有天壤之别。
在模拟系统中,失真是逐渐积累的,节目信号渐次变差,直至系统承载能力达到极限。
崩溃点特性在系统测试中非常重要,可以通过对系统“加压”直至系统崩溃来了解系统工作时存在的承载“余量”,这对评价一个数字电视系统非常重要。
可通过几个方面来考察系统的承载能力:
1)加长电缆(可用实电缆,也可用电缆模拟器),考察系统对长电缆带来的各种损耗和失真的承受力;
2)利用长“1”和长“0”串特殊信号,对系统的时钟恢复和PPL锁相进行“加压”,以检测其承受能力;
事实上,由于扰码,数字系统中可能存在此类信号,譬如,一些色彩平坦的场的亮度和色差信号的隔行扫描就会产生相当长的“0”串;
3)对自动均衡“加压”,考察均衡器模拟功能的线性程度;
这也可以通过施加特殊的信号实现,譬如长“0”串的信号产生的高直流分量间的切换,会在线性程度不好的自动均衡器上引起误码。
上述2)3)项通常叫串行数字接口SDI检测,其检测信号由一种特殊的全场信号“SDI检测场”提供。
7定时问题
和模拟视频一样,数字视频也需要“同步”。
不过在D1格式视频信号的量化规定中,并没有为“同步头”留下量化空间,而是在每个视频有效行(720个亮度码字+2×
360个色度码字)的开始前
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视频 音频 基础知识