VCD激光视盘机基本原理.docx
- 文档编号:5902015
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:46
- 大小:52.39KB
VCD激光视盘机基本原理.docx
《VCD激光视盘机基本原理.docx》由会员分享,可在线阅读,更多相关《VCD激光视盘机基本原理.docx(46页珍藏版)》请在冰豆网上搜索。
VCD激光视盘机基本原理
窗体顶部
窗体底部
视盘基础知识-----资料来源
1
第四章VCD激光视盘机基本原理
VCD激光视盘机是在激光CD机的基础上发展起来的,它沿用了CD机的激光头,伺服系统,控制系统以
及机械系统,两者的结构具有极大的相似性.
VCD光盘采用了CD光盘的记录格式.按照MPEG-Ⅰ标准压缩处理的VCD音视频数据信号录制在CD格式
的音频数据记录区,VCD视盘机在CD机基础上相应增加了MPEG-Ⅰ标准的VCD音视频解码电路,这就是两
种机器最大差别.
第一节CD/VCD光盘信号的记录
CD光盘上记录的音频信号要先按照规定的信号和记录格式处理成复合数字信号,再用该复合信号去控
制激光调制器的通断,使其在光盘上刻制如图4-1-1所示的信息坑点,这些具有长短变化的坑点代表了该
复合信号,这样,就可将音频信号记录在光盘上.
CD/VCD光盘有8cm和12cm两种直径规格,通用使用12cm光盘.图4-1-2所示是CD光盘信号记录处理
流程.下面对图中各部分的作用分别说明.
一,低通滤波器
用于消除有效音频信号频带范围以上的干扰信号,防止A/D转换时出现重叠镜像噪声.
二,模数转换器ADC
对模拟音频信号进行采样保持,量化,脉冲编码等A/D转换处理,将模拟音频信号转换成16位二进制
的数字信号.
CD音频信号的量化位数采用16位,数据传输的时钟频率=采样频率×量化位数,对于立体声来说,每
一声道数据传输时钟=44.1KHz×16=705.6KHz.由于CD录制信号的左,右声道的数据字是交替排列,为了
使数据流在正确的时标内能保持原有的音频信息,所以数据传输的时钟频率必须提高到原来的两倍,即
705.6KHz×2=1.4112MHz.
VCD视频信号采样值的量化位数采用8位,在A/D转换时被变换成8位二进制数字信号.VCD音频信号
采样值采用16位量化等级,被转化为16位二进制数字信号.VCD音视频数字信号接着被送到MPEG-1编码
器进行压缩编码处理,其中视频信号的压缩率为1/120~1/130,音频信号的压缩率为1/6.
三,多路复用器1
将左右声道数据信号交替混合在一起.
四,交叉交织里德索罗门编码
参见第二章第二节.
五,控制字
数据字在完成交叉交织里德索罗门编码后,经过多路复用器2时,还要插入一个8位的附加数据字,
这个附加数据字称为控制字或子码.控制字的作用是提供光盘所录制信号内容的一些信息,控制字中的每
一位都有识别标识.控制字位于音频数据流之后,同步字之前一起录入光盘.
光盘在播放时,控制字由CD-DSP识别出来,每一位控制字被插入到指定的存储器中,通过以固定时间
间隔对有关的存储器进行分析,从而确定在过去一段时间里已读出的信息.
CD和VCD视盘机一般只使用控制字的P,Q两种子码,而其余几种主要是供计算机显示器和显示图形的
EFM
调制
交叉交织里
德索所门编
码CIRC
左声道
右声道
ADC
ADC
多路复
用器1
多路复
用器2
控制字
P~W
多路复
用器3
激光调
制器
同步字至光盘
图4-1-2
视盘基础知识-----资料来源
2
有关软件使用.P码一般用于释放音频数据信号而准备静噪的静噪电路,Q码则包含有大量的信息:
总的播
放时间;总的音乐轨迹数量/或曲目数;识别单个音乐轨迹或单首曲目的始末点;每一首/段音乐的重放时
间;音乐的结束信息(以便自动停机操作);去加重信息(是否具有杜比环绕声).
另外,Q码还包含复印,目录号,光盘制造日期以及其它不常用的其它信息.光盘总的播放时间和音乐
轨迹/曲目数构成光盘的内容目录表,即TOC,TOC是CD/VCD机播放光盘所必备的信息.
六,EFM调制
EFM是英文Eight-FourteenModulation的缩写,即8位扩展到14位的调制.EFM是在数据加入控制
字之后的又一重要信号处理过程,在该处理过程中,每组16位CD音频数据串被分成两组8位数据字按一
定的规则扩展为14位.这种EFM调制能够非常有效地解决数字信号在录制和读取过程中出现的一些问题.
参见第二章第二节.
七,耦合位
在每两个14位数据字之间都排列有三个附加位,这三个附加位称为耦合位.
当上一个14位数据以1结尾,而一个14位数据以1开始时,在记录信号中就会出现了连续两个1的
情况,为这消除这种情况,就在两个14位数据字之间加入耦合位.微处理器通过分析最末一个数据字的信
号,来控制三个附加位的内容,使其满足前述EFM调制规则.耦合位在CD/VCD机中无其它作用,它将由CD/VCD
机中的解码器识别出来并逐位滤除.
八,凹坑长度
数据录在CD/VCD光盘上的最终时钟频率4.3218MHz.任何一个凹坑长度都是该时钟周期的整数倍,由
于进行了EFM调制处理,最短凹坑的时间长度为3T,最长为11T,共有九种不同长度的凹坑录制在光盘上.
在播放光盘时,与数据信息相关的各种不同的凹坑长度将不断出现,每一种凹坑长度将产生出时钟频
率的一种谐波.时钟频率关系到CD/VCD机中的CD信号解码器内部的压控振荡器(VCO)的工作频率,VCO通
常工作于2倍时钟频率,即4.3218×2=8.6436MHz.
九,同步字
在数据处理过程,最后被插入的信息是同步字,同步字中作为待处理数据的起始点,也作为光盘转速
控制电路的比较信号.
同步字不同于光盘上所有其它数据信息,它是该24位数据组成:
100000000001000000000010.
第二节CD/VCD信号的记录格式
一,记录帧格式
一个完整的信息帧由同步字,控制字(子码),耦合位,纠错位以及音视频数据字组成,同步字位于一
帧之中所有数据字的最前面,1帧共有588个数字位.
由于1帧包含CD音频左右声道的六个采样点,而采样频率为44.1KHz,故帧频:
FS=44.1KHz/6=7.35KHz;
记录读出时钟频率=7.35KHz×588位/帧=4.3218MHz.
二,帧组格式
由98个7.35KHz的帧构成一个帧组,又称扇区.帧组是98帧纵向排列而成.帧组的头两帧子码是S0
和S1两个14位数字.它是在前述EFM调制过程中剩余里挑选的.因此,帧组中的子码就成了由96×8bit
构成一个子码组(块).S0和S1作为子码帧组的同步和识别码.
因为子码中含有播放节目的时间,章节等信息,因此光盘在播放过程中可以实现快速选曲,选时.
第三节图像压缩编码和解码原理
一,图像压缩的基本途径
图像的数据量极大,必须对其数据总量大大压缩,才能够存储在直径12cm的光盘上.在实用技术上,
可通过以下途径来压缩图像数据的总量.
1,采用亮度(Y),色度(C)取样方式
视盘基础知识-----资料来源
3
实用彩色电视技术没有传输,处理红,蓝,绿三基色信号,而传输,处理亮度信号Y和色度信号C.这
种处理方法有利于实现彩色电视和黑白电视的兼容,也利于限制彩色电视信号的频带宽度.在数字图像处
理技术中,仍然采用传输,处理亮度信号Y和色度信号C的方法.由于人眼晴对亮度信息敏感,对彩色信
息不够敏感,因而对Y信号以较高清晰度传送,对C信号以较低清晰度传送.实际作法是这样的:
对每个
亮度Y像素都进行传送;而将色度C分解为U,V两个色差信号(或写为Cb,Cr,B-Y,R-Y),分别进行传送;
对亮度Y实行逐点取样,而对色度C则取样较少.即对应于4个亮度取样点,仅对色度信号取样1个点,
即对U,V像素的取样较低,各取1个取样点,这种取样格式称为YUV411格式.
采用YUV411取样格式后,它的数据总量将比三基色取样量格式时减少一半.若采用三种基色取样方式
时,各基色应与亮度信号取样方式一样,即对每个红,绿,蓝色采取逐点取样的方法.采用Y,C传输方式
时,取样次数减少一半,传输数码也减少一半.人眼睛对色度的敏感程度较低,利用人眼睛这一生理视觉
特性,人们在主观感觉上并没有感到图像清晰度下降.显然,这是压缩图像数据码率的一个得力措施.
2,将整幅图像分割为小区域进行分割处理
对图像进行数据处理时,对每帧图像进行分割处理.首先图像横向切成若干条,每一条称为一片,将
每一片再纵向切成若干块,称宏块,宏块是图像压缩的基本单位.每个宏块的彩色图像可用1个亮度信号Y
和两个色差信号Cb,Cr(即U,V)来表示,或者说,每个宏块分为三层,一层亮度Y,两层色度(各为Cb,
Cr),统称为一个宏块.
由于人眼睛对亮度,色度的主观敏感程度不同,通常把亮度宏块再平均分成4块,每一小块称为像块
或区块,见示意图4.3.1.每个区块可以进一步分割,
称为像素或像点,像素是构成图像的最小单位.对于
数字图像来说,每一个像素作为一个取样点,有一个
对应的取样数值.可以看出,图像分割越细,像素数
越多,取样点越多,图像清晰度越高;反之,像素数
越少,图像清晰度越低.实际上,对图像压缩处理,
就是对图像区块的数据,像素的数据进行压缩处理.
彩电制式不同,分割图像的具体数据将有所变化.例如PAL制,大多数为625行扫描标准,那么每帧
图像被切为18片,每片再切成22个宏块,即每帧图像分成396个宏块;而525行的NTSC制,每帧图像被
切为15片,每片再切成22个宏块,即每帧图像分成330个宏块.对亮度信号来说,每个宏块又分为4个
区块,每个区块含有8×8=64个像素,则每个宏块含有256个像素.但对两个色差信号来说,宏块像素数
等于区块像素数,即像素数是8×8=64个,是亮度像素的1/4.尽管两色差信号的像素较少,清晰度低,但
不影响人眼睛的主观感觉.在进行数字图像处理时,按照图中各个8×8方块(共64块)编成次序,再按
照编号顺序依次处理.也就是说,以8×8像素的方块作基本操作单元,依次处理每个像素(即取样点)的取
样数值.
3,采用帧间和帧内数据压缩技术
实用电视每秒钟传送25-30帧画面,使画面变化具有连续感,电视活动图像是由各帧画面差别很小的
一系列画面组成的.各帧画面的微小变化主要表现于画面主体部分,画面的背景差别很小.图像是由亮度,
色度信息来描述的,在各相邻帧图像内,若分别比较同一相对位置的亮度,色度信号,通常其差别较小.
5
8×8
5
8×8
1
8×8
2
8×8
4
8×8
3
8×8
图4.3.1
视盘基础知识-----资料来源
4
经大量统计发现,在各个像素当中仅有10%以下的像素点的亮度差值变化超过去时2%,而色度差值变化在
0.1%以下.在各帧图像中具有大量重复内容,这些重复内容的数据属于多余(冗余)信息,于是,可以通过
减少时域冗余信息的方法,即运用帧间数据压缩技术,来减少图像传输的数码率.
经分析发现,在同一帧画面内也存在相当多的冗余信息.对图像主体部分和眼睛最敏感的部分,应当
准确,详细地处理,需要对每个像素点进行精细传输;但对于图像非主体部分和眼睛不敏感的部分,则可
以进行粗略地处理,即进行信息数据的压缩处理.于是,可以根据一帧图像内容的具体分布情况,对不同
位置可采用不同的数据量来传送,减少传送图像的数据量,使图像数据得到压缩.这种压缩数据的方法,
是在同一帧图像的不同空间部位进行数据压缩,称为空间域冗余压缩.例如,有一幅人像画面,其面部和
头部的线条清晰度可以不相同,尤其是眼睛,嘴唇部位表情丰富,线条比较精细复杂,是观众最注意的部
位,应当用高清晰度传送;而头顶部位和面颊侧面,轮廓变化较少,灰度层次变化较小,观众不太注意这
些部位.显然,图像的主要部位,灰度层次变化较大的部位,人眼睛敏感的部位,应当以较大数据量进行
精细传送;而那些图像的次要部位,灰度层次变化较小的部位,人眼睛不注意的部位,则可用较少数据量
进行粗略传送,甚至于仅仅传送它们的平均亮度信息.
以下具体讨论数字图像的数据压缩原理.先讨论静止图像的数据压缩技术,即帧内数据压缩技术;然
后讨论活动图像的数据压缩技术,即帧间数据压缩技术.
二,帧内数据压缩技术
首先对整幅图像进行分割处理,经分割取得最小操作单元.下面按8×8=64个像素组成的区块来讨论.
每一个像素值都可以按一定规律取样,例如可对亮度各个像素的亮度值取样,若每个像素按8bit量化,则
每个区块的总数据量为8bit×64(像素点),即512bit.可见,对全画面各像素量化处理后数据量十分庞
大,需要进行数据压缩.通常,经过离散余弦变换,Z字型扫描,可变长度编码等处理过程,可将数据总量
进行大量压缩.
1,离散余弦变换(DCT)编码
1)功能简述
离散余弦变换简称为DCT(是英DiscreteCosineTransform的缩写词),是一种数字处理方法,经常
用于数据处理.DCT是多种数字变换方法的一种,它是把空间域图像变换到频率域进行分析的方法.由于
DCT的变换核构成的基向量与图像内容无关,而且变换核是可以分离的,既二维DCT可以用两次一维DCT来
完成,使得数学运算难度大大简化,再配以已经发现的其它快速算法,使得DCT编码得到了广泛的应用.
将DCT应用于图像数据压缩,可以减少代表图像亮度(或色度)层次数码信息,达到数据压缩的目的.利用
DCT不仅可将图像编码,还可以在编码变换过程发现图像细节的位置,以便删去或略去对视觉不敏感的部分,
而更加突出视觉的敏感部分,通过选择主要数据来传输,重视图像.
利用DCT压缩图像数据,主要是根据图像信号在频率域的统计特性.在空间域看来,图像内容千差万
别;但在频率域上,经过对大量图像的统计分析发现,图像经过DCT变换后,其频率系数的主要成分集中
于比较小的范围,且主要位于低频部分.利用DCT变换揭示出这种规律后,可以再采取一些措施把频谱中
能量较小的部分舍弃,尽量保留传输频谱中主要的频率分量,就能够达到图像数据压缩目的.
2)规律和特点
①时间域信号的频谱
视盘基础知识-----资料来源
5
对于一个随时间变化的波形来说,它是随时间变化的周期信号,它是以一定幅度值为波形的直流平均
值,其波形可看成是基波与无数次谐波叠加而成.其基波振幅最大,然后各次谐波振幅逐渐减小.各次谐
波叠加次数越高,则合成波形越接近于理想矩形波.此分析方法就是应用日益广泛的频谱分析方法.其中
各次正弦波谐波的振幅值经常称为频谱系数,将频谱系数排列起来,可以组成一个系数列.上述事实说明,
周期性矩形波可以由时间域(反映幅度-时间关系)来描述,也可以由频率域(幅度-频率关系)来描述.两
者有互相对应的关系.实际上,各种时间域信号都可以由频率域的规律来描述,两种描述方法存在内在的
联系,可以互相转换.
②空间域信号的频谱系数
对于各种空间域分布的信号,也可以进行类似的频率变换,即将空间域信号转变为频率域信号.DCT就
是其中一种频率分析方法.如图4.3.2来说明DCT变换过程.
由图像内取出一个区块,分成8×8个像素的64格阵列,即由图(a)转变为图(b).经过对逐个像素的
亮度(或讨论色度)数值取样,并将像素的亮度数值列成矩阵形表格,见图(C).然后利用离散余弦变换
(DCT)可将各空间取样值转变为频率域的数值,这里称为DCT系数.
对于上述64点阵列来说,可得
到64个DCT系数,转换为图(d)
矩形阵列表格.它已经将64个点的
图像采样值组成的阵列,变为一个
直流平均值和63个不同频率余弦波
幅值组成的64个点阵列,并称为DCT
系数阵列.经过上述变换后,已将
空间坐标的数据转换为频率坐标的
数据,即DCT频率系数.原有8×8
区块的各个像素的数值取样量化
后,转变为频率域图像信号的频谱
系数,即可用64个频率系数来表述,
称它们为64个"正交基信号",每
个基信号对应于64个独立二维空间
频率中的一个.这些空间频率是由
输入信号的"频谱"组成.所得64
个变换系数当中,第一项代表直流分量,即64个空间图像采样值的平均值,其余63个系数代表各基信号
的幅度.
观察图4.3.2(d)数据可发现规律,矩阵左上角的数值较大,而右下角的数值较小,且趋近于零值.
于是,可以按照Z字形扫描顺序,将各基信号的DCT系数列成一个表格.Z字形扫描的具体轨迹,如图4.3.2(e)
所示.按照此规律将DCT系数排列成数据系列,成为DCT系数编码顺序.经过上述处理后,已将二维数据
量转换为一维数据量,该数列第一项是该区块的平均亮度值,后面各项系数的分布和大小可以反映亮度起
伏变化的剧烈程度.若系数较大,说明亮度起伏较大,该区域图像轮廓较细致;若数值较小,则说明该区
区块
2622182024314247
2724212123293844
2725232222273643
3227192023293743
3528171924303944
2624212223304045
2122252423314245
2524242627334245
232.
3
49.041.7-2.02.32.7-2.6-0.9
-4.52.24.82.12.3-1.70.00.1
1.9-8.9-6.4-4.1-2.22.10.70.9
-0.5-4.23.32.50.10.2-0.90.0
3.30.73.76.32.2-1.1-1.5-0.4
-1.6-2.6-1.5-2.7-1.60.90.60.2
0.0-0.4-0.7-1.00.6-0.1-0.1-0.1
0.20.20.5-1.0-0.20.3-0.10.4
(a)原图(b)8×8区域
(c)各像素亮度值取样
(d)64个DCT系数(e)DCT系数的排列方式
图4.3.2DCT变换过程
视盘基础知识-----资料来源
6
内亮度变化较平缓;若数值为零,表示数列中高频分量数值为零,亮度电平无变化.在实际数据处理过程
中,排在后面的系数值基本上都是零值,或者趋于零值.由63个系数集合及变化情况,可反映出该区块内
图像细节情况,即图像清晰度状况.
图4.3.2(d)矩阵数值非常具有实用价值.左上角数值较大,它们代表了图像信息的直流成分和低频
分量,它是图像信息的主体部分,也是区块内信息的主要部分;而右下角数值较小,它们代表了图像信息
的高频分量,其幅值原本就比较小,它主要反映图像的细节部分.人眼睛对图像的亮度信息有较高的相对
灵敏度,对图像的彩色信息不够敏感;还有,人眼睛对图像信息的低频分量具有较高的视觉灵敏度.经Z
字形字扫描后所形成的数据系列,恰好与人眼睛对图像信息的敏感程度形成良好的对应关系.根据视觉生
理的上述规律,可对图像数据进行压缩.
2,DCT系数的再量化处理
经过上述DCT处理的频率数据可以进行再处理,进一步压缩数据量.人眼睛对各种频率的敏感程度不
同,并可取得统计性灵敏度数值.由此可对每种频率分量设定不同的折算值,将前述经转换得到的DCT系
数再次进行折算,以便进一步突出视觉效果影响大的成分,而削弱或忽略视觉效果影响小的成分.这种处
理方法称为量化处理,简称Q处理.对于64点阵列的64个系数来说,对应了64种不同频率,可使用64
个不同的折算值.通常称这64个折算值为量化表,每个折算值称为量化步长,或称量化值.在64点阵列
中,左上角的数据量化值较小,右下角的数据量化值较大.对DCT系数的再量化处理,可利用量化器电路
来实现.该电路可将区块的64个系数分别除以量化表中对应位置量化步长,再进行四舍五入取整后,即可
得到经过再量化处理的64个数据值.
经过量化处理后,量化值大的系数值所得商值较小,也就是数据压缩比较大,原图像相应部分的忽略
内容较多;量化值小的系数所得商数值较大,也就是数据压缩比较小,原图像相应部分不予忽略或极小忽
略.于是,经过量化处理后的DCT系数矩阵,可出现许多零值.一般左上角位置的数据的商数是非0,在右
下角位置的数据的商数很小,经四舍五入取整值后可简写为0.在系数矩阵上出现了许多0值,则大大减少
了数据量.一方面保留了图像信息的主体部分,另一方面大大压缩了像数据.
3,可变长度编码(VLC)
经量化处理的系数矩阵出现了许多0值,若进行Z字形扫描时,后面的系数将也出现连续0的状况.
此时,数据传输总量已经明显减少,但码位并未减少,仍为64个系数位.为了进一步压缩数据总量,可采
用可变长度编码,并简称VLC(VariableLengthCoding).
通常,采用两种方法进行可变长度编码.第一种,是根据数据出现的频率,分配以不同长度的码字来
代替,对于频繁出现的数据,分配以较短的码字,那些不经常出现的数据,则赋予较长的码字,这样处理
后可减少传输的总码率.第二种方法,虽然Z字形扫描使系数列尾部出现多个0个值,但不需要逐位地传
输0值,仅需传送表0的"个数"码,待重放时再按规定恢复为0位,以便填满矩阵的64位.例如00000,
则可表示为50,在解码时恢复为00000.
总之,对于静止画面来说,采用离散余弦变换,Z字形扫描,量化处理和可变长度编码等方法,可使图
像数据量大大压缩.在数据解码时,先经过可变长度解码,恢复为数据的固定长度;再对系数进行反量化,
恢复为原来的DCT频率系数;再经过反向离散余弦变换,恢复为图像的空间坐标数值,即原来图像的数据.
三,帧间数据压缩技术
视盘基础知识-----资料来源
7
对于活动图像来说,相邻帧的图像具有强烈的相关性.在保存和记录动态图像时,不需要将每一帧图
像的全部信息都记录和保存下来,可以将前面第一帧图像全部数据都记录下来,把它看成是静态图像,可
用静态图像数据压缩方法来处理.而后面诸帧图像,可以仅记录与前面帧图像有差异的信息.于是,在重
放时,利用前面帧图像的数据和后面帧的差异数据,即可恢复出后面帧的图像.这种处理方法省去许多数
据.
1,三种画面
按照MPEG-1标准,传送的活动画面可分为3种类型.第1种,是场景更换后的第1帧画面,它是一种
独立的画面,这种画面采用较高清晰度的逐点取样法进行传送,此画面称为I画面(内码帧,或称帧内编
码帧).该画面信息是由自身画面决定,不必参考其它画面.该画面的数据代表了活动图像的主体内容和背
景内容,它是电视画面的基础.第2种,是与I画面相隔一定时间,活动图像主体位置在同一背景上已发
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- VCD 激光 视盘 基本原理