音视频格式教材.docx
- 文档编号:23739613
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:35
- 大小:545.73KB
音视频格式教材.docx
《音视频格式教材.docx》由会员分享,可在线阅读,更多相关《音视频格式教材.docx(35页珍藏版)》请在冰豆网上搜索。
音视频格式教材
音视频编码全攻略
视频编码标准
数字视频技术广泛应用于通信、计算机、广播电视等领域,带来了会议电视、可视电话及数字电视、媒体存储等一系列应用,促使了许多视频编码标准的产生。
ITU-T
与ISO/IEC
是制定视频编码标准的两大组织,ITU-T的标准包括H.261、H.263、H.264,主要应用于实时视频通信领域,如会议电视;MPEG系列标准是由ISO/IEC制定的,主要应用于视频存储(DVD)、广播电视、因特网或无线网上的流媒体等。
两个组织也共同制定了一些标准,H.262标准等同于MPEG-2的视频编码标准,而最新的H.264标准则被纳入MPEG-4的第10部分。
注1:
ITU-T的中文名称是国际电信联盟远程通信标准化组(ITU-TforITUTelecommunicationStandardizationSector),它是国际电信联盟管理下的专门制定远程通信相关国际标准的组织。
该机构创建于1993年,前身是国际电报电话咨询委员会(CCITT是法语ComitéConsultatifInternationalTéléphoniqueetTélégraphique的缩写,英文是InternationalTelegraphandTelephoneConsultativeCommittee),总部设在瑞士日内瓦。
由ITU-T指定的国际标准通常被称为建议(Recommendations)。
由于ITU-T是ITU的一部分,而ITU是联合国下属的组织,所以由该组织提出的国际标准比起其它的组织提出的类似的技术规范更正式一些。
ITU-T的各种建议的分类由一个首字母来代表,称为系列(见下文),每个系列的建议除了分类字母以外还有一个编号,比如说"V.90"。
注2:
ISO是一个国际标准化组织,其成员由来自世界上100多个国家的国家标准化团体组成,代表中国参加ISO的国家机构是中国国家技术监督局(CSBTS)。
ISO与国际电工委员会(IEC)有密切的联系,中国参加IEC的国家机构也是国家技术监督局。
ISO和IEC作为一个整体担负着制订全球协商一致的国际标准的任务,ISO和IEC都是非政府机构,它们制订的标准实质上是自愿性的,这就意味着这些标准必须是优秀的标准,它们会给工业和服务业带来收益,所以他们自觉使用这些标准.ISO和IEC不是联合国机构,但他们与联合国的许多专门机构保持技术联络关系.ISO和IEC有约1000个专业技术委员会和分委员会,各会员国以国家为单位参加这些技术委员会和分委员会的活动。
ISO和IEC还有约3000个工作组,ISO、IEC每年制订和修订1000个国际标准。
IEC是国际电工委员会(InternationalElectrotechnicalCommission)的缩写,是非政府性国际组织和联合国社会经济理事会的甲级咨询机构,正式成立于1906年成月,是世界上成立最早的专门国际标准化机构。
总部设在日内瓦。
1947年ISO成立后,IEC曾作为电工部门并入ISO,但在技术上、财务上仍保持其独立性。
根据1976年ISO与IEC的新协议,两组织都是法律上独立的组织,IEC负责有关电工、电子领域的国际标准化工作,其他领域则由ISO负责。
IEC的宗旨是促进电工、电子领域中标准化及有关方面问题的国际合作,增进相互了解。
为实现这一目的,出版包括国际标准在内的各种出版物,并希望各国家委员会在其本国条件许可的情况下,使用这些国际标准。
IEC的工作领域包括了电力、电子、电信和原子能方面的电工技术。
现已制订国际电工标准3000多个。
编码格式---视频
MicrosoftRLE :
一种8位的编码方式,只能支持到256色。
压缩动画或者是计算机合成的图像等具有大面积色块的素材可以使用它来编码,是一种无损压缩方案。
MicrosoftVideo1:
用于对模拟视频进行压缩,是一种有损压缩方案,最高仅达到256色,它的品质就可想而知,一般还是不要使用它来编码AVI。
MicrosoftH.261和H.263VideoCodec :
用于视频会议的Codec,其中H.261适用于ISDN、DDN线路,H.263适用于局域网,不过一般机器上这种Codec是用来播放的,不能用于编码。
Cinepak:
Cinepak可能是一般用途编码的最安全选择。
Cinepak的主要好处是该编码已安装于大多数机器上,并且即使在较旧的机器上,例如Intel486计算机,也可正确地播放视频。
其缺点是,若和其它的编码方式相比,其质量较差,并且文件大小也较大。
IntelIndeoVideoR3.2 :
所有的Windows版本都能用Indeovideo3.2播放AVI编码。
它压缩率比Cinepak大,但需要回放的计算机要比Cinepak的快。
IntelIndeoVideo4和5 :
常见的有4.5和5.10两种,质量比Cinepak和R3.2要好,可以适应不同带宽的网络,但必须有相应的解码插件才能顺利地将下载作品进行播放。
适合于装了Intel公司MMX以上CPU的机器,回放效果优秀。
如果一定要用AVI的话,推荐使用5.10,在效果几乎一样的情况下,它有更快的编码速度和更高的压缩比。
IntelIYUVCodec :
使用该方法所得图像质量极好,因为此方式是将普通的RGB色彩模式变为更加紧凑的YUV色彩模式。
如果你想将AVI压缩成MPEG-1的话,用它得到的效果比较理想,只是它的生成的文件太大了
H.264:
随着HDTV的兴起,H.264这个规范频频出现在我们眼前,HD-DVD和蓝光DVD均计划采用这一标准进行节目制作。
而且自2005年下半年以来,无论是NVIDIA还是ATI都把支持H.264硬件解码加速作为自己最值得夸耀的视频技术。
H.264到底是何方“神圣”呢?
H.264是一种高性能的视频编解码技术。
目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(AdvancedVideoCoding,AVC),而且它将成为MPEG-4标准的第10部分。
因此,不论是MPEG-4AVC、MPEG-4Part10,还是ISO/IEC14496-10,都是指H.264。
H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。
举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1!
H.264为什么有那么高的压缩比?
低码率(LowBitRate)起了重要的作用,和MPEG-2和MPEG-4ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。
尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。
H.264的优势:
1.低码流(LowBitRate):
和MPEG2和MPEG4ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。
显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。
2.高质量的图象:
H.264能提供连续、流畅的高质量图象(DVD质量)。
3.容错能力强:
H.264提供了解决在不稳定网络环境下容易发生的丢包等错误的必要工具。
4.网络适应性强:
H.264提供了网络抽取层(NetworkAbstractionLayer),使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。
X.264:
x.264是H.264编码的一个开源分支,它符合H.264标准,其功能在于编码(encoding),而不作为解码器(decoder)使用,X264编码最大的特点在于注重实用,它在不明显降低编码性能的前提下,努力降低编码的计算复杂度,X264对于H.264编码中的一些复杂编码特性做了折衷处理,其压缩视频体积小于Xvid(MPEG4)编码视频,以小体积、高画质的特点得到了很多网友的认可。
H.264与X264目前大多采用MKV封装格式,这是一种新兴的多媒体封装格式/容器,可以将各类视频编码、16条或以上不同格式的音频和语言不同的字幕封装在一个文件内,它具有开放源代码、音视频编码丰富、网络亲和性好等优势,已经得到众多视频压制组和玩家的支持,正逐渐成为高清视频的主流视频格式。
MPEG-2/MPEG-4:
MPEG-2/MPEG-4编码标准,是由MPEG工作组(MovingPictureExpertsGroup运动图像专家组)发布的视频与音频压缩国际标准。
MPEG-2编码于1994年发布,常用于广播信号(卫星电视、有线电视)的视频和音频编码,经过后期不断修改,不仅成为DVD的核心技术,还应用于HDTV高清电视传输。
MPEG-2编码压缩技术的特点是:
1、去除空间冗馀,即:
识别视频画面中的重要元素,移除重复、基本无影响、人眼容易忽略的元素;2、去除空间冗馀,即:
利用视觉暂留现象,去除时间轴上相似视频画面的冗馀,进行视频压缩;3、可变比特率,即:
根据动态画面的复杂程度,适时调整数据传输率/比特率,实现适合一致的编码效果与流畅均衡的视频效果,在DVD应用中,其最大比特率可达10.4Mbit/S。
由于MPEG-2编码的压缩率较低,它主要用于DVD片源标准(720*480分辨率/NTSC制式、720*576/PAL制式),在DVD标准下,MPEG-2编码的视频文件主要采用MPG、MPE、MPEG、M2V与VOB格式。
对于720P/1080P高清视频而言,MPEG-2编码压缩的文件体积较大(120分钟时长、体积20GB以上),在HDTV标准下,MPEG-2编码的视频文件主要采用TP和TS封装格式。
其中,TS格式是一种较为先进的封装格式,BD蓝光原盘即采用TS封装,它在视频和音频打包时提供时间戳,保证了任何时间段(分离)的音画同步.
MPEG-4编码于1998年发布,它继承了MPEG-2编码的优势,进一步优化了压缩率,改进了网络传输性,加强了版权保护与字幕、音轨的支持,并大幅扩展和延伸了多领域的应用框架,它不仅应用于语音传输(可视电话)、网络视频、光盘存储与电视广播,而且发展出一系列子标准。
其中,MPEG-4Part2标准便是十分常见的Divx、Xvid编码,它们(尤其是较新的Xvid编码)多用于压制DVDRip、AVI或MP4格式的视频文件,而MPEG-4Part10标准就是前文提到的H.264/AVC编码,其技术特点不再赘述,现在,MPEG-4已修订至Part20标准,还在不断完善。
DivX:
DivX是一种将影片的音频由MP3来压缩、视频由MPEG-4技术来压缩的数字多媒体压缩格式。
DivX由DivXNetworks公司发明,DivX配置CPU要求是300MHz以上、内存要求是64M以上、8M以上显存的显卡.DivX视频编码技术是为了打破微软ASF的种种协定的束缚,由Microsoftmpeg4v3修改而来,使用MPEG-4压缩算法。
播放这种编码的视频,对机器的要求不高,CPU只要是300MHz以上、64M内存和一个8M显存的显卡就可以流畅地播放了。
采用DivX的文件小,图像质量好,一张CD-ROM可容纳120min的质量接近DVD的电影。
用它编码的视频文件不仅最大程度上还原了DVD原本的画面质量,而且可以允许你选择几乎所有格式的音频,包括VBR-MP3甚至AC3!
!
所以,严格的说,DivX是一种单机拷贝、储存、共享影视文件的最佳方案!
其实DivX技术对于我们严格来说也不是新技术了,为什么这么说呢?
它的视频部分采用的是微软的MPEG-4技术进行压缩,而音频部分则是采用MP3或WMA进行压缩,然后把视频和音频部分进行完美组合成让我们耳目一新的AVI文件,就是DivX影片了。
DivX最早是由国外的一名电脑游戏玩家和一名黑客制作,他们破解了微软的MPEG-4视频压缩算法而后重新改写并重新命名为DivX,而且还注册了公司。
从这个角度来说,DivX也不算是全新的技术了。
目前有三种DivX编码器:
DivX3.x是最著名的而且到处都有,它又称为DivX,实际上就是Microsoft的MPEG-4v3Codec的Hack版本。
第二个是DivX4,DivXNetworksInc.完全重新编写的作品,但是由于他们又推出了DivX5所以目前已经不用了。
DivX5提供更好的图像质量和更多的功能,经过不断努力,现今的Divx6也逐渐成为主流,Divx7也即将问世。
DivX的优势:
虽然DivX严格来说并不是全新的技术,但它本身所具有的优点和带给我们的便利之处确是不能不说。
1.视频画面图像显示质量清晰:
这主要还得归功于良好的片源和MPEG-4本身的压缩技术。
优秀的MPEG4文件大多采用DVD做片源,分辨率比VCD要高的多,所以它的视觉效果比VCD要强很多,接近DVD,因而被称为“普通光驱上的DVD”,一般人根本看不出来它的视频效果与DVD的画质有什么区别。
2.存储容量小,压缩比高:
用DivX来编码、压缩可以在一张标准容量的CD-ROM光盘中存放约80分钟逼近DVD(MPEG2)质量的高清晰度电影节目。
这就意味着,即使没有DVD驱动器,只通过普通光驱我们也一样可以欣赏精彩的高清晰电影,当然它对那些硬盘容量有限的用户来说也是可喜可贺的,在容量大小相同的情况下,我们现在可以存储5-10倍于以前大小的视频文件了。
同时DivX视频文件让我们不再需要那么大的互联网络数据带宽,让昂贵的带宽可以更有效率的方式使用,宽带用户只需用一个多小时的时间便可下载整套接近DVD效果的电影,这无疑提高了高质量视频数据在互联网上的传输速度。
尤其让人吃惊的是,在较低画质要求下,它可以以接近普通调制解调器速度的传输速率,提供较小画面的流畅视频影像,这项功能对于屏幕较小,不需要高质量画质的手持设备来说,不啻于是一个福音。
毕竟,不久的将来,手持设备肯定将会成为类似今天的手机一样的必备装备。
3.音质好:
DivX文件的视频数据采用MPEG4技术压缩,而音频数据采用WMA或MP3压缩,VCD的音频数据则是采用MPEG-1Layer2即MP2压缩。
从技术上说,MP3当然比MP2先进,音质也应该比MP2更好。
DivX的劣势:
说了DivX的几项优点,不可避免我们也来看看,DivX还有那些不足之处。
1.DivX视频文件的播放:
目前DivX格式的影像文件只能通过电脑播放。
需要安装一个DivX插件,Windowsmediaplayer就可以播放这种格式的AVI文件。
而生产能够直接读取DivX这种格式文件的播放机,是DivX技术推广的下一个目标。
2.播放并不是十分完美:
由于DivX是采用MPEG-4进行压缩的,而MPEG-4是有损压缩技术,还原后的图像只会比压缩前的图像质量差,而不会更好,所以在表现影片中的爆炸、快速运动等画面时,它的缺点就开始暴露出来了----轻微的马赛克等VCD里常见的问题在这里也开始上演,其图象质量还无法完全和DVD采用的MPEG2技术相比,但愿日后随着MPEG4的制作和播放软件进一步完善压缩和解压缩算法后能逐步改进。
DivX文件的画质损失主要表现在这些方面:
1、大家在某些电影中快速运动的画面上可以比较明显地看出整个画面是由很多小方块组成(这一点和VCD很相似),不过这些小方块要比VCD的更小更密,所以不是很明显。
2、由于采用DVD做片源,某些MPEG4文件会出现DVD特有的“运动毛刺”。
3.MPEG4有一个特点,就是画面的残留性,在画面上色彩相近一片区域这种现象特别明显。
有时画面在运动,但某一块区域的色块排列却几乎没有变化,好像显示器上有脏似的,这大概就是超强压缩比所带来的负作用。
Xvid:
XviD是一个开放源代码的MPEG-4视频编解码器,它是基于OpenDivX而编写的。
Xvid是由一群原OpenDivX义务开发者在OpenDivX于2001年7月停止开发后自行开发的。
Xvid支持多种编码模式,量化(Quantization)方式和范围控,运动侦测(MotionSearch)和曲线平衡分配(Curve)等众多编码技术,对用户来说功能十分强大。
Xvid的主要竞争对手是DivX。
但Xvid是开放源代码的,而DivX则只有免费的版本和商用版本。
XviD是目前世界上最常用的视频编码解码器(codec),而且是第一个真正开放源代码的,通过GPL协议发布。
在很多次的codec比较中,XviD的表现令人惊奇的好,总体来说是目前最优秀、最全能的codec。
DivX跟XviD采用不定时设立关键画面来改善原先固定时间关键画面所造成的动态画面画质不佳的情形,而2PASS(双重动态码流压缩模式)的压缩模式使画质更加滑顺,基本上两种编码的效果差别不大,不过就同画质的文件大小来说XviD更省容量,一部1.5小时的电影,DivX编码的大多为两片CD,而XviD编码的大多仅需一片CD容量即可!
DivX的版本从2,3,4一直跳到5,本来是非盈利提供网友使用,后来自DivX后开始当成商业软件,其中有一部份就离开再行开发出非盈利的译码程序,那就是XViD。
(大概这也就是为何要把DivX倒过来写的原因!
)
VC-1:
WMV(WindowsMediaVideo)作为经久不衰的一种视频编码,一直在不断改进,2003年,微软基于WMV第九版(WMV9)编码技术,正式提出了VC-1编码标准,并于2006年正式成为国际标准。
VC-1编码作为较晚推出的高清编码算法,自然吸收了MPEG-2与H.264编码的优点,其压缩比介于MPEG2和H.264之间,编解码复杂性仅有H.264的一半,即压缩时间更短、解码计算更小,在微软的大力推动下,VC-1编码已经得到了BD蓝光光盘、电影及电视学会及SMPTE(活动图像和电视工程师协会)的支持。
微软是在2003年9月递交VC-1编码格式(开发代号Corona)的,目前已经得到了MovieBeam、Modeo等不少公司的采纳,同时也包含在HDDVD和蓝光中,包括华纳和环球等影业公司也有采用这种格式的意向。
VC-1基于微软WindowsMediaVideo9(WMV9)格式,而WMV9格式现在已经成为VC-1标准的实际执行部分。
VC-1是最后被认可的高清编码格式,不过因为有微软的后台,所以这种编码格式不能小窥。
相对于MPEG2,VC-1的压缩比更高,但相对于H.264而言,编码解码的计算则要稍小一些,目前来看,VC-1可能是一个比较好的平衡,辅以微软的支持,应该是一只不可忽视的力量。
一般来说,VC-1多为“.wmv”后缀,但这都不是绝对的,具体的编码格式还是要通过软件来查询。
总的来说,从压缩比上来看,H.264的压缩比率更高一些,也就是同样的视频,通过H.264编码算法压出来的视频容量要比VC-1的更小,但是VC-1格式的视频在解码计算方面则更小一些,一般通过高性能的CPU就可以很流畅的观看高清视频。
相信这也是目前NVIDIAGeforce8系列显卡不能完全解码VC-1视频的主要原因。
近几年来,为了更好的推广WMV9/VC-1编码标准,微软不遗余力的建立了WMV-HD高清资源站点,大量发布采用VC-1编码压制的720P、1080P宣传片及演示片(WMV-HD视频格式),试图营造声势,吸引用户关注。
同时,在BD蓝光光盘领域,VC-1编码与电影/剧集的合作势头也渐趋猛烈,与电脑硬件厂商的合作也在加快VC-1编码的推广,可见,财大气粗的微软正在加快VC-1编码的圈地运动。
不过,中庸的技术(与H.264相比、无明显编码优势)、封闭的平台(限于Windows系统)、后发的劣势(2006年通过、成为国际标准)仍然给微软VC-1编码的应用前景带来了较大的不确定性,能否推翻H.264这座大山,尚需实践检验。
编码格式---音频
音频编码基本概念介绍
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
1.什么是采样率和采样大小(位/bit)?
声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。
波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。
采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。
我们常见的CD,采样率为44.1kHz。
光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。
量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。
采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:
假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。
如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。
采样率和采样大小的值越大,记录的波形更接近原始信号。
2.有损和无损
根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。
在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。
因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。
强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。
3.为什么要使用音频压缩技术
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2=1411.2Kbps。
我们常说128K的MP3,对应的WAV的参数,就是这个1411.2Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。
将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。
这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。
降低指标是不可取的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视频格式 教材
![提示](https://static.bdocx.com/images/bang_tan.gif)