数字媒体技术导论复习题文档格式.docx
- 文档编号:19139428
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:27
- 大小:47.37KB
数字媒体技术导论复习题文档格式.docx
《数字媒体技术导论复习题文档格式.docx》由会员分享,可在线阅读,更多相关《数字媒体技术导论复习题文档格式.docx(27页珍藏版)》请在冰豆网上搜索。
数字媒体内容产业将内容制作技术以及平台、音视频内容搜索技术、数字版权保护技术、数字媒体人机交互与终端技术、数字媒体资源管理平台与服务、数字媒体产品交易平台等六个方向为发展重点。
数字媒体技术六个重点发展方向
内容制作技术以及平台音视频内容搜索技术数字版权保护技术数字媒体人机交互与终端技术数字媒体资源管理平台与服务数字媒体产品交易平台与服务
1.3.3数字媒体技术研究领域
主要技术范畴包括:
(1)数字媒体表示与操作,包括数字声音及处理、数字图像及处理、数字视频及处理、数字动画技术等。
(2)数字媒体压缩,包括通用压缩编码、专门压缩编码(声音、图像、视频)技术等。
(3)数字媒体存储与管理,包括光盘存储(CD技术、DVD技术等)、媒体数据管理、数字媒体版权保护等。
(4)数字媒体传输,包括流媒体技术、P2P技术等。
数字媒体技术主要的研究方向
•数字媒体的技术范畴规划了数字媒体技术的研究领域,其主要的研究方向包括:
(1)数字声音处理
(2)数字图像处理(3)数字视频处理(4)数字动画设计(5)数字游戏设计(6)数字媒体压缩(7)数字媒体存储(8)数字媒体管理与保护(9)数字媒体传输技术
1.3.4数字媒体应用领域
数字媒体有着广泛的应用和开发领域,包括教育培训、电子商务、信息发布、游戏娱乐、电子出版、创意设计等。
第二章数字音频技术基础
本章学习目标:
(1)知道音频的三个特性及其相关概念。
(2)说出几种声音记录设备。
(3)了解模拟音频处理技术涉及到的设备及各自主要功能(4)掌握音频数字化的过程(5)能够列举几种常见数字音频格式,并进行简单的比较。
(6)了解几款常见的数字音频编辑软件,并知道其基本性能。
(7)熟练掌握一款数字音频编辑软件的操作方法。
音频技术及特性
2.1.1音频的概念及特性
在物理学上声音的三个基本特性:
频率、振幅和波形,对应到人耳的主观感觉就是音调、响度和音色。
•频率:
发声物体在振动时,单位时间内的振动的次数,单位为赫兹(HZ)。
•振幅是指发声物体在振动时偏离中心位置的幅度,代表发声物体振动时动势能的大小。
•音色是指声音的纯度,它由声波的波形形状所决定。
•2.1.1音频的概念及特性
声音的分类按照人耳可听到的频率范围,声音可分为超声、次声和正常声。
人耳可感受声音频率的范围介于20~20000赫兹之间。
声音高于20000赫兹为超声波,低于20赫兹为次声波。
2.1.3模拟音频处理设备
(1)话筒(Microphone麦克风)
(2)音箱(speaker,扬声器)(3)模拟调音台
音频数字化
2.2.1数字音频
数字音频是指用一连串二进制数据来保存的声音信号。
这种声音信号在存储和电路传输及处理过程中,不再是连续的信号,而是离散的。
2.2.2音频的数字化过程
数字化的音频信号两种途径:
第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频;
第二种途径就是在数字化设备中创作出数字音频,比如电子作曲。
音频数字化一般经过三个阶段“采样——量化——编码”。
音频数字化过程的具体步骤包括:
第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集,这个过程就叫采样;
第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是量化;
第三步将等级值变换成对应的二进制表示值(0和1),并进行存储,这个过程就是“编码”。
通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。
数字化过程两个指标:
一是量化深度,也可称之为量化分辨率,是指单位电压值和电流值之间的可分等级数;
二是采样频率,即采样点之间的时间间隔。
两者与音质还原的关系是:
采样频率越高,量化深度越大,声音质量越好。
在数字音频的衡量指标中,采样频率的单位是HZ,量化深度一般用比特(Bit)来度量。
根据Nyquist(奈奎斯特)定理:
要想不产生低频失真,则采样频率至少是录制的最高频率的两倍
数字音频质量及格式
2.3.1音频数据率及质量
•数字音频文件存储在计算机中要占据一定的空间,然而不同的采样频率、量化深度和录制时间生成的音频文件大小也不同。
•例如:
用、16bit来进行立体声(即两个声道)采样(标准的CD音质),录制(或采集)3分钟的音频,那么在该未经压缩的声音数据文件的大小为:
一秒钟内采样×
1000次,每次的数据量是16×
2=32bit(因为立体声是两个声道),那么3分钟的总共数据量是44100×
32×
60×
(bit),换算成计算机中的常用单位(Byte),总共数据量是。
•比特率,即每秒钟音频的二进制数据量。
–上述例题的比特率是s。
衡量一个数字音频的音质好坏的话,通常可以参考以下指标:
采样频率:
即采样点之间的时间间隔,采样间隔时间越短,音质越好。
量化深度(量化分辨率):
是指单位电压值和电流值之间的可分等级数,可分等级越多,音质越好。
音频流码率:
数字化后,单位时间内音频数据的比特容量,流码率越大音质越好。
以
上三个方面的指标中,前面两个指标是绝对指标,而音频流码率是一个相对指标,可以间接用来考察音频的质量。
2.3.2声音文件格式
数字音频的常见格式有以下几种:
(1)WAV格式:
WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,WAV格式对存储空间需求太大不便于交流和传播。
(2)MIDI格式:
MIDI是MusicalInstrumentDigitalInterface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。
它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。
(3)CDA格式,其取样频率为,16位量化位数。
CD存储采用了音轨的形式,记录的是波形流,是一种近似无损的格式。
(4)MP3格式:
其全称是MPEG-1AudioLayer3。
MP3能够以高音质、低采样率对数字音频文件进行压缩。
(5)MP3Pro格式:
MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。
它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。
(6)WMA格式:
WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:
18。
此外,WMA还可以通过DRM(DigitalRightsManagement)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
(7)MP4格式:
MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。
另外MP4的压缩比达到了1:
15,体积较MP3更小,但音质却没有下降。
不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。
(8)SACD格式:
SACD(SA=SuperAudio)是由Sony公司正式发布的。
它的采样率为CD格式的64倍,即。
SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富、清晰。
(9)Quicktime格式:
QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。
(10)VQF格式:
VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:
18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位立体声)。
但VQF未公开技术标准,至今未能流行开来。
(11)DVDAudio格式:
DVDAudio是新一代的数字音频格式,与DVDVideo尺寸以及容量相同,为音乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合(12)MD格式:
采用采样的立体声音乐,使用了ATRAC算法(自适应声学转换编码)压缩音源。
(13)RA格式:
RealAudio是由RealNetworks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据。
(14)LiquidAudio格式:
LiquidAudio是一家提供付费音乐下载的网站。
它通过在音乐中采用自己独有的音频编码格式来提供对音乐的版权保护。
LiquidAudio的音频格式就是所谓的LQT。
(15)Audible格式:
Audible拥有四种不同的格式:
Audible1、2、3、4。
格式1、2和3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音更清楚,而且可以更有效地从网上进行下载。
(16)VOC文件格式:
在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
(17)AU格式:
AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。
(18)AIFF格式:
AIFF(.AIF)是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。
(19)Amiga格式:
Amiga声音(.SVX):
Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。
(20)MAC格式:
Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。
(21)S48格式:
S48(stereo、48kHz)采用MPEG-1layer1、MPEG-1layer2声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。
(22)AAC格式:
AAC实际上是高级音频编码的缩写。
AAC是MPEG-2规范的一部分。
AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法。
它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。
数字音频的编辑技术
2.4.1数字音频的编辑方式
对于数字音频的技术操作具体来说可以归纳为以下六个方面的内容。
(1)数字录音:
该技术操作是指通过数字方式将自然界中的声源或者存储在其它介质的模拟声音通过“采样——量化——编码”的方式将其变成计算机中或其它数字音频设备中能够识别的数字声音。
(2)数字音乐创作:
该技术操作是指通过相关的数字音频创作工具(如:
计算机和Midi键盘、Midi吉它等)直接生成创作数字音频,通常是数字音乐。
(3)声音剪辑:
该操作旨在对数字音频素材进行裁剪或者复制。
(4)合成声音:
也可称之为混音,声音合成是指根据需要,把多个声音素材叠加在一起,生成混合效果。
(5)增加特效:
增加特效是指对原始的数字音频素材进行听觉效果的优化调整,以使其符合需要。
(6)文件操作:
对数字音频的文件操作是指对整个音频文件进行的操作,而非改变其音色、音效。
2.4.2数字音频设备
数字音频处理设备可以分为两类:
一类是专用数字音频设备,另一类是非专为处理音频而设计的多媒体计算机。
(1)数字调音台:
调音台的作用有两个:
其一是将每一路进行优化和调节;
其二,对多路声音进行混合输出。
(2)数字录音机,采用数字记录方式来存储音频信号。
一般可用硬盘记录方式或者光盘记录方式。
(3)数字音频工作站:
数字音频工作站是一台能够完成从录音、编辑、混合、压缩,一直到最后刻出母盘的全部音频节目制作过程的设备。
它最大的特点就是集成度高,免去录音连线的烦恼,且便于携带。
在进行数字音频处理时,除了用到上述几种专用的硬件设备外,还会用到一些其它配套设备,如麦克风、音箱等等。
在处理数字音频时,其关键的硬件技术内核包括:
1)模数转换器:
模数转换器(AnalogtoDigitalConverter,ADC)是一个硬件芯片,一般用在带录音功能的音频处理设备之中,其作用就是将模拟的音频电压(流)信号转成数字脉冲电压(PCM)信号。
任何ADC都包括上面提到的三个基本功能:
采样、量化和编码,用来完成从模拟的音频信号向数字音频信号的采集过程。
2)数模转换器:
数模转换器(DigitaltoAnalogConverter,DAC)也是一个硬件芯片,一般用在数字音频的重放设备中,用来将数字音频信号还原成模拟的音频信号。
3)数字信号处理器:
数字信号处理器(DigitalSignalProcessor,DSP)是一个专门用来处理数字声音的微型处理器,类似于计算机中的CPU,可以用来模拟和产生声场,并对声音效果进行控制。
数字音频编辑软件可分为两种:
一种是音源软件(音序器软件),主要是针对数字音乐创作而言。
它是一种可以用来产生和模拟各种乐器或发声物的应用软件。
音源软件中最核心的是音序器,其主要作用是把音乐元素或事件进行系列或序列编程。
另外一种软件是编辑软件,可以完成对声音的录音、剪辑、混音合成、特效处理。
(1)声道声道(SoundChannel)是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。
(2)音轨音轨就是在音频处理软件中看到的一条一条的平行“轨道”。
每条音轨分别定义了该条音轨的属性,如音轨的音色,音色库,通道数,输入/输出端口,音量等。
在音序器软件中一条音轨对应于音乐的一个声部或者对于一种乐器,它把MIDI或者音频数据记录在特定的时间位置。
对于音频工作站软件而言,每一音轨对于一个原始音频素材文件或者前后对应多个音频文件。
所有的音频处理软件都可以允许多音轨操作,也就是在某一段时间内,可以同时让多个音频素材同时播放,产生混音效果。
(3)时序所谓时序,其实也就是时间的顺序。
数字音频技术应用
下面就简单的介绍数字音频技术在几个方面的具体应用。
(1)数字广播
(2)音乐制作(3)影视游戏配乐(4)个人家庭娱乐
(1)了解颜色模型概念、颜色表示方法;
理解各模型与RGB模型之间的变换方法。
(2)掌握图像的基本属性。
(3)了解位图和矢量图文件的获取和编辑方法。
(4)能较熟练操作数码相机、扫描仪和绘图板等。
(5)初步掌握Photoshop软件的核心概念以及基本操作。
图像颜色的模型
图像颜色的模型,即颜色的表示模型,通常简称为颜色模型,被用来描述人们能感知的和处理的颜色。
在颜色模型中,所有被定义的颜色形成了坐标系的彩色空间。
每一种颜色表示颜色坐标系中的一个点,可以使用数值来衡量。
常见的颜色模型包括RGB(红色、绿色、蓝色);
CMYK(青色、洋红、黄色、黑色);
HSB(色相、饱和度、亮度);
YUV;
CIEL*a*b等。
一般来说,显示时采用RGB颜色模型,印刷用CMYK颜色模型,彩色全电视信号数字化采用YUV颜色模型。
为了便于彩色处理和识别,视觉系统又常采用HSB颜色模型。
3.1.1视觉系统对颜色的感知
•眼睛看到的自然景观或图像,除了本身的特征外,还与一个重要的因素:
颜色。
•在同一种光线条件下,之所以会看到不同景物具有各种不同的颜色,这是因为物体的表面具有吸收或反射不同光线的能力。
•光不同,眼睛就会看到不同的色彩。
色彩的发生,是光对人的视觉和大脑发生作用的结果,是一种视知觉。
由此看来,需要经过“光——眼——神经”的过程才能见到色彩。
•当人的眼睛受到380~780nm范围内可见光谱的刺激以后,除了有亮度的反应外,同时产生色彩的感觉。
一般情况下光进入视觉通过以下三种形式:
(1)光源光源发出的色光直接进入视觉,像霓虹灯、日光灯、蜡烛等的光线都可以直接进入视觉。
(2)透射光光源穿过透明或半透明物体后再进入视觉的光线,称为透射光。
透射光的亮度和颜色取决于入射光穿过被透射物体之后所达到的光透射率及波长特征。
(3)反射光反射光是光进入眼睛的最普遍的形式。
在有光线照射的情况下,眼睛能看到的任何物体都是该物体的反射光进入视觉所致。
3.1.2RGB颜色模型
RGB颜色模型是颜色最基本的表示模型,也是计算机系统彩色显示器采用的颜色模型。
其中,R,G,B分别代表红(Red)、绿(Green)、蓝(Blue)三色。
RGB颜色模型也称为加色模型,各种颜色由不同比例红、绿、蓝3种基本色的叠加而成。
当三基色按不同强度相加时得到的颜色称为相加色。
r[R]、g[G]、b[G]三个分量各占一个字节(8位),这样共可表示224=16777216种颜色。
3.1.3CMYK颜色模型
CMYK模型以打印在纸上的油墨的光线吸收特性为基础。
当白光照射到半透明油墨上时,色谱中的一部分被吸收,而另一部分被反射回眼睛。
哪些光波反射到眼睛中,决定了人们能感知的颜色。
CMYK模型中也定义了颜料的三种基本颜色——青色(Cyan)、品红(Magenta)和黄色(Yellow)。
在理论上说,任何一种颜色都可以用这三种基本颜料按一定比例混合得到。
由于所有打印油墨都包含一些杂质,因此这三种油墨实际生成土灰色,必须与黑色(K)油墨合成才能生成真正的黑色。
与RGB模型相对,CMYK模型被称为减色模型。
理论上,在相减混色中,等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);
等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);
等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。
100%的三种基本颜料合成将吸收所有颜色而生成黑色。
HSB模型建立在人类对颜色的感觉基础之上。
H表示色调(也称色相)、S表示饱和度、B表示亮度。
色调反映颜色的种类,是人们眼看一种或多种波长的光时产生的彩色感觉。
饱和度是指颜色的深浅程度或纯度,即各种颜色混入白色的程度。
对同一色调的光,饱和度越高则颜色越鲜艳或者说越纯。
色调和饱和度通常统称为色度。
–亮度是颜色的相对明暗程度。
3.1.5YUV与YIQ颜色模型
彩色全电视信号采用YUV和YIQ模型表示彩色电视的图像。
不同的电视制式采用的颜色模型不同。
我国和一些西欧国家采用PAL电视制式(在下一章中有讲解),在PAL彩色电视制式中使用YUV模型,其中的Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量;
在美国、加拿大等国采用的NTSC彩色电视制式中使用YIQ模型,其中的Y表示亮度,I、Q是两个彩色分量。
采用YUV颜色模型的有两个优点:
一个优点是解决了彩色电视与黑白电视的兼容问题。
这样使黑白电视能够接收彩色电视信号。
另一个优点是可以利用人眼的特性来降低数字彩色图像所需要的存储容量。
一幅大小为640×
480像素的彩色图像,用8:
2:
2YUV格式(即Y分量用8位表示,而对每四个相邻像素(2×
2)的U、V值分别用相同的一个值表示)来表示,所需要的存储容量为640*480*(8+2+2)/8=460800字节。
若采用RGB8∶8∶8格式表示,所需要的存储容量为640*480*(8+8+8)/8=921600字节。
在我国的PAL/D制式中,亮度Y的带宽为6MHz,色差U、V的带宽为。
3.1.6CIEL*a*b颜色模型
L*a*b颜色模型设计目的是为了得到不依赖于具体设备的颜色标准,从而在实际使用中不论使用何种设备(如显示器、打印机、计算机或扫描仪)均能制作和输出完全一致的颜色。
L*a*b颜色由亮度或光亮度分量(L)和两个色度分量组成:
a分量保存从绿色到红色所对应的色彩信息;
b分量保存从蓝色到黄色所对应的色彩信息,单个a或b无意义,只有a,b结合才有意义。
3.2.4YCrCb与RGB彩色空间变换
YCrCb与YUV的定义基本上是相同的,但应用有所不同。
YUV适用于PAL和SECAM彩色电视制式的模拟视频图像的表示,而YCrCb则适用于数字电视以及计算机用数字视频图像的表示。
数字域中的彩色空间变换与模拟域的彩色空间变换不同,YCrCb与RGB空间的转换关系如下:
Y=+0.578G+Cr=-0.4187G-+128
Cb=-0.3313G++128
图像的基本属性及种类
图像的属性包含分辨率、颜色深度、文件大小、真/伪彩色、图像的种类等。
3.3.1分辨率
与图像相关的分辨率包括显示分辨率、图像分辨率、打印分辨率和扫描分辨率等。
(1)显示分辨率显示分辨率是指显示屏上水平和垂直方向上的最大像素点的个数。
例如,显示分辨率为640×
480表示显示屏垂直方向显示480个像素,水平方向显示640个像素,整个显示屏共含有307,200个显像点。
显示设备的分辨率越高,屏幕能够显示的像素越多,因此能够显示的图像就越大越精细
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 媒体 技术 导论 复习题