多媒体技术教程课后习题答案样本文档格式.docx
- 文档编号:21197813
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:12
- 大小:71.37KB
多媒体技术教程课后习题答案样本文档格式.docx
《多媒体技术教程课后习题答案样本文档格式.docx》由会员分享,可在线阅读,更多相关《多媒体技术教程课后习题答案样本文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
0.15
001
0.10
011
0.07
0101
4
0.04
01000
5
0.03
010010
6
0.01
010011
2.4既有5个待编码符号,它们概率见练习表2-2。
计算该符号集:
(1)熵;
(2)霍夫曼码;
(3)平均码长。
练习表2-2
符号
0.1
(1)熵
=-0.4×
(0.4)-2×
0.2*
(0.2)-2×
(0.1)
=0.4×
1.3219+0.4×
2.3219+0.2×
3.3219=0.5288+-0.9288+0.6644=2.1220(位)
(2)编码树和霍夫曼码
练习图2-1编码树
编码表
霍夫曼码*
码长
所需位数
11
2
101
0.6
1001
1000
*代码分派不唯一
(3)平均码长
0.4+0.4+0.6+0.4+0.4=2.2(位/符号)
2.5使用算术编码生成字符串games代码。
字符g,a,m,e,s概率见练习表2-3。
练习表2-3
g
a
m
e
s
练习图2-2games算术码
2.10你与否批准“某个事件信息量就是某个事件熵”看法?
参照解答:
“信息量(informationcontent)是具备拟定概率事件信息定量度量”,而“熵(entropy)是事件信息量平均值,也称事件平均信息量(meaninformationcontent)”。
第3章数字声音编码
3.1音频信号频率范畴大概是多少?
话音信号频率范畴大概是多少?
(1)Audio:
20~0Hz
(2)Speech:
300~3400Hz
3.2什么叫做模仿信号?
什么叫做数字信号?
(1)幅度或频率发生持续变化一种信号。
(2)以二进制代码形式表达有无或高低一种信号。
3.3什么叫做采样?
什么叫做量化?
什么叫做线性量化?
什么叫做非线性量化?
(1)采样:
在某些特定期刻对模仿信号进行测量过程。
(2)量化:
幅值持续模仿信号转化成为幅值离散数字信号过程。
(3)线性量化:
在量化时,信号幅度划分是等间隔量化。
(4)非线性量化:
在量化时,信号幅度划分是非等间隔量化。
3.4采样频率依照什么原则来拟定?
奈奎斯特理论和声音信号自身最高频率。
采样频率不应低于声音信号最高频率两倍,这样就能把以数字表达声音还原成本来声音。
3.5样本精度为8位信噪比等于多少分贝?
48分贝。
3.7选取采样频率为22.050kHz和样本精度为16位录音参数。
在不采用压缩技术状况下,计算录制2分钟立体声需要多少MB(兆字节)存储空间(1MB=1024×
1024B)
(22050×
2×
60)/(1024×
1024)=10.09MB
3.8什么叫做均匀量化?
什么叫做非均匀量化?
(1)均匀量化:
采用相等量化间隔对采样得到信号进行量化。
它是线性量化另一种说法。
(2)非均匀量化:
采用非相等量化间隔对采样得到信号进行量化。
例如,对大输入信号采用大量化间隔,对小输入信号采用小量化间隔。
它是非线性量化另一种说法。
3.9什么叫做μ率压扩?
什么叫做A率压扩?
(1)在脉冲编码调制(PCM)系统中,一种模仿信号和数字信号之间进行转换CCITT压(缩)扩(展)原则。
在北美PCM电话网中,使用μ率压扩算法。
(2)在脉冲编码调制(PCM)系统中,一种模仿信号和数字信号之间进行转换CCITT压(缩)扩(展)原则。
在欧洲电话网,使用A律压扩算法。
对于采样频率为8kHz,样本精度为13比特、14比特或16比特输入信号,使用μ律压扩编码或使用A律压扩编码,通过PCM编码器之后每个样本精度为8比特,输出数据率为64kbps。
3.11自适应脉冲编码调制(APCM)基本思想是什么?
依照输入信号幅度大小来变化量化阶大小一种波形编码技术。
这种自适应可以是瞬时自适应,即量化阶大小每隔几种样本就变化,也可以是音节自适应,即量化阶大小在较长时间周期里发生变化。
3.12差分脉冲编码调制(DPCM)基本思想是什么?
运用样本与样本之间存在信息冗余度来进行编码一种数据压缩技术。
这种技术是依照过去样本去估算(estimate)下一种样本信号幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表达每个样本信号位数。
它与脉冲编码调制(PCM)不同是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送是差值而不是幅度绝对值,这就减少了传送或存储数据量。
此外,它还能适应大范畴变化输入信号。
3.13自适应差分脉冲编码调制(ADPCM)基本思想是什么?
ADPCM综合了APCM自适应特性和DPCM系统差分特性,是一种性能比较好波形编码。
它核心想法是:
(1)运用自适应思想变化量化阶大小,虽然用小量化阶(step-size)去编码小差值,使用大量化阶去编码大差值;
(2)使用过去样本值估算下一种输入样本预测值,使实际样本值和预测值之间差值总是最小。
第4章彩色数字图像基本
4.1什么叫做真彩色和伪彩色?
在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备基色强度,这样产生彩色称为真彩色。
例如用RGB5∶5∶5表达彩色图像,R,G,B各用5位,用R,G,B分量大小值直接拟定三个基色强度,这样得到彩色是真实原图彩色。
当前,普通把每个像素颜色值用24位表达颜色叫做真彩色。
24位表达颜色总数:
224=16777216种颜色。
4.3一种像素RGB分量分别用3,3,2位表达图像,问该幅图像颜色数目最多是多少?
如果有一幅256色图像,问该图颜色深度是多少?
(1)256种;
(2)8位
4.5JPEG压缩编码算法重要计算环节是:
①DCT变换,②量化,③Z字形编码,④使用DPCM对直流系数(DC)进行编码,⑤使用RLE对交流系数(AC)进行编码,⑥熵编码。
假设计算机精度足够高,问在上述计算办法中,哪些计算对图像质量是有损?
哪些计算对图像质量是无损?
算法名称
有损/无损
①DCT变换
无损
④使用DPCM对直流系数(DC)进行编码
②量化
有损
⑤使用RLE对交流系数(AC)进行编码
③Z字形编码
⑥熵编码
4.6什么叫做γ校正?
在屏幕上显示用离散量表达色彩时采用一种色彩调节技术。
计算机显示屏和电视采用阴极射线管产生光亮度与输入电压不成正比,而是等于以某个常数为底,以输入电压为指数数,这个常数称为γ,它值随显示屏不同而变化,普通在2.5左右。
4.7什么叫做α通道?
它作用是什么?
在每个像素用32位表达图像表达法中高8位,用于表达像素在一种对象中透明度。
例如,用两幅图A和B混合成一幅新图New,新图像素为:
Newpixel=(alpha)(pixelAcolor)+(alpha)(pixelBcolor)。
在计算机环境下,
通道可存储在帧缓冲存储器中附加位平面上。
对于32位帧缓冲存储器,除高8位是
通道外,别的24位是颜色位,红、绿和蓝各占8位。
4.7什么叫做图形(graphics)、图像(image)、位图(bitmap)和图形图像(graphicalimage)?
(1)图形:
按照数学规则用绘图软件(如AdobeIllustrator)或图形输入设备创立图,如工程图和构造图。
(2)图像:
用像素值阵列表达人物或场景图。
(3)位图:
用像素值阵列表达图。
(4)图形图像:
表达矢量图位图。
第5章颜色度量体系
5.2什么是颜色空间?
对人、显示设备和打印设备,普通采用什么颜色参数来定义颜色?
(1)颜色空间:
表达颜色一种数学办法,人们用它来指定和产生颜色,使颜色形象化。
(2)对于人来说,可以通过色调、饱和度和明度来定义颜色;
对于显示设备来说,人们使用红、绿和蓝磷光体发光量来描述颜色;
对于打印或者印刷设备来说,人们使用青色、品红色、黄色和黑色反射和吸取来产生指定颜色。
第6章颜色空间变换
6.1PAL制彩色电视使用什么颜色模型?
NTSC制彩色电视使用什么颜色模型?
计算机图像显示使用什么颜色模型?
(1)PAL制彩色电视:
YUV
(2)NTSC制彩色电视:
YIQ
(3)计算机图像显示设备:
RGB
6.2用YUV或YIQ模型来表达彩色图像长处是什么?
为什么黑白电视机可看彩色电视图像?
(1)YUV表达法长处:
①它亮度信号(Y)和色度信号(U,V)是互相独立,因而可以对这些单色图分别进行编码;
②可以运用人眼特性来减少数字彩色图像所需要存储容量。
YIQ同样具备YUV这两个长处。
(2)黑白电视能接受彩色电视信号道理是运用了YUV/YIQ分量之间独立性。
6.3在RGB颜色空间中,当R=G=B,且为任意数值时,问计算机显示屏显示颜色是什么颜色?
灰色
第8章小波图像编码
8.1什么叫做零树
“零树”是指小波变换系数之间一种数据构造,由于离散小波变换是一种多辨别率分解办法,每一级分解都会产生表达图像比较粗糙(低频图像)和比较精细(高频图像)小波系数,在同一方向和相似空间位置上所有小波系数之间关系可用一棵树形式表达,如果树根和她子孙小波系数绝对值不大于某个给定阈值T,那么这棵树就叫零树。
第9章彩色数字电视基本
9.1电视是什么?
电视制是什么?
世界上重要彩色电视制有哪几种?
(1)电视是捕获、广播和接受活动图像和声音远程通信系统;
(2)电视制(televisionsystem)是传播图像和声音办法;
(3)当前世界上使用彩色电视制式重要有PAL,NTSC,SECAM三种,都是模仿彩色电视制式。
9.2隔行扫描是什么意思?
非隔行扫描是什么意思?
(1)在隔行扫描中,一帧画面分两场,第一场扫描总行数一半,第二场扫描总行数另一半。
电子束扫完第1行后回到第3行开始位置接着扫,然后在第5、7、……,行上扫,直到最后一行。
奇数行扫完后接着扫偶数行,这样就完毕了一帧(frame)扫描。
隔行扫描规定第一场结束于最后一行一半,不论电子束如何折回,它必要回到显示屏顶部中央,这样就可以保证相邻第二场扫描正好嵌在第一场各扫描线中间。
正是这个因素,才规定总行数必要是奇数。
(2)在非隔行扫描中,电子束从显示屏左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整图像。
9.3电视机和计算机显示屏各使用什么扫描方式?
电视机普通使用隔行扫描;
计算机显示屏普通使用非隔行扫描。
9.6对彩色图像进行子采样理论依照是什么?
人视觉系统所具备两种特性。
一是人眼对色度信号敏感限度比对亮度信号敏感限度低,运用这个特性可以把图像中表达颜色信号去掉某些而使人不易察觉;
二是人眼对图像细节辨别能力有一定限度,运用这个特性可以把图像中高频信号去掉而使人不易察觉。
子采样是压缩彩色电视信号一种技术。
9.7图像子采样是在哪个彩色空间进行?
在YCbCr颜色空间
9.8一幅YUV彩色图像辨别率为720×
576像素。
分别计算采用4:
2:
2、4:
1:
1和4:
0子采样格式采样时样本数。
(1)4:
4:
4这种采样格式不是子采样格式,它是指在每条扫描线上每4个持续采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相称于每个像素用3个样本表达。
720×
576×
3=1244160
(2)4:
2这种子采样格式是指在每条扫描线上每4个持续采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表达。
2=829440
(3)4:
1这种子采样格式是指在每条扫描线上每4个持续采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表达。
1.5=622080
(4)4:
0这种子采样格式是指在水平和垂直方向上每2个持续采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表达。
1.5=622080
9.11高清晰度电视(HDTV)是什么?
高清晰度电视(highdefinitiontelevision,HDTV)是具备正常视力观众可得到与观看原始景物时感受几乎相似数字电视。
普通以为,在观众与显示屏之间距离等于3倍显示屏高度状况下就可获得这种感受。
MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21分别是什么原则,各自要达到目的是什么?
MPEG-1是数字电视原则,MPEG-1解决原则图像互换格式电视,即NTSC制为352像素×
240行/帧×
30帧/秒,PAL制为352像素×
288行/帧×
25帧/秒,压缩输出速率定义在1.5Mbit/s如下。
这个原则重要是针对当时具备这种数据传播速率CD-ROM和网络而开发,用于在CD-ROM上存储数字影视和在网络上传播数字影视。
MPEG-2是数字电视原则。
MPEG-2原则是一种直接与数字电视广播关于高质量图像和声音编码原则,是MPEG-1扩充。
MPEG-2提供位速率可变性能功能,其基本目的是:
位速率为
4~9
Mbit/s,高达
15
Mbit/s。
MPEG-4是视听对象编码原则。
MPEG-4是为视听数据编码和交互播放开发算法和工具,是一种数据速率很低多媒体通信原则。
MPEG-4目的是要在异构网络环境下可以高度可靠地工作,并且具备很强交互功能。
MPEG-7是多媒体内容描述接口原则。
MPEG-7名称叫做多媒体内容描述接口,目是制定一套描述符原则,用来描述各种类型多媒体信息及它们之间关系,以便更快更有效地检索信息。
这些媒体材料可涉及静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间组合关系。
在某些状况下,数据类型还可涉及面部特性和个人特性表达。
MPEG-21是多媒体框架原则。
MPEG-
21
企图描述多媒体元数据(metadata)1,用于全球多媒体对象集成、创立、使用、操作、管理和传送等操作,便于不同人群在异构网络环境下使用各种多媒体资源,它目的是为将来多媒体应用提供一种完整平台。
MPEG-21
要解决核心问题是资源共享、知识产权和版权管理与保护。
第11章MPEG声音
11.1列出你所懂得听觉系统特性。
响度感知,音高感知,掩蔽效应
11.2什么叫做听阈?
什么叫做痛阈?
(1)当声音弱到人耳朵刚刚可以听见时,称此时声音强度为“听阈”
(2)当声音强到人耳朵刚刚感到疼痛时,称此时声音强度为“痛阈”。
实验表白,如果频率为1kHz纯音声强级达到120dB左右时,人耳朵就感到疼痛,这个阈值称为“痛阈”。
11.3什么叫做频域掩蔽?
什么叫做时域掩蔽?
(1)强纯音掩蔽在其附近同步发声弱纯音,这种特性称为频域掩蔽。
(2)在时间方向上相邻声音之间掩蔽,这种特性称为时域掩蔽。
11.4MPEG-1层1、2和3编码分别使用了听觉系统什么特性?
层1:
频域掩蔽特性;
层2:
频域掩蔽特性+时间掩蔽特性;
层3:
频域掩蔽特性+时间掩蔽特性+临界频带特性(声音频率与掩蔽曲线不是线性关系);
11.6MPEG-1声音质量是:
AMFM电话near-CDCD-DA
□AM□FM□电话√□near-CD□CD-DA
第11章MPEG视像
12.1电视图像数据中有哪些冗余数据可去掉,当前分别采用什么办法减少冗余数据?
电视图像数据中冗余数据可归纳成两类:
人视觉特性感觉不到冗余数据和电视图像数据自身冗余数据,针对不同类型冗余采用不同办法减少冗余,详见下表。
视像压缩运用各种冗余信息
种类
内容
当前用重要办法
空间冗余
像素间有关性
变换编码,预测编码
时间冗余
时间方向上有关性
帧间预测,移动补偿
图像构造冗余
图像自身构造
轮廓编码,区域分割
知识冗余
收发两端对人物共有结识
对象编码,知识编码
视觉冗余
人视觉特性
非线性量化,位分派
其她
不拟定性因素
12.2在MPEG视像数据压缩技术中,当前运用了视觉系统哪两种特性?
人视觉系统具备两种特性可以用来压缩电视图像数据。
12.3MPEG-1编码器输出电视图像数据率大概是多少?
1.15Mbps
12.4MPEG专家组在制定MPEG1/2Video原则时定义了哪几种图像?
哪种图像压缩率最高?
哪种图像压缩率最低?
(1)MPEG专家组定义了三种图像:
帧内图像I(intra),预测图像P(predicted)和双向预测图像B(bi-directionallyinterpolated)。
(2)双向预测图压缩率最高,帧内图像压缩率最低。
12.5有人以为“图像压缩比越高越好”。
你对这种说法有何看法?
在图像压缩算法中,为了获得比较高压缩率,普通要采用有损压缩。
如果笼统说“图像压缩比越高越好”是不严格。
由于压缩比越高,意味图像质量损失越大,重构图像质量将会越低。
如果说“在图像质量相似前提下,图像压缩比越高越好”是承认。
12.6有人说“MPEG1编码器压缩比大概是200:
1”。
这种说法对不对?
为什么?
不对。
“200:
1”是使用子采样、减少图像辨别率和MPEG-1视像压缩技术获得,而
(1)电视图像子采样(4:
1:
1)不是MPEG编码器功能,它压缩比为2:
1;
(2)电视图像画面尺寸(如PAL制720×
576)降采样(变成360×
288)也不属于MPEG编码器功能,它压缩比为4:
1。
12.7视像空间辨别率和时间辨别率是什么意思?
空间辨别率:
图像尺寸。
例如,PAL制图像尺寸:
576,360×
288。
时间辨别率:
图像帧数每秒。
例如,PAL制电视图像时间辨别率为30帧/秒,NTSC电视图像时间辨别率为25帧/秒,电影图像时间辨别率为24帧/秒。
12.8在MPEG-1和MPEG-2中,典型宏块由多少个像素构成;
子采样为4:
0宏块提成多少个亮度图块、红色差图块和蓝色差图块,每个图块由多少个像素构成。
在MPEG-1,MPEG-2中,典型宏块为16×
16像素。
在子采样为4:
0宏块提成4个亮度图块、1个红色差图块和1个蓝色差图块,每个图块由8×
8个像素构成。
12.9什么叫做移动估算?
移动估算(motionestimation)是计算移动矢量过程,也就是在参照图像中查找与当前编码图块匹配最佳图块过程。
12.10什么叫做移动补偿?
计算当前编码图块与参照帧中图块像素值之差过程。
在编码时,使用移动矢量表达当前帧图块相对于过去或将来帧图块偏移量,使用当前帧与过去或将来帧像素值差值表达图像变化限度,这个差值在重构当前帧图块时作为“补偿量”;
在解码时,运用移动矢量拟定当前帧图块相对于过去或将来帧图块位置,使用过去或将来帧像素值和编码时得到补偿量重构当前帧图块。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 教程 课后 习题 答案 样本