毕业设计外文翻译-H.264编码视频的水印检测机制.doc
- 文档编号:1264562
- 上传时间:2022-10-19
- 格式:DOC
- 页数:24
- 大小:816KB
毕业设计外文翻译-H.264编码视频的水印检测机制.doc
《毕业设计外文翻译-H.264编码视频的水印检测机制.doc》由会员分享,可在线阅读,更多相关《毕业设计外文翻译-H.264编码视频的水印检测机制.doc(24页珍藏版)》请在冰豆网上搜索。
南京理工大学
毕业设计(论文)外文资料翻译
学院(系):
专业:
姓名:
学号:
(用外文写)
外文出处:
IEEETRANACTIONSONINFORMATIONFORENSICSANDSECURITY,
VOL.2,NO.1,MARCH2007.
附件:
1.外文资料翻译译文;2.外文原文。
指导教师评语:
签名:
年月日
注:
请将该封面与附件装订成册。
附件1:
外文资料翻译译文
一种针对H.264编码视频具有可控检测性能的鲁棒性水印机制
摘要
随着H.264格式的数字视频逐渐普及,对该标准版权保护方法和鉴定方法的需求也将出现。
本文提出了一种为H.264视频添加鲁棒性水印的算法。
在限制视觉失真的同时,采用适合于4×4离散余弦变换域的人类视觉模型,提高算法的有效载荷和鲁棒性。
利用与密匙相关的算法选择具有视觉水印容量的系数的一个子集,使水印遍布各频率并在区域内传播以避免误差合并,这样,在不显著改变感知质量的情况下,有效载荷和鲁棒性得到提高。
该算法在编码残差中嵌入水印,避免了视频压缩;在解码视频序列中检测水印,可用于确定帧内编码模型改变时算法的鲁棒性。
然后,本文为视频水印检测建立了基于似然比检验的理论框架,用于获得性能可控的最佳水印检测机制。
仿真结果表明,蒙特卡罗实验达到了预期的检测性能。
最后,本文证实了该算法对若干不同攻击均具有鲁棒性。
索引词
压缩域,误差合并,广义高斯分布,人类视觉模型,H.264,似然比检验,视频水印检测,视频水印
一、引言
数字电视的出现、数字化视频光盘(DVDs)的产生及视频文件的网络传输,无一不显示出数字视频的重要性。
虽然MPRG-2在视频编码上已取得显著成就,但H.264以其更高的压缩效率正在逐渐取代MPRG-2。
随着H.264数字视频越来越普及,对该标准版权保护方法和鉴定方法的需求也将出现。
本文提出的H.264水印算法恰好满足了这种需求。
视频信号通常以压缩格式存储和传输,所以先解码视频序列、再嵌入水印、最后重新编码的做法是不切实际的。
相反,在压缩域嵌入水印是一种复杂度较低的视频水印算法。
然而,由于两种标准间的差异,MPEG-2庞大的水印算法不能直接运用于H.264。
H.264标准的详细描述见参考文献[1]和[2]。
部分近期出版的文献探讨了在H.264码流序列中嵌入水印的方法。
参考文献[3]中,作者提出一种混合水印机制,即在离散余弦变换(DCT)中嵌入鲁棒性水印,在运动矢量中嵌入脆弱性水印。
参考文献[4]给出一种复杂度较低的机制,即在每个I帧宏块中选中一个已量化的交流系数,给这个系数嵌入一位水印码。
参考文献[5]中,作者描述了一种在H.264I-帧中嵌入水印的盲水印算法,但它也要求解压视频以嵌入水印。
[3]和[4]所述算法均是在视频压缩格式下嵌入水印,这些算法的鲁棒性不足以抵挡一般的水印攻击。
因为水印是嵌入在I-帧残差并且从I-帧残差中提取的,所以一些简单的处理就可以改变宏块内的预测模式,使得残差无法恢复,比如,先滤波,再用H.264编码器重新编码。
本文旨在描述一种针对H.264标准的鲁棒性水印算法。
该算法在残差中嵌入水印,避免解压视频的同时降低了算法复杂度;在解码视频序列中提取水印,从而可以确定帧内编码模型改变时算法的鲁棒性。
H.264具有高压缩率,空余给待嵌入微信号的空间极小,所以在限制视觉失真的同时,采用人类视觉模型来提高有效载荷和鲁棒性。
沃森等人[7]为感知失真的8×8离散余弦变换域推导出一种模型[6],[7],文献[8]和[9]中运用该感知模型设计出静止图像和MPEG-2视频的水印算法,但H.264使用的是4×4域变换,不是8×8域变换,4×4域变换[10]是对DCT的整数正交逼近,这种变换由精确的整数运算定义,避免了反变换不匹配的问题。
本文将人类视觉模型扩展到4×4离散余弦变换域,当所有可用于水印嵌入、具有视觉容量的系数都被使用时,视频的视觉质量将会下降。
本文使用与密匙相关的算法在具有视觉水印容量的系数中选择一个子集,并将水印嵌入这一子集,从而使算法在对抗恶意攻击时具有更强的鲁棒性,此外,该算法的设计使水印遍布各频率并在区域内传播,减小了沃森[7]所述的误差合并的影响。
此前的感知水印算法从未考虑过误差合并[8],[9]。
假设DCT交流系数符合广义高斯概率分布,本文建立了基于似然比检验的水印检测理论框架。
我们证实,所产生水印码的总和及选中的DCT系数是两个水印检测的充分统计量,而选中的DCT系数是由原始视频的量化步长来测量的。
同时,如果DCT的系数中存在水印,那么水印检测器的性能由这些充分统计量的条件均值决定。
这一均值取决于三个参数:
所选中DCT系数量化步长大小的方均值、所选中DCT系数的标准偏差和计算充分统计量所用到的DCT系数的个数N。
DCT系数的标准偏差和H.264的量化步长大小是无法控制的,在检测视频水印时,我们能控制用于计算充分统计量的水印系数的个数。
但这并不适用于图像,因为即使每幅图像中嵌入的水印码个数达到其上限值,图像的水印仍不可见,因此,对于给定的虚警概率PF,本文的视频水印算法通过计算N来获得检测值的期望概率PD。
蒙特卡罗实验的仿真结果显示,理论选择的N值确实可以计算得到PD和PF的预期值。
仿真结果同样显示,本文提出的水印方案对3×3的高斯滤波、50%的削去攻击,N(0,0.001)的白噪声和寻常蓄意攻击都具有鲁棒性。
本文按如下方式行文。
第二部分讲述从8×8DCT域得到4×4DCT域的人类视觉模型。
第三部分描述所提出的水印方案。
第四部分讨论水印的嵌入过程。
第五部分建立水印检测的理论框架并提出基于此框架的视频水印检测算法。
仿真结果在第六部分中给出。
二、4×4DCT域的人类视觉模型
Xi,j是M×M区域的DCT系数,该区域中的像素点x(n1,n2)按式
(1)的DCT基函数分布:
(1)
其中
(2)
人类视觉灵敏度随DCT基函数中频率的变化而变化。
参考文献[11]中,测量了8×8DCT域中,不同DCT频率下的量化误差阈值。
这里,我们将扩大8×8DCT域的量化误差视觉阈值,以使其适用于4×4DCT域。
4×4DCT域的基函数定义为:
(3)
8×8DCT域的基函数定义为:
(4)
比较(3)、(4)两式可得,
当
(5)
成立时,4×4DCT域基函数中的i4j4与8×8DCT域基函数中的i8j8有相同的频率。
因为对于满足0≤i4,j4≤3的所有i4j4,总存在一组i8j8满足0≤i8,j8≤7,所以可以从已知的8×8DCT基函数的视觉阈值得到4×4DCT基函数的视觉阈值。
因数ci和cj使得4×4DCT的误差幅度是8×8DCT的两倍,因此,为获得不可见性,用8×8DCT基函数的视觉阈值2i42j4除以2得到4×4DCT基函数的视觉阈值i4j4,参考文献[11]中给出了颜色空间中8×8DCT域的量化矩阵,我们用它得到4×4DCT域的量化矩阵。
实际的视觉阈值ti,j是量化步长qi,j大小的一半。
利用亮度掩蔽和对比度掩蔽这两个方面的影响,获得依赖图像的量化矩阵[7]。
如下所示的幂函数是亮度掩蔽的简单近似解:
(6)
式中,X(—)0,0是显示亮度均值所对应的直流系数,X(—)0,0,k是k区域的直流系数,aT控制掩蔽的发生程度。
按照参考文献[7]中令aT=0.649,最终,区域k(Xi,j,k)DCT系数Xi,j的掩蔽阈值mi,j,k由对比度阈值决定
(7)
式中ωi,j在0,1之间,按照参考文献[7]令ωi,j=0.7。
这种依赖图像的方式保证了每个误差都在阈值之内。
此外,沃森指出误差的能见度不单基于最大误差的能见度,而是反映了区域内不同频率的各种误差。
水印在不同的频率和区域内传播以减小误差合并,之前的感知水印算法[8],[9]从未考虑这点。
三、算法的提出
本文计算了区域k中每个系数Xi,j的掩蔽误差视觉阈值mi,j,k,这一阈值除以该区域的H.264量化步长Qk得到一值,该值决定了系数Si,j,k的水印码容量
(8)
我们将用于水印嵌入的具有视觉容量的系数集(即容量大于0)表示为
(9)
在CV中所有系数均插入水印码将产生明显的伪影。
参考文献[8]、[9]的算法是在CV中大于视觉阈值mi,j,k的系数中嵌入水印,但这在很大程度上限制了嵌入水印的比特数。
若要在视频帧中嵌入更多水印码,则要增加视觉模型中规定的掩蔽影响的参数(aT和wi,j)[7]。
危险的是,这可能需要从掩蔽中承担比实际更大的收益,进而导致可见的视觉伪影,并且水印码的位置将更容易确定,从而导致该算法应对攻击的鲁棒性降低。
本文的算法选择了CV系数集的一个子集,密匙控制该选择过程。
该算法产生一个包含水印码真实位置信息的控制板,它将被用于水印检测,这个控制板可以看作自动生成的确认号码或密码。
由于该系数选择算法被一个密匙控制,所以攻击者无法知道CV中水印系数的真实位置,如果要确信水印被消除,攻击者需要修改CV中的大多数系数,但这也将导致可见的伪影。
本文设计的系数选择算法可以在不同频率和区域中传播水印。
密匙对每个4×4区域中的所有系数进行排名,为使水印码在频率上传播,通常给嵌入系数越少的水印以更高的排名,并且只在幅值大于阈值Tcof的系数中嵌入水印。
这种算法通过限制嵌入每个区域的水印码个数Tblock实现在不同区域中水印码的传播。
该策略的一个优势是,通过提高Tblock或降低Tcof可以容易地提高水印有效载荷。
实验表明,由于误差合并的影响得到限制,所以适当放宽这些阈值,可以在不影响视觉质量的同时增加所嵌入水印码的数目。
此外,依赖于纹理和时域掩蔽,Tblock和Tcof可以做出调整来控制一帧中水印码的个数。
本算法初步尝试获得大有效载荷的同时减小误差合并,为发展出更理想、更安全的技术,依然需要深入研究。
图1为本文所提出算法的架构。
图1本文所述水印系统架构
若忽略框图中最上方的通路,则成为H.264编码器结构。
当前帧中的每个宏块都由帧内或帧间预测模式预测所得,当前宏块和预测信号间的差异就是残差,残差经变换、量化、重新排序和熵编码,最终写入码流。
编码器中有一条重建当前帧的反向路径,本文所述算法在编码器中嵌入水印,感知模型运用原始视频帧找到具有水印容量的CV系数位置,系数选择算法从这些系数中选出一个子集,水印码叠加在这些位置量化后的DCT残差上。
在压缩视频中嵌入水印有两种不同方案。
一种是在编码器中嵌入水印,此时,水印引起的误差可以在之后的预测中校正,并且误差不会在I-帧和P-帧中传播。
保证高感知质量的同时,该方案可以在压缩视频中嵌入更多水印码。
但是从已添加水印的视频帧预测得到的视频帧,其比特率将增加。
本文所讨论的就是这种方案。
另一种方案是在码流中嵌入水印。
这种方案中,误差将在I-帧和P-帧中传播,相对于视频比特率的增加来说,维持高的视觉质量难度更大。
传播中的误差可以用漂移补偿信号来弥补[12]。
四、水印的嵌入
本文提出在I-帧量化残差中嵌入水印信息。
因此只有熵编码需要嵌入水印,使得水印嵌入算法的计算复杂度有所降低。
我们使用一个具有均值为0、方差为1的双极水印W∈{-1,1}。
若
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 外文 翻译 264 编码 视频 水印 检测 机制