基于统计模型及SVM的低速率语音编码QIM隐写检测.docx
- 文档编号:23168577
- 上传时间:2023-05-15
- 格式:DOCX
- 页数:15
- 大小:426.01KB
基于统计模型及SVM的低速率语音编码QIM隐写检测.docx
《基于统计模型及SVM的低速率语音编码QIM隐写检测.docx》由会员分享,可在线阅读,更多相关《基于统计模型及SVM的低速率语音编码QIM隐写检测.docx(15页珍藏版)》请在冰豆网上搜索。
基于统计模型及SVM的低速率语音编码QIM隐写检测
6期李松斌等:
基于统计模型及SVM的低速率语音编码QIM隐写检测1173融合特征向量中的子向量在隐写前后的取值发生了改变;对于G所有文件的V.729,VR均值为0.86,对于G因此可以认为本文所提.723.1该值为0.68.——隐写将导致该特取的特征对隐写是非常敏感的—征发生显著性变化.这对隐写检测非常有利.用支持向量机作为分类器.SVM分类器是一种监督学习分类器,它是通过使用某些已标注类别的样本,进行训练获得的.对于特征向量t分类器f的训练和预测步骤如下:
()获取尽可能多的c1over类别低速率压缩编并使用Q分组码本使用码语音片段,IM嵌入方法(]文献[算法进行优化划分)进行隐写以获得c8over类别中每个样本对应的s并做好标注;teo样本,g()抽取上一步骤所获得的两类样本的特征向2,标记每个向量的类别;量t()训练分类器:
使用上一步骤获得已标记类3别的特征向量集合训练分类器,获得分类器f;()使用分类器f对未知类别样本进行隐写检4,测:
对于未知类别样本首先抽取特征向量t将t作分类器输出即为隐写检测结为分类器f的输入,果.本文基于LIBSVM是一个优秀的SVM工具,LIBSVM进行分类器的训练和预测.3 基于机器学习的隐写检测假设有一个未知是否存在QIM隐写的压缩语,音片段S隐写检测的目标即判定S是否存在QIM隐写.假设通过对S进行处理所抽取的可用于隐写检,)测的特征向量为t则隐写检测过程可用式(表示:
9),}()t+1,-19y=f(y∈{其中函数f为隐写检测器其输出结果即为检测结若y=+1,表示S不存在隐写,否则存在隐写.果,显然函数f是一个二值分类器,隐写检测过程实质上是分类过程:
假设y=+1时S属于未隐写类(称,为c称为sover类)teogy=-1时S属于隐写类(,类)则隐写检测就是将未知类别的样本S分为对于分类问题,基于机器学习cover类或steo类.g的分类方法是当前主流,本文也采用这种方法.对于未知类别的压缩语音片段,本文基于机器学习的隐写检测过程如图4所示.显然,隐写检测的关键是确定特征向量t和分类器f.4 实验及讨论本文选择G.729和G.723.1作为实验测试所]用的低速率语音编码器,并采用文献[给出的方法8本文针对两种编码器分别进行了本作为隐写算法.文隐写检测方法的性能测试,并与文献[给出的13]隐写检测方法进行了比较.为了阐明算法具有较好的普适性,本文选择不同发音人的多个语音片段组成语音样本库.所用语音片段样本包含4个种类,分别是中文男声图4 压缩语音片段隐写检测过程(,,包含5中文女ChineseManCM)00个语音片段; ,,包含5英声(ChineseWomanCW)32个语音片段; ,,文男声(包含8EnlishManEM)18个语音片段; g,,英文女声(包含8Enlish WomanEW)24个语音g片段.语音片段总计2每个语音片段的时长674个.,,为1采样率为8对每个采样点用10s000Hz6bit进行量化,用PCM格式存储.我们称没有进行信息隐藏的压缩语音片段为未,隐写类(否则称其为隐写类(不同类别C类)S类).发音人的语音片段编码所得的C类及其对应的S类压缩语音流片段构成进行分类器进行训练和预由于本文已将隐写检测问题转化为测时的数据集.)分类问题,因此本文采用式(定义的分类准确率10]在文献[中,特征向量的提取必须首先对压13缩语音片段进行解码,其后基于解码获得的语音数据计算基于MF这种特征提取CC的统计特征向量,方法需要进行解码操作,甚为耗时.上一节中我们介绍了本文的特征提取方法,该方法不需要对压缩语音进行解码,直接在压缩域抽取特征向量,计算速度较快.为此,本文将上节给出的音素分布特性量化向量H作为特征向量t.关于分类器的设计,现有研究中,不同的对象分这些方法大致可分类识别系统有不同的训练方法,为两大类:
判别法(和生成discriminativearoach) pp)法(判别法可以灵活地选择用enerativearoach. gpp来识别的特征,检测速度也较快,为此本文采用基于判别法的分类器.在判别型分类器中,由于支持向量,机(较适合小样本SuortVectorMachineSVM) pp训练的情况,本文考虑到训练时间和训练样本量,使Precision对检测算法的性能的进行评估:
^+^λθPrecision=λ+θ()10^其中λ和θ是数据集中的C类和S类样本的个数,λ^ 和θ则是被分类器准确判定类别的C类和S类样本
1174计 算 机 学 报2013年的个数.4.1 低速率语音编码器QIM隐写检测结果对语音样本库中CM中的每个PCM格式存储的语音片段使用G获得.729编码器进行压缩编码,没有进行信息隐藏的500个G.729压缩语音流片,段,由于G因此每个片段包含.729的帧长为10ms这些压缩语音片段组成未隐写类1000个G.729帧,别(样本.使用文献[介绍的CC类)8]NV算法方法对G.729进行矢量量化时的3个分裂矢量码本进获得进行Q再次行优化划分,IM嵌入的分组码本.对每个PCM格式的语音样本进行基于G.729标准的编码压缩,并且,在对每个帧的LPC系数进行矢量量化时使用Q获得包含隐IM机制嵌入机密信息,,藏信息的5个压缩语音流片段这些压缩语00G.729样本.音片段组成隐写类别(S类)C类及其对应的S类压缩语音流片段构成进行分类器训练和预测时的同理可得CW、这CM数据集.EM和EW数据集.数据集.4个数据集的所有样本构成混合(Hbrid)y因此,本文在5个不同的数据集上评估了算法性能.用类似的方法获得使用G.723.1作为低速率进行检测算法性能评估的数据集.语音编码器时,,G.由于每个语音片段的长度为10s723.1的帧,长为3因此每个G0ms.723.1压缩语音片段包含333个帧.对上述的每个数据集,选择75%的C类样本及其对应的S类样本,组成该种类分类器的训练样本剩余的2库,5%样本组成测试样本库用于评估训练表1给出了测试结果,所得分类器的分类准确性.表1中列PDFV是使用本文方法获得的隐写检测结果,列MF的方法获得的隐写CC是使用文献[13]检测结果.从测试结果看本文方法在5个测试数据的方法,在语音片段时长为集上均优于文献[13]对于两种低速率语音编码标准,本文方法检10s时,测准确率均超过9而文献[的方法对于8%,13]对5个数据集检测G.723.1基本上无法有效检测:
准确率均低于60%.表1 语音片段时长为10s时的测试结果数据集名CM CW EM EW Hbrid y使用G.729的结果/%PDFV 100.00 100.00 100.00 100.00 99.98 MFCC94.00 88.72 80.00 77.43 86.70 使用G.723.1的结果/%PDFV 98.40 96.80 98.22 97.87 98.62 MFCC49.6052.2654.6356.5552.76上面获得的测试结果所用的语音片段的时长为本文面向的是V10s.oIP中低速率编码的压缩语音流的隐写检测;进行隐VoIP中的语音流是实时流,为了达到较快检测以写检测前必须进行流的存储.及减少存储的数据量,显然达到可以接受的隐写检测准确率时,我们希望所需要存储的语音流时长越为此,我们在下文对语音片段时长与隐写检短越好.测的性能进行了评估.4.2 压缩语音流时长对隐写检测结果的影响为了评估语音片段时长对隐写检测结果的影响,首先根据不同的低速率编码器的帧长,对数据集中的1对于0s长度的语音片段进行截短处理.,由于其帧长为1G.729,0ms10s长度的语音片段总共包含了1截取前N(个帧000帧,0<N1000)编码所需的采样值,构成时长为0.01×Ns的新的对这些新的CM、CW、EM、EW和Hbrid数据集.y数据集进行分类器的训练并测试分类准确性.表2给出了不同语音片段时长时(的检测N取不同值)结果.表2 压缩语音流时长变化时的G.729QIM隐写检测结果时长/s0.10 0.15 0.20 0.40 0.80 1.60 3.20 4.80 6.40 8.00 CM的检测结果/%PDFV 69.16 78.14 85.42 94.61 99.40 99.90 100.00 100.00 100.00 100.00 MFCC53.60 59.60 58.80 66.40 67.60 77.60 87.20 89.60 89.60 94.00 CW的检测结果/%PDFV 65.22 80.35 87.59 94.73 98.21 100.00 100.00 100.00 100.00 100.00 MFCC52.26 57.89 57.52 60.53 65.41 67.67 73.68 81.95 86.84 88.35 EM的检测结果/%PDFV 67.84 78.42 85.57 94.25 99.02 99.87 100.00 100.00 100.00 100.00 MFCC57.07 63.41 63.66 67.07 77.07 75.12 77.32 75.59 76.83 77.07 EW的检测结果/%PDFV 66.20 74.75 81.67 93.56 98.66 99.75 99.93 100.00 100.00 100.00 MFCC52.91 56.80 58.50 60.44 62.86 67.23 74.76 75.24 80.34 81.30 Hbrid的检测结果/%yPDFV 74.33 83.38 89.60 95.92 99.14 99.85 100.00 100.00 100.00 100.00 MFCC58.3761.2161.7366.2969.5175.1178.9281.5484.4586.92为了更直观地比较两种方法的性能,图5给出了5个数据集的平均检测准确率与语音片段时长的从该图可以看出,随着语音片段时长的增关系图.加,隐写检测准确率也随之提升;本文方法在任一时长下其检测准确率均优于文献[的方法;在语音13]片段时长为0.40s时本文方法已能够达到有效检测(,检测准确率已经超过9而此时文献[的方0%)13]法仍不超过7因此,对于G.在语音片段时0%.729,
6期李松斌等:
基于统计模型及SVM的低速率语音编码QIM隐写检测1175];长较小时本文方法性能远优于文献[在语音片段13),时长较大时(超过4本文达到1.8s00%的隐写检]测准确率,这一点是文献[无法达到的.13个帧编码所需的采样值,构成时长为0.03×Ns的新的CM、对这些CW、EM、EW和Hbrid数据集.y新的数据集进行分类器的训练并测试分类准确性.表3给出了不同语音片段时长时(的N取不同值)为了更好地比较两种方法的性能,图6给检测结果.出了5个数据集的平均检测准确率与语音片段时长从该图可以看出,随着语音片段时长的增的关系图.加,本文方法的隐写检测准确率也随之提升,但是文]的方法其检测准确率一直低于6可以认献[130%(为无法对隐写作出检测)其原因可能是G..723.1[]每3的采样值采用文献的隐写方法仅0ms8QIM嵌入3嵌入率太低导致解码后的语音bit秘密信息,这使基采样值序列并不因隐写而产生较大的改变,于采样值序列统计的特征对隐写不够敏感,从而导但是本文方法是压缩域方法,不考察解致检测率低.码后的语音数据,因此仍能获得较好的隐写检测准在语音片段时长较大超过6本文方法检确率:
s时,测准确率超过90%.图5 5个数据集的G.729QIM隐写检测平均准确率,由于G.723.1的帧长为30ms10s长度的语)音片段总共包含了3仍截取前N(33帧,0<N333表3 压缩语音流时长变化时的G.723.1QIM隐写检测结果时长/s0.30 0.60 1.20 2.40 3.60 4.50 6.00 7.50 9.00 CM的检测结果/%PDFV 52.79 55.48 57.48 71.85 87.62 89.42 92.61 96.10 97.90 MFCC56.80 52.40 56.80 54.40 51.20 50.00 57.20 50.00 51.20 CW的检测结果/%PDFV 45.95 46.52 51.12 64.56 80.45 85.90 90.97 94.73 95.86 MFCC54.14 51.88 47.74 51.50 51.13 56.39 53.38 57.89 53.38 EM的检测结果/%PDFV 44.74 49.75 56.47 80.01 85.81 90.95 93.82 95.90 97.31 MFCC50.24 50.98 52.44 52.44 53.91 53.17 51.95 52.68 49.02 EW的检测结果/%PDFV 45.69 50.60 60.74 74.27 87.10 89.44 94.23 97.02 97.63 MFCC47.82 50.73 55.10 52.18 53.64 53.88 53.40 52.43 55.10 Hbrid的检测结果/%yPDFV 49.71 53.96 68.37 80.18 88.78 91.70 95.12 97.23 98.09 MFCC48.8050.4548.7352.4752.0251.7953.4452.3253.145 总 结本文对在低速率语音编码过程中的QIM隐写给出了高效的检测方法.本文发现一段语音中的音素其分布存在不均衡性和相关性,据此本文提出了一种基于压缩域的隐写检测特征抽取方法,并结合支持向量机构建了隐写检测分类器.与基于时域的,特征抽取方法相比本文方法不仅具有较高的检测而且节省了压缩语音的解码时间,实现了对准确率,压缩语音流的快速隐写检测.本文方法借鉴了文档正是利用这些的向量空间表示方法及其分类模型,方法所蕴含的深刻思想建立了本文的隐写检测算图6 5个数据集的G.723.1QIM隐写检测平均准确率法.本文方法为隐写检测提供了一种新的思路.参考文献根据上述实验,本文方法对于两种典型的低速率语音编码器中的Q检测性IM隐写均能有效检测,能远优于时域特征抽取方法.[]M//1azurczk W,LubaczJ.SteanorahofVoIPstreams yggpy
1176计 算 机 学 报2013年Proceedinsofthe3rdInternationalSmosiumonInforma -gyp,M,tionSecurit.Monterreexico2008:
10011018 -yy[]H2uanY,XiaoB,XiaoH.Imlementationofcovertcom- gp //municationbasedonsteanorahProceedinsofthe4t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 统计 模型 SVM 速率 语音 编码 QIM 检测