C语言实现DCT变换编码Word格式文档下载.docx
- 文档编号:19034022
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:14
- 大小:115.53KB
C语言实现DCT变换编码Word格式文档下载.docx
《C语言实现DCT变换编码Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《C语言实现DCT变换编码Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
for(n=0;
n<
n++)
for(m=0;
m<
m++)
for(x=0;
x<
x++)
dTemp[m*N+n]+=f[x*N+n]*coff[m]*cos((2*x+1)*PI*m/(2*N));
//第二次一维变换
m++)c
F[m*N+n]+=dTemp[m*N+x]*coff[n]*cos((2*x+1)*PI*n/(2*N));
delete[]dTemp;
delete[]coff;
}
voidiDCT(double*f,double*F)
intm,y,x;
double*dTemp=newdouble[N*N];
double*coff=newdouble[N*N];
coff[0]=1/sqrt(N);
for(m=1;
coff[m]=sqrt
(2)/sqrt(N);
memset(dTemp,0,sizeof(double)*N*N);
memset(F,0,sizeof(double)*N*N);
for(y=0;
y<
y++)
dTemp[x*N+y]+=F[x*N+m]*coff[m]*cos((2*y+1)*PI*m/(2*N));
F[x*N+y]+=dTemp[m*N+y]*coff[m]*cos((2*x+1)*PI*m/(2*N));
intmain()
{
clock_tstart,end;
start=clock();
inti;
longL;
printf("
变换维数:
"
);
scanf("
%d"
&
N);
double*f=newdouble[N*N];
//初始矩阵
double*F=newdouble[N*N];
//变换后输出矩阵
//初始化为0
for(i=0;
i<
N*N;
i++)
f[%d][%d]:
i/N,i%N);
%lf"
f[i]);
循环次数:
L);
//输出初始矩阵
变换前:
\n"
for(i=1;
=N*N;
%f\t"
f[i-1]);
if(i%N==0)
L;
DCT(f,F);
//变换
//输出变换后矩阵
变换后:
F[i-1]);
}
iDCT(f,F);
//输出反变换后矩阵
反变换后:
//printf("
delete[]f;
delete[]F;
end=clock();
耗时:
%f\n"
(double)(end-start)/CLK_TCK);
return0;
===================================================================
MPEG4中逆DCT变换
一旦DCT系数F[u][v]被恢复,那么就可以用逆DCT变换来获得逆变换值f[y][x],这些只要被饱和到-256≤f[y][x]≤255。
对短头格式,由于不存在隔行模式,因此全部用帧DCT变换,就是一般的情况。
非短头格式时,如果使用隔行模式,并且dct_type等于1,此时使用场DCT变换,场DCT变换的算法同帧DCT变换完全一样,只是输出的时候需要将按场组织的宏块转换为按帧组织的宏块。
下面简单介绍一下DCT变换和逆变换的过程。
矩阵大小为NxN的二维DCT变换为:
u,v,x,y=0,1,2,⋯N-1
其中x,y是原始域中的空间坐标
u,v是变换域中的空间坐标
逆DCT变换定义为:
如果每个像素为n比特,则DCT变换的输入为n+1比特,逆DCT变换的输出为n+1比特。
DCT变换后的DCT系数的长度为n+4比特,动态范围为[-2n+3:
+2n+3-1]。
对我们来说这里的n等于8。
NxN的逆DCT变换的实现必须符合IEEE的关于8x8的逆DCT变换的实现的标准,即IEEEStandardSpecificationfortheImplementationsof8by8InverseDiscreteCosineTransform,Std1180-1990,December
6,1990,不过有下列修改:
1)IEEE规范中的3.2小节的item
(1)中最后一句话被替换为:
<
Datasetsof1000000(onemillion)blockseachshouldbegeneratedfor(L=256,H=255),(L=H=5)and(L=384,H=383).>
>
2)IEEE规范中的3.3小节的text被替换为:
Foranypixellocation,thepeakerrorshallnotexceed2inmagnitude.Thereisnootheraccuracyrequirementforthistest.>
3)LetFbethesetof4096blocksBi[y][x](i=0..4095)definedasfollows:
a)Bi[0][0]=i-2048
b)Bi[7][7]=1ifBi[0][0]iseven,Bi[7][7]=0ifBi[0][0]isodd
c)AllothercoefficientsBi[y][x]otherthanBi[0][0]andBi[7][7]areequalto0
ForeachblockBi[y][x]thatbelongstosetFdefinedabove,anIDCTthatclaimstobecompliantshalloutputablockf[y][x]thatasapeakerrorof1orlesscomparedtothereferencesaturatedmathematicalinteger-numberIDCTfí
í
(x,y).Inotherwords,|f[y][x]-fí
(x,y)|shallbe<
=1forallxandy.
NOTE1lause
2.3Std1180-1990“ConsiderationsofSpecifyingIDCTMismatchErrors”requiresthespecificationofperiodicintra-picturecodinginordertocontroltheaccumulationofmismatcherrors.Everymacroblockisrequiredtoberefreshedbeforeitiscoded132timesaspredictivemacroblocks.MacroblocksinB-pictures(andskippedmacroblocksinP-pictures)areexcludedfromthecountingbecausetheydonotleadtotheaccumulationofmismatcherrors.Thisrequirementisthesameasindicatedin1180-1990forvisualtelephonyaccordingtoITU-TRecommendationH.261.
NOTE2WhilsttheIEEEIDCTstandardmentionedaboveisanecessaryconditionforthesatisfactoryimplementationoftheIDCTfunctionitshouldbeunderstoodthatthisisnotsufficient.Inparticularattentionisdrawntothefollowingsentencefromsubclause5.4:
“Wherearithmeticprecisionisnotspecified,suchasthecalculationoftheIDCT,theprecisionshallbesufficientsothatsignificanterrorsdonotoccurinthefinalintegervalues.”
逆DCT变换的过程这里不再详述,需要实现这个的可以去参考这个标准。
在实际应用中一般通过两次1-DIDCT变换来完成2-DIDCT变换,这种方法通常被称为行-列法。
一般来说,后者在结构上的对称性更好,并且可以重复使用硬件资源,所以在我们的芯片设计选用一种行-列法来进行IDCT单元的结构研究。
二维IDCT可以分解成二次一维IDCT运算,如以下公式。
在结构上,上两式所定义的运算使用了相同的运算“核”(如以下公式所示),它们具有相似性。
因此利用三角函数的各种关系,可以得到“核”的快速算法。
其中,
为了便于理解,可将快速算法表示成蝶形图,如下图。
将对模块进行一维IDCT变换的结果存储起来,转置输出,再进行一次IDCT变换,即为相应的二维IDCT变换。
图4-8折叠结构的二维IDCT单元
一行数据(一行有8个像素数据)在该单元中的处理流程是:
1—>
2—>
3—>
4—>
5—>
6—>
7—>
8。
DCT变换探究
1前言
此文适合于那些对DCT或对Haar小波的Mallat算法有一定了解的人。
由于我还是高一新丁,文学底子很薄弱,对于一些技术方面的知识,我是有口说不出,无法用文字表达出来,因此这里提供的知识只是我所知道的1/4左右,还有3/4我不知该如何表达,特别是第三节“深入研究DCT”,我个人认为简直是浅入!
如果你只是菜鸟,不但想看懂此文,而且还要看懂其他的类似文章,那么我教你一个最快的学习方法:
设X={10,20}
分解的方法:
低频=10+20=30,高频=10-20=-10,
即Y={30,-10}
合并的方法:
X(0)=(低频+高频)/2=(30+(-10))/2=10,X
(1)=X(0)-高频=10-(-10)=20
即X={10,20}
只要搞清楚低频和高频是怎么来的和如何合并的即可。
2DCT简介
DCT全名为DiscreteCosineTransform,中文名为离散余弦变换。
在众人皆知的JPEG编码中,就是使用了DCT来压缩图像的。
为什么DCT可以压缩图像?
我想这个问题有很多人都想知道,但其实这是错误的说法!
因为DCT在图像压缩中仅仅起到扶助的作用,给它n个数据,经变换后仍然会得出n个数据,DCT只不过消除了这n个数据的冗余性和相关性。
即,用很少的数据就能大致还原出这n个数据,其他的一些DCT系数只起到修正的作用,可有可无。
DCT有一个缺点,就是计算量很大!
因为如果按照DCT的标准变换公式(二维)来实现8x8点阵的变换需要将近上万次计算!
后来提出了一种优化方法,即将二维的DCT分解为两个一维的DCT,这样一来计算量就可以减少为原来的1/4。
但是计算量依然巨大,不具有使用价值,后来在1988年有人提出了一种快速算法叫AAN,它也是将二维的DCT分解成一维的形式,但是二维计算量已减少到只有600来次了,JPG和MPEG编码中的DCT就是使用AAN算法实现的。
DCT还有一个缺点,就是不能无损变换,因为DCT系数都是一些无理数,目前为止,依然无法解决。
3深入研究
首先让我们来看看AAN算法的第一阶级变换代码:
ForI=0To3
J=7-I
Y(I)=X(I)+X(J)
Y(J)=X(I)-X(J)
NextI
设X={10,20,30,40,50,60,70,80}
那么Y={90,90,90,90,-10,-30,-50,-70}
可以看出,这一阶级的低频部分(相加得出的数据)全部相等,而高频部分则呈线性或者是有规律的。
DCT之所以能以较少的数据大致还原图像,就是因为通过预测高频部分而达到的。
那么为何高频部分可以预测呢?
请仔细看上面的代码,可以看出DCT是由外到内来进行处理的,由于像素与像素间有一定的关联性,所以靠的越近的像素之间的差就应该越小,越远就因该越大,但也并不是说所有的数据都具有这种规律,因此DCT预测出来的高频数据就会和原高频数据不大相同,它们之间的差便是第二节提出的修正数据。
第二阶级变换则是在第一阶级变换的基础上再次分解出低、高频,和预测高频,得出修正值。
第三阶级……。
最后,再将DCT系数按照重要程度由大到小,由左到右,重排列即可。
例:
X={10,20,30,40,50,60,70,80}
经过FDCT后:
Y={127,-64,0,-7,-0,-2,0,-1}
其中127是最最重要的,而-64次之,以此类推。
可以发现,-7,-2,-1的能量都很小,说明这三个修正值可以忽略,当忽略后,
得Y={127,-64,0,0,0,0,0,0}
经过IDCT后:
X={14,18,27,39,51,63,72,76}
这与原始数据:
是非常接近的,肉眼很难发觉。
4为何JPEG2000放弃DCT
在JPEG2000里,放弃了基于块的DCT,而改为了小波变换。
为何要放弃DCT呢?
我认为最根本的原因还是跟DCT的计算量有关,第二节已经指出,为了减少计算量,我们不得不使用只能处理8X8点阵的AAN快速算法(目前,也只有基于8X8点阵的),对于一幅图像,必须将其分割成无数个8X8大小的“块”,对块进行变换。
在低码率下,就会产生方块效应,要解决这个问题,唯有不使用基于区块的AAN快速算法,而是使用直接变换法,但计算量惊人!
由于小波变换计算量很少,便于直接处理图像数据,因此就不会产生块效应,但假如用小波也进行基于8X8点阵的块变换,在低码率下,同样也会有块效应!
只要是基于块变换的,那么在低码率下就会出现块效应,无论是DCT还是小波。
因此,如果忽略DCT直接处理的计算量问题的话,我认为压缩效率会比JPEG2000更好!
(具体原因暂不讨论)
5DCT的改进
下面的代码是我对DCT变换的改进,它具有以下特性
l无损变换
l计算量少
l原位计算
经改进后,它已不再叫作DCT了,可以认为是一种新的算法,只不过是在DCT的基础上修改而来。
以下是正变换:
X为输入端,Y为输出端
设X={10,20,30,40,50,60,70,80}
那么Y={45,40,0,0,0,0,0,0}
'
----------------------------------第一阶级
Y(J)=X(J)-X(I)
Y(I)=X(I)+Fix(Y(J)/2)
-----------------------------------第二阶级
ForH=0To4Step4
ForI=0To1
J=3-I
X(J+H)=Y(J+H)-Y(I+H)
X(I+H)=Y(I+H)+Fix(X(J+H)/2)
NextH
-----------------------------------第三阶级
ForI=0To6Step2
Y(I+1)=X(I+1)-X(I)
Y(I)=X(I)+Fix(Y(I+1)/2)
-----------------------------------预测
Y(3)=Y(3)-Y
(2)
Y(6)=Y(6)-Y(7)
Y(7)=Y(7)-Y(4)
重要性排序与AAN一样,皆为{0,4,2,6,1,5,7,3},此略
为何能无损?
为何能原位?
和具体实现原理暂时略,以后我会补上
6参考
[1]丁贵广,计文平,郭宝龙VisualC++6.0数字图像编码p44,p57,p170
快速DCT变换
仿效FFT的FDCT方法有与DCT无关的复数运算部分,选用代数分解法可以降低运
算量,达到高速运算的目的。
代数分解法实现如下:
对一维DCT表达式直接展开,
寻找各点表达式中共同项,仿FFT蝶形关系,将表达式中的共同项作为下一级节
点,依次进行多次,最后得到变换结果。
一、DCT部分
例子:
Definecos(n*pi/16)Cn
F(0,v)=0.5*C(0)*[x(0)+x
(1)+x
(2)+x(3)+x(4)+x(5)+x(6)+x(7)]
F(1,v)=0.5*C(0)*[x(0)*C1+x
(1)*C3+x
(2)*C5+x(3)*C7+x(4)*C9
+x(5)*C11+x(6)*C13+x(7)*C15]
=0.5*{[x(0)-X(7)]C1+[X
(1)-X(6)]*C3+[X
(2)-x(5)]*C5
+[x(3)-x(4)]*C7]
从上面的式子可以看到07,16,25,34可以作为第一次运算的相加节点,将所有节点
的表达式列出后,可发现一个规律,得到一蝶形图,按之编程,如下:
#define
C10.9808
C20.9239
C30.8315
C40.7071
C50.5556
C60.3827
C70.1951
//先做行DCT
voidfdctrow(double*blk)
doubleS07,S16,S25,S34,S0734,S1625;
doubleD07,D16,D25,D34,D0734,D1625;
S07=blk[0]+blk[7];
S16=blk[1]+blk[6];
S25=blk[2]+blk[5];
S34=blk[3]+blk[4];
S0734=S07+S34;
S1625=S16+S25;
D07=blk[0]-blk[7];
D16=blk[1]-blk[6];
D25=blk[2]-blk[5];
D34=blk[3]-blk[4];
D0734=S07-S34;
D1625=S16-S25;
blk[0]=0.5*(C4*(S0734+S1625));
blk[1]=0.5*(C1*D07+C3*D16+C5*D25+C7*D34);
blk[2]=0.5*(C2*D0734+C6*D1625);
blk[3]=0.5*(C3*D07-C7*D16-C1*D25-C5*D34);
blk[4]=0.5*(C4*(S0734-S1625));
blk[5]=0.5*(C5*D07-C1*D16+C7*D25+C3*D34);
blk[6]=0.5*(C6*D0734-C2*D1625);
blk[7]=0.5*(C7*D07-C5*D16+C3*D25-C1*D34);
//再做列DCT
voidfdctcol(double*blk)
S07=blk[0*8]+blk[7*8];
S16=blk[1*8]+blk[6*8];
S25=blk[2*8]+blk[5*8];
S34=blk[3*8]+blk[4*8];
D07=blk[0*8]-blk[7*8];
D16=blk[1*8]-blk[6*8];
D25=blk[2*8]-blk[5*8];
D34=blk[3*8]-blk[4*8];
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 实现 DCT 变换 编码