哈夫曼树编码译码实验报告.docx
- 文档编号:7206961
- 上传时间:2023-01-21
- 格式:DOCX
- 页数:21
- 大小:125.46KB
哈夫曼树编码译码实验报告.docx
《哈夫曼树编码译码实验报告.docx》由会员分享,可在线阅读,更多相关《哈夫曼树编码译码实验报告.docx(21页珍藏版)》请在冰豆网上搜索。
哈夫曼树编码译码实验报告
数据结构课程设计
设计题目:
哈夫曼树编码译码
课题名称
哈夫曼树编码译码
院系
年级专业
学号
姓名
成绩
课题设计
目的与
设计意义
1、课题设计目的:
在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。
哈夫曼编码是一种编码方式,以哈夫曼树一即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。
哈弗曼编码使用一特殊的编码表将源字符(例如某文件中的一个符号)进行编码。
这编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的。
2、课题设计意义:
哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。
树中从根到每个叶子都有一条路径,对路径上的各分支约定:
指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。
哈弗曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。
指导教师:
年月日
第一章需求分析1..
第二章设计要求1..
第三章概要设计2.
(1)其主要流程图如图1-1所示。
3
(2)设计包含的几个方面4.
第四章详细设计4.
(1)①哈夫曼树的存储结构描述为:
4
(2)哈弗曼编码5.
(3)哈弗曼译码7.
(4)主函数&
(5)显示部分源程序:
8.
第五章调试结果10
第六章心得体会12
第七章参考文献12
附录:
1.2
第一章需求分析
在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。
哈夫曼编码是一种编码方式,以哈夫曼树一即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。
哈弗曼编码使用一特殊的编码表将源字符(例如某文件中的一个符号)进行编码。
这编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率
高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。
哈夫曼编码
的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。
树
中从根到每个叶子都有一条路径,对路径上的各分支约定:
指向左子树的分支表示“0”码,指向右子树的分支表示“T码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。
哈弗曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。
第二章设计要求
对输入的一串电文字符实现哈夫曼编码,再对哈夫曼编码生成的代码串进行
译码,输出电文字符串。
通常我们把数据压缩的过程称为编码,解压缩的过程称
为解码。
电报通信是传递文字的二进制码形式的字符串。
但在信息传递时,总希
望总长度能尽可能短,即采用最短码。
假设每种字符在电文中出现的次数为Wi,
编码长度为Li,电文中有n种字符,则电文编码总长度为刀WiLi。
若将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。
那么,刀WiLi恰好为二叉树上带权路径长度。
因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。
设计实现的功能:
(1)哈夫曼树的建立;
(2)哈夫曼编码的生成;(3)编码文件的译码。
第三章概要设计
哈夫曼编译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进行译码。
在数据通信中,经常需要将传送的文字转换成由二进制字符0、1组成的二进制串,称之为编码。
构造一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,则从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。
最简单的二进制编码方式是等长编码。
若米用不等长编码,让出现频率高的字符具有较短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。
哈夫曼树课用于构造使电文的编码总长最短的编码方案。
(1)其主要流程图如图1-1所示
否
是否为根结点?
是
左子是否为空?
否
否
是否为空
是
结点数是否大于1
是
l<2*N?
开始
/X”输出根结点和权值
输出两子结点和已构造的结点
双亲结点为两子结点之和
将data和权值赋给ht
此时编码为0
调用SELECT函数
编码为1
计算根结点函数
(2)设计包含的几个方面:
①哈夫曼树的建立
哈夫曼树的建立由哈夫曼算法的定义可知,初始森林中共有n棵只含有根结点的二叉树。
算法的第二步是:
将当前森林中的两棵根结点权值最小的二叉树,合并
成一棵新的二叉树;每合并一次,森林中就减少一棵树,产生一个新结点。
显然要进行n-1次合并,所以共产生n-1个新结点,它们都是具有两个孩子的分支结点。
由此可知,最终求得的哈夫曼树中一共有2n-1个结点,其中n个结点是初始森林的n个孤立结点。
并且哈夫曼树中没有度数为1的分支结点。
我们可以利用一个大小为2n--1的一维数组来存储哈夫曼树中的结点。
②哈夫曼编码
要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求和实际需要定义的类型如下:
typedetstruct{
charch;//存放编码的字符
charbits[N+1];//存放编码位串
intlen;//编码的长度
}CodeNode;//编码结构体类型
③代码文件的译码
译码的基本思想是:
读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相
等时,即取出其对应的字符存入一个新串中。
第四章详细设计
(1)①哈夫曼树的存储结构描述为:
#defineN50//叶子结点数
#defineM2*N-1//哈夫曼树中结点总数
typedefstruct{
intweight;II叶子结点的权值
intIchild,rchild,parent;II左右孩子及双亲指针
}HTNode;II树中结点类型
typedefHTNodeHuffmanTree[M+1];
②哈弗曼树的算法
voidCreateHT(HTNodeht[],intn)II调用输入的数组ht[],和节点数n
{
inti,k,lnode,rnode;
intmin1,min2;
for(i=0;i<2*n-1;i++)
inti,f,c;
hc.start=n;c=i;
f=ht[i].parent;
voideditHCode(HTNodeht[],HCodehcd[],intn)〃编码函数
{
charstring[MAXSIZE];
inti,j,k;
scanf("%s",string);II把要进行编码的字符串存入string数组中
printf("\n输出编码结果:
\n");
for(i=0;string[i]!
='#';i++)II#为终止标志
{
for(j=0;j { if(string[i]==ht[j].data) 就输出这个字符的编码 { for(k=hcd[j].start;k<=n;k++) { printf("%c",hcd[j].cd[k]); } break; } } } } (3)哈弗曼译码 voiddeHCode(HTNodeht[],HCodehcd[],intn) { charcode[MAXSIZE]; inti,j,l,k,m,x; scanf("%s",code); while(code[0]! ='#') for(i=0;i { m=0; for(k=hcd[i].start,j=0;k<=n;k++,j++) { if(code[j]==hcd[i].cd[k]) m++; } if(m==j) 串个数相等时则输出这个的data数据 { printf("%c",ht[i].data); for(x=0;code[x-1]! =#;x++) 删除 { //循环查找与输入字符相同的编号,相同的 //输出完成后跳出当前for循环 〃译码函数 //把要进行译码的字符串存入code数组中 //m为想同编码个数的计数器 //j为记录所存储这个字符的编码个数 //当有相同编码时m值加1 //当输入的字符串与所存储的编码字符 //把已经使用过的code数组里的字符串 code[x]=code[x+j]; } } } (4)主函数 voidmain() { intn=26,i; charorz,back,flag=1; charstr[]={'A','B',C,'D','E','F','G','H',T,'J','K','L','M','N','O','P',Q,'R','S',T,'U','V','W,X,'Y','Z'}; //初始化 intfnum[]={186,64,13,22,32,103,21,15,47,57,1,2,32,20,57,63,15,1,48,51,80,23,8,18,1,16}; //建立结构体 //建立结构体 //把初始化的数据存入ht结构体中 //菜单函数,当flag为0时跳出循环 //初始化 HTNodeht[M]; HCodehcd[N]; for(i=0;i { ht[i].data=str[i]; ht[i].weight=fnum[i]; } while(flag) (5)显示部分源程序: { printf("\n"); printf(” ********************************"); printf("\n **1 显示编码 **"); printf("\n **2 进行编码 **"); printf("\n **3 进行译码 **"); printf("\n **4 退出 **\n"); printf(” ***********************************"); printf("\n"); printf(" 请输入选择的编号 : "); scanf("%c",&orz); switch(orz) case'a': case'A': II清屏函数 (以#结束): \n"); system("cls"); CreateHT(ht,n); CreateHCode(ht,hcd,n);DispHCode(ht,hcd,n); printf("\n按任意键返回...");getch(); system("cls"); break; case'b': case'B': system("cls"); printf(”请输入要进行编码的字符串editHCode(ht,hcd,n); printf("\n按任意键返回...");getch(); system("cls"); break; case'c': caseC: system("cls"); DispHCode(ht,hcd,n);printf("请输入编码(以#结束): \n");deHCode(ht,hcd,n); printf("\n按任意键返回...");getch(); system("cls"); break; case'd': case'D': flag=0; break; default: system("cls"); }}} 第五章调试结果 进入主菜单 打;\FlokimFiLesXIictu^uftVisualStudioW^Projeuls\drsaXVt;Luc\dCs«ir■■■ 选A时的显示结果 |■--*c;\Frogia> FiLesXIiciosortVisual3tudio\BrProjeclsXdrsaXDelJuc\dfsa....| 输出哈夫曼编码: 白: 111 D- 士◎丄0 C= 011000 D= 0B0S0 E= 10110 F; 010 G- 1109丄丄 H: 匹丄丄010 J: MUM1 J: Bill K: 011301006 L: 011001(Ml M: loin H: 110010 0: 1000 P: 1001 Q: n: H11RR1mi £= sale T= QBH u= 1101 u= 0&&91 V- 01X0011 X: 刖 d 选择B时的显示结果 选C时的显示结果 、"c;\PlugiuFilesMiceosQttTi? ualStudiDWyPLOjec-isXdrsx^eVuc^drsz.... k: P; Q: V- 请输入编码同卫结車X liiisieit fie 按任意诧返叵…. 0801Bill011081003尬1.丄90101110111113S101009ieaie>i丄e>丄丄unutntM] 08111101090910113011110901811301018110P»fW 第六章心得体会 通过这次课程设计,让我对一个程序的数据结构有更全面更进一步的认识,根据不同的需求,采用不同的数据存储方式,不一定要用栈,二叉树等高级类型,有时用基本的一维数组,只要运用得当,也能达到相同的效果,甚至更佳,就如这次的课程设计,通过用for的多重循环,舍弃多余的循环,提高了程序的运行效率。 在编写这个程序的过程中,我复习了之前学的基本语法,哈弗曼树最小路径的求取,哈弗曼编码及译码的应用围,程序结构算法等一系列的问题它使我对数据结构改变了看法。 在这次设计过程中,体现出自己单独设计模具的能力以及综合运用知识的能力,体会了学以致用、突出自己劳动成果的喜悦心情,也从中发现自己平时学习的不足和薄弱环节,从而加以弥补。 第七章参考文献 [1]徐孝凯编著,《数据结构课程实验》,清华大学出版2002年第一版 [2]乃笑编著,《数据结构与算法》,电子工业2004年10月 [3]严蔚敏《数据结构》(C语言版)清华大学 源程序如下: #include #include #include #include #defineN50 #defineM2*N-1 #defineMAXSIZE100 附录: II要用system函数要调用的头文件 //用getch()要调用的头文件 II义用N表示50叶节点数 II用M表示节点总数当叶节点数位n时总节点数为2n-1 chardata;intweight;intparent;intlchild;intrchild; typedefstruct II结点值 II权值 II双亲结点 〃左孩子结点 II右孩子结点 }HTNode; typedefstruct charcd[N]; //存放哈夫曼码 intstart; }HCode; //从start开始读cd中的哈夫曼码 voidCreateHT(HTNodeht[],intn) //调用输入的数组ht[],和节点数n inti,k,lnode,rnode; intmin1,min2; for(i=0;i<2*n-1;i++) ht[i].parent=ht[i].lchild=ht[i].rchild=-1; 〃所有结点的相关域置初值-1 II构造哈夫曼树 for(i=n;i<2*n-1;i++) min1=min2=32767; //int的围是-32768—32767 Inode=rnode=-1; //Inode和rnode记录最小权值的两个结点位置 for(k=O;k<=i-1;k++) if(ht[k].parent==-1) //只在尚未构造二叉树的结点中查找 if(ht[k].weight //若权值小于最小的左节点的权值 min2=min1;rnode=Inode; min1=ht[k].weight;Inode=k; elseif(ht[k].weight min2=ht[k].weight;rnode=k; ht[Inode].parent=i;ht[rnode].parent=i; //两个最小节点的父节点是i ht[i].weight=ht[Inode].weight+ht[rnode].weight; 为两个最小节点权值之和 //两个最小节点的父节点权值 ht[i].Ichild=Inode;ht[i].rchild=rnode; 〃父节点的左节点和右节点 voidCreateHCode(HTNodeht[],HCodehcd[],intn){ inti,f,c; HCodehc; for(i=0;i { hc.start=n;c=i; f=ht[i].parent; while(f! =-1) { if(ht[f].lchild==c) hc.cd[hc.start--]='O: else hc.cd[hc.start--]='1'; c=f;f=ht[f].parent; } hc.start++; hcd[i]=hc; } 〃根据哈夫曼树求哈夫曼编码 //循序直到树根结点结束循环 //处理左孩子结点 //处理右孩子结点 //start指向哈夫曼编码hc.cd[]中最开始字符 voidDispHCode(HTNodeht[],HCodehcd[],intn){ inti,k; printf("输出哈夫曼编码: \n"); for(i=0;i { printf("%c: \t",ht[i].data); for(k=hcd[i].start;k<=n;k++) { printf("%c",hcd[i].cd[k]); } printf("\n"); } } //输出哈夫曼编码的列表 II输出data中的所有数据,即A-Z 〃输出所有data中数据的编码 voideditHCode(HTNodeht[],HCodehcd[],intn) { charstring[MAXSIZE]; inti,j,k; scanf("%s",string); printf("\n输出编码结果: \n”); for(i=0;string[i]! ='#';i++) { for(j=0;j { if(string[i]==ht[j].data) 就输出这个字符的编码 { for(k=hcd[j].start;k<=n;k++) { printf("%c",hcd[j].cd[k]); } break; } } } } 〃编码函数 //把要进行编码的字符串存入string数组中 //#为终止标志 //循环查找与输入字符相同的编号,相同的 //输出完成后跳出当前for循环 voiddeHCode(HTNodeht[],HCodehcd[],intn){ charcode[MAXSIZE]; inti,j,l,k,m,x; scanf("%s",code); while(code[0]! ='#') for(i=0;i { m=0; for(k=hcd[i].start,j=0;k<=n;k++,j++){ if(code[j]==hcd[i].cd[k]) 〃译码函数 //把要进行译码的字符串存入code数组中 //m为想同编码个数的计数器 //j为记录所存储这个字符的编码个数 //当有相同编码时m值加1 〃当输入的字符串与所存储的编码字符 //把已经使用过的code数组里的字符串 HTNodeht[M];HCodehcd[N]; for(i=0;i { ht[i].data=str[i];ht[i].weight=fnum[i]; } while(flag) { printf("\n");printf(” printf("\n printf("\n m++; } if(m==j) 串个数相等时则输出这个的data数据 { printf("%c",ht[i].data); for(x=0;code[x-1]! ='#';x++) 删除 { code[x]=code[x+j]; } } } }voidmain() { intn=26,i; charorz,back,flag=1; charstr[]={'A','B',C,'D','E','F','G','H',T,'J','K','L','M','N','O','P',Q,'R','S',T,'U','V','W,X,'Y','Z'}; //初始化 intfnum[]={186,64,13,22,32,103,21,15,47,57,1,2,32,20,57,63,15,1,48,51,80,23,8,18,1,16}; //初始化 //建立结构体 //建立结构体 //把初始化的数据存入ht结构体中 //菜单函数,当flag为0时跳出循环 **************************************"); **A显示编码**"); **B进行编码**"); printf("\n**C进行译码**"); printf("\n**D退出**\n"); printf("****************************************"); printf("\n"); printf(”请输入选择的编号: "); seanf("%c",&orz); swi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈夫曼树 编码 译码 实验 报告