赫夫曼树的实现数据结构实验报告.docx
- 文档编号:1826431
- 上传时间:2022-10-24
- 格式:DOCX
- 页数:13
- 大小:372.31KB
赫夫曼树的实现数据结构实验报告.docx
《赫夫曼树的实现数据结构实验报告.docx》由会员分享,可在线阅读,更多相关《赫夫曼树的实现数据结构实验报告.docx(13页珍藏版)》请在冰豆网上搜索。
赫夫曼树的实现数据结构实验报告
软件学院设计性实验报告
专业:
.NET年级/班级:
2012—2013学年第一学期
课程名称
数据结构
指导教师
本组成员
学号姓名
实验地点
实验时间
第十二、十三、十四周
项目名称
哈夫曼编/译码系统的设计与实现
实验类型
设计性
1.问题描述:
利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。
但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码(解码)。
对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。
试为这样的信息收发站设计一个哈夫曼编/译码系统。
2.一个完整的系统应具有以下功能:
1)初始化(Initialzation)。
从数据文件DataFile.data中读入字符及每个字符的权值,建立哈夫曼树HuffTree;
2)编码(EnCoding)。
用已建好的哈夫曼树,对文件ToBeTran.data中的文本进行编码形成报文,将报文写在文件Code.txt中;
3)译码(Decoding)。
利用已建好的哈夫曼树,对文件CodeFile.data中的代码进行解码形成原文,结果存入文件Textfile.txt中;
4)输出(Output):
输出DataFile.data中出现的字符以及各字符出现的频度(或概率);输出ToBeTran.data及其报文Code.txt;输出CodeFile.data及其原文Textfile.txt;
要求:
所设计的系统应能在程序执行的过程中,根据实际情况(不同的输入)建立DataFile.data、ToBeTran.data和CodeFile.data三个文件,以保证系统的通用性。
一、实验目的
1、掌握哈夫曼编码原理;
2、熟练掌握哈夫曼树的生成方法;
3、理解数据编码压缩和译码输出编码的实现。
二、实验要求
实现哈夫曼编码和译码的生成算法。
三、实验内容
先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。
四、实验原理
1、哈夫曼树的定义:
假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;
2、哈夫曼树的构造:
weight为输入的频率数组,把其中的值赋给依次建立的HTNode对象中的data属性,即每一个HTNode对应一个输入的频率。
然后根据data属性按从小到大顺序排序,每次从data取出两个最小和此次小的HTNode,将他们的data相加,构造出新的HTNode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。
在把这个新的节点插入最小堆。
按此步骤可以构造构造出一棵哈夫曼树。
通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找parent,直到parent为树的顶点为止。
这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个频率都会有一个01编码与之唯一对应,并且任何编码没有前部分是同其他完整编码一样的。
五、实验流程
1 初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;
2 根据符号概率的大小按由大到小顺序对符号进行排序;
3 把概率最小的两个符号组成一个节点;
4 重复步骤
(2)(3),直到概率和为1;
5 从根节点开始到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;
6 从根节点开始,对符号进行编码;
7 译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。
六、实验程序
数据结构:
下面是编译码系统中所用的数据结构。
在这个系统中,哈夫曼树的存储结构采用顺序存储;其结点结构为:
程序中用到的头文件、类型定义及主要的函数原型如下:
#include
#include
#include
#include
typedefstruct
{
unsignedintweight;
unsignedintparent,lchild,rchild;
unsignedcharch;
}HTNode,*HuffmanTree;//动态分配数组存储赫夫曼树
typedefchar**HuffmanCode;//动态分配数组存储赫夫曼编码表
charstr[9]={'','a','b','c','d','e','f','g','h'};
intm;
voidSelect(HuffmanTree&HT,inti,int&s1,int&s2)
{
intj,min1,min2;
for(j=1;j<=i;j++)
if(HT[j].parent==0)
if(HT[j].weight { if(s1>=s2) {s1=HT[j].weight;min1=j;} else {s2=HT[j].weight;min2=j;} } s1=min1; s2=min2; } voidPrint1(HuffmanTreeHT) { inti; printf("建立好的赫夫曼树的存储情况: \n"); printf("存储单元字符权值双亲左孩子右孩子\n"); for(i=1;i<=m;i++) printf("%-4d%c%-4d%-4d%d%d\n",i,HT[i].ch,HT[i].weight,HT[i].parent,HT[i].lchild,HT[i].rchild); } voidPrint2(HuffmanCodeHC) { inti; printf("各个字符的编码如下: \n"); for(i=1;i<=8;i++) printf("%c的编码: %s\n",str[i],HC[i]); } voidInitialzation(int*w) { FILE*fp; chara; inti; intn=0; if((fp=fopen("DataFile.data","wb"))==NULL) { printf("cannotopenflie\n"); return; } printf("请输入数据字符(a-h)以#结束: \n"); a=getchar(); for(i=0;a! ='#';i++) { fprintf(fp,"%c",a);n++; switch(a) { case'a': w[1]++;break; case'b': w[2]++;break; case'c': w[3]++;break; case'd': w[4]++;break; case'e': w[5]++;break; case'f': w[6]++;break; case'g': w[7]++;break; case'h': w[8]++; } a=getchar(); } fclose(fp); printf("输入的字符及其权值: \n"); for(i=1;i<=8;i++) printf("<%c,%d>",str[i],w[i]); printf("\n"); } voidEnCoding(HuffmanCodeHC) { printf("原文为: \n"); chars[100],a; inti,n=0; a=getchar(); for(i=0;a! ='#';i++) { s[i]=a; n++; a=getchar(); } printf("报文为: \n"); for(i=0;i { switch(s[i]) { case'a': printf("%s",HC[1]);break; case'b': printf("%s",HC[2]);break; case'c': printf("%s",HC[3]);break;; case'd': printf("%s",HC[4]);break;; case'e': printf("%s",HC[5]);break;; case'f': printf("%s",HC[6]);break;; case'g': printf("%s",HC[7]);break;; case'h': printf("%s",HC[8]); } } printf("\n"); } voidDe(HuffmanTreeHT) { printf("报文为: \n"); chars[100],a; inti,j,n=0; a=getchar(); for(i=0;a! ='#';i++) { s[i]=a;n++; a=getchar(); } for(i=1;i<=m;i++) if(HT[i].parent==0)j=i; HT[0]=HT[j]; printf("译文为: \n"); for(i=0;i if(HT[0].lchild! =NULL&&HT[0].rchild! =NULL) { if(s[i]=='0')HT[0]=HT[HT[0].lchild]; if(s[i]=='1')HT[0]=HT[HT[0].rchild]; } else { printf("%c",HT[0].ch); HT[0]=HT[j]; i--; } printf("%c\n",HT[0].ch); } voidHuffmanCoding(HuffmanTree&HT,HuffmanCode&HC,int*w) { //w存放n个字符的权值(均>0),构造赫夫曼树HT,并求出n个字符的赫夫曼编码HC inti,start,c,f; intn=8; ints1,s2; HuffmanTreep; char*cd; if(n<=1)return; m=2*n-1; HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未用 for(i=1,p=HT+1,w=w+1;i<=n;i++,p++,w++) { p->weight=*w; p->parent=0; p->lchild=0; p->rchild=0; p->ch=str[i]; } for(;i<=m;i++) { p->weight=0; p->parent=0; p->lchild=0; p->rchild=0; p->ch=''; p++; } printf("初始化后的赫夫曼树的存储情况: \n"); printf("存储单元字符权值双亲左孩子右孩子\n"); for(i=1;i<=m;i++)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 赫夫曼树 实现 数据结构 实验 报告