哈夫曼树实验报告.docx
- 文档编号:27775828
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:22
- 大小:95.67KB
哈夫曼树实验报告.docx
《哈夫曼树实验报告.docx》由会员分享,可在线阅读,更多相关《哈夫曼树实验报告.docx(22页珍藏版)》请在冰豆网上搜索。
哈夫曼树实验报告
数据结构实验报告
实验名称:
实验三哈夫曼树
学生姓名:
班级:
班内序号:
学号:
日期:
程序分析:
2、1存储结构:
二叉树
2、2程序流程:
template
classBiTree
{
public:
BiTree();//构造函数,其前序序列由键盘输入
~BiTree(void);//析构函数
BiNode
protected:
BiNode
};
//声明类BiTree及定义结构BiNode
Data:
二叉树就是由一个根结点与两棵互不相交的左右子树构成
二叉树中的结点具有相同数据类型及层次关系
示意图:
root
lchildparentrchild
哈夫曼树类的数据域,继承节点类型为int的二叉树
classHuffmanTree:
publicBiTree
data:
HCode*HCodeTable;//编码表
inttSize;//编码表中的总字符数
二叉树的节点结构
template
structBiNode//二叉树的结点结构
{
Tdata;//记录数据
Tlchild;//左孩子
Trchild;//右孩子
Tparent;//双亲
};
示意图:
编码表的节点结构
structHCode
{
chardata;//编码表中的字符
charcode[100];//该字符对应的编码
};
示意图:
待编码字符串由键盘输入,输入时用链表存储,链表节点为
structNode
{
charcharacter;//输入的字符
unsignedintcount;//该字符的权值
boolused;//建立树的时候该字符就是否使用过
Node*next;//保存下一个节点的地址
};
示意图:
2、3关键算法分析:
1、初始化函数(voidHuffmanTree:
:
Init(stringInput))
算法伪代码:
1、初始化链表的头结点
2、获得输入字符串的第一个字符,并将其插入到链表尾部,n=1(n记录的就是链表中字符的个数)
3、从字符串第2个字符开始,逐个取出字符串中的字符
3、1将当前取出的字符与链表中已经存在的字符逐个比较,如果当前取出的字符与链表中已经存在的某个字符相同,则链表中该字符的权值加1。
3、2如果当前取出的字符与链表中已经存在的字符都不相同,则将其加入到链表尾部,同时n++
4、tSize=n(tSize记录链表中字符总数,即哈夫曼树中叶子节点总数)
5、创建哈夫曼树
6、销毁链表
源代码:
voidHuffmanTree:
:
Init(stringInput)
{
Node*front=newNode;//初始化链表的头结点
if(!
front)
throwexception("堆空间用尽");
front->next=NULL;
front->character=NULL;
front->count=0;
Node*pfront=front;
charch=Input[0];//获得第一个字符
Node*New1=newNode;
if(!
New1)
throwexception("堆空间用尽");
New1->character=ch;//将第一个字符插入链表
New1->count=1;
New1->next=pfront->next;
pfront->next=New1;
boolreplace=0;//判断在已经写入链表的字符中就是否有与当前读出的字符相同的字符
intn=1;//统计链表中字符个数
for(inti=1;i
{
ch=Input[i];//获得第i个字符
do
{
pfront=pfront->next;
if((int)pfront->character==(int)ch)//如果在链表中有与当前字符相同的字符,该字符权值加1
{
pfront->count++;
replace=1;
break;
}
}while(pfront->next);
if(!
replace)//如果在链表中没找到与当前字符相同的字符,则将该字符作为新成
员插入链表
{
Node*New=newNode;
if(!
New)
throwexception("堆空间用尽");
New->character=ch;
New->count=1;
New->next=pfront->next;
pfront->next=New;
n++;
}
pfront=front;//重置pfront与replace变量为默认值
replace=0;
}
tSize=n;//tSize记录的就是编码表中字符个数
CreateHTree(front,n);//创建哈夫曼树
pfront=front;
while(pfront)//销毁整个链表
{
front=pfront;
pfront=pfront->next;
deletefront;
}
时间复杂度:
若输入的字符串长度为n,则时间复杂度为O(n)
2、创建哈夫曼树(voidHuffmanTree:
:
CreateCodeTable(Node*p))
算法伪代码:
1.创建一个长度为2*tSize-1的三叉链表
2.将存储字符及其权值的链表中的字符逐个写入三叉链表的前tSize个结点的data域,并将对应结点的孩子域与双亲域赋为空
3.从三叉链表的第tSize个结点开始,i=tSize
3.1从存储字符及其权值的链表中取出两个权值最小的结点x,y,记录其下标x,y。
3.2将下标为x与y的哈夫曼树的结点的双亲设置为第i个结点
3.3将下标为x的结点设置为i结点的左孩子,将下标为y的结点设置为i结点的右孩子,i结点的权值为x结点的权值加上y结点的权值,i结点的双亲设置为空
4、根据哈夫曼树创建编码表
源代码:
voidHuffmanTree:
:
CreateHTree(Node*p,intn)
{
root=newBiNode
Node*front=p->next;
if(n==0)
throwexception("没有输入字符");
for(inti=0;i { root[i]、data=front->count; root[i]、lchild=-1; root[i]、rchild=-1; root[i]、parent=-1; front=front->next; } front=p; intNew1,New2; for(i=n;i<2*n-1;i++) { SelectMin(New1,New2,0,i);//从0~i中选出两个权值最小的结点 root[New1]、parent=root[New2]、parent=i;//用两个权值最小的结点生成新结点,新节点为其双亲 root[i]、data=root[New1]、data+root[New2]、data;//新结点的权值为其孩子的权值的与 root[i]、lchild=New1; root[i]、rchild=New2; root[i]、parent=-1; } CreateCodeTable(p);//创建编码表 } 时间复杂度: 在选取两个权值最小的结点的函数中要遍历链表,时间复杂度为O(n),故该函数的时间复杂度为O(n^2) 3.创建编码表(voidHuffmanTree: : CreateCodeTable(Node*p)) 算法伪代码: 1、初始化编码表 2、初始化一个指针,从链表的头结点开始,遍历整个链表 2、1将链表中指针当前所指的结点包含的字符写入编码表中 2、2得到该结点对应的哈夫曼树的叶子结点及其双亲 2、3如果哈夫曼树只有一个叶子结点,将其字符对应编码设置为0 2、4如果不止一个叶子结点,从当前叶子结点开始判断 2、4、1如果当前叶子结点就是其双亲的左孩子,则其对应的编码为0,否则为1 2、4、2child指针指向叶子结点的双亲,parent指针指向child指针的双亲,重复2、4、1的操作 2、5将已完成的编码倒序 2、6取得链表中的下一个字符 3.输出编码表 源代码: voidHuffmanTree: : CreateCodeTable(Node*p) { HCodeTable=newHCode[tSize];//初始化编码表 Node*front=p->next; for(inti=0;i { HCodeTable[i]、data=front->character;//将第i个字符写入编码表 intchild=i;//得到第i个字符对应的叶子节点 intparent=root[i]、parent;//得到第i个字符对应的叶子节点的双亲 intk=0; if(tSize==1)//如果文本中只有一种字符,它的编码为0 { HCodeTable[i]、code[k]='0'; k++; } while(parent! =-1)//从第i个字符对应的叶子节点开始,寻找它到根结点的路径 { if(child==root[parent]、lchild)//如果当前结点为双亲的左孩子,则编码为0,否则编码为1 HCodeTable[i]、code[k]='0'; else HCodeTable[i]、code[k]='1'; k++; child=parent; parent=root[child]、parent; } HCodeTable[i]、code[k]='\0'; Reverse(HCodeTable[i]、code);//将编码逆置 front=front->next;//得到下一个字符 } cout<<"编码表为: "< for(i=0;i { cout< } } 时间复杂度: 需要遍历哈夫曼树获取编码,时间复杂度为O(n^2) 4.选择两个最小权值的函数 算法伪代码: 1.从下标为begin的结点开始,寻找第一个没用过的结点 2.遍历哈夫曼树中从下标为begin到下标为end的结点序列,寻找没用过的同时权值又就是最小的结点。 3.暂时改变找到的权值最小结点的双亲域,防止第2次找到相同的结点。 4.将权值最小结点的下标记录下来。 5.重复步骤1~4,找到第2个权值最小的结点 源代码: voidHuffmanTree: : SelectMin(int&New1,int&New2,intbegin,intend) { intmin; for(intj=0;j<2;j++)//要选择两个权值最小的结点 { intsign=begin; for(inti=begin;i { if(root[i]、parent==-1)//没用过的结点其双亲应为空 { min=root[i]、data; sign=i; break; } } for(i=begin;i { if(root[i]、parent==-1) { if(min>root[i]、data) { min=root[i]、data; sign=i; } } } root[sign]、parent=0;//暂时改变所找最小结点的双亲域,防止第2次找到的就是同一个结点 if(! j) New1=sign; else New2=sign; } } 时间复杂度: 两次遍历链表,时间复杂度为O(n) 5、将字符串倒序的函数(voidHuffmanTree: : Reverse(char*pch)) 算法伪代码: 1.得到字符串的长度 2.初始化两个记录下标的变量,一个为字符串开头字符所在的下标i,另一个为字符串结尾字符所在的下标j 3.将下标为i与j的字符交换 4.i++,j-- 时间复杂度: 时间复杂度为O(n) 6、编码函数(voidHuffmanTree: : Encode(string&s,string&d)) 算法伪代码: 1、从s开头的字符开始,逐一对s中的字符进行编码 2、在编码表中查找与当前字符对应的字符 3.如果找到了与当前字符对应的编码表中的字符,将其编码追加到解码串的末尾。 4、重复以上步骤,直到所有待编码串中的字符都编码完毕 5、输出编码后的字符串 源代码: voidHuffmanTree: : Encode(string&s,string&d) { for(intj=0;j { for(inti=0;i { if(s[j]==HCodeTable[i]、data) { d、append(HCodeTable[i]、code);//编码 break; } } } cout< } 时间复杂度: 设待编码字符串长度为n,编码表中字符个数为m,则复杂度为O(n*m) 7、解码函数 算法伪代码: 1.得到指向哈夫曼树的根结点的指针与指向待解码串中的第1个字符的指针 2.逐个读取待解码串中的字符,若为0,则指向哈夫曼树当前结点的指针指向当前结点的左孩子,若为1,则指向当前结点的右孩子 3.指向待解码串的指针指向解码串中的下一个字符,直到指向哈夫曼树结点的指针的孩子结点为空 4.如果哈夫曼树只有一个叶子结点,直接将待解码串中的编码转换为对应的字符 5.如果指向哈夫曼树结点的指针的孩子结点已经为空,则将叶子结点下标对应的字符追加到解码串中。 6.输出解码串 源代码: voidHuffmanTree: : Decode(string&s,string&d) { for(inti=0;i { intparent=2*tSize-1-1;//得到哈夫曼树的根结点 while(root[parent]、lchild! =-1)//如果结点不为叶子结点 { if(s[i]=='0')//编码为0则寻找其左孩子 parent=root[parent]、lchild; else//编码为1则寻找右孩子 parent=root[parent]、rchild; i++; } if(tSize==1)//如果编码表只有一个字符,则根结点即为叶子结点 i++; d、append(1,HCodeTable[parent]、data);//将叶子节点对应的字符追加到解码串中 } cout< } 时间复杂度: 设待解码串长度为n,则复杂度为O(n) 8、计算哈夫曼编码的压缩比(voidHuffmanTree: : Calculate(strings1,strings2)) 算法伪代码: 1.获得编码前字符串的长度,即其占用的字节数 2.获得编码后的字符串的长度,将其除以8然后向上取整,得到其占用的字节数 3.压缩比将两个相除 源代码: voidHuffmanTree: : Calculate(strings1,strings2) { intcal1=s1、length(); intcal2=s2、length(); cal2=ceill((float)cal2/8);//将编码串的比特数转化为字节数 cout<<"编码前的字符串长度: "< cout<<"编码后的字符串长度: "< cout<<"压缩比为: "<<((double)cal2/(double)cal1)*100<<"%"< } 时间复杂度: O (1) 9、打印哈夫曼树(voidHuffmanTree: : PrintTree(intTreeNode,intlayer)) 算法伪代码: 1.如果待打印结点为空,则返回 2.递归调用函数打印当前结点的右子树 3.根据当前结点所在的层次确定其前面要输出多少空格,先输出空格,在打印当前结点的权值 4.递归调用函数打印当前结点的左子树 源代码: voidHuffmanTree: : PrintTree(intTreeNode,intlayer) { if(TreeNode==-1)//如果待打印结点为空,则返回 return; else { PrintTree(root[TreeNode]、rchild,layer+1);//先打印该结点的右子树,layer记录的就是该结点所在的层次 for(inti=0;i cout<<''; cout< PrintTree(root[TreeNode]、lchild,layer+1);//打印该结点的左子树 } } 时间复杂度: 中序遍历哈夫曼树,复杂度为O(n) 10、菜单函数(voidHuffmanTree: : Menu()) 算法伪代码: 1、逐一读取键盘缓存区中的字符,并将它们逐一追加到记录输入字符串的string变量中,直到读到回车输入符为止 2、删除string变量末尾的回车输入符 3.利用string变量创建哈夫曼树,初始化编码表。 4、直观打印哈夫曼树 5、对输入的字符串进行编码 6、对编码后的字符串进行解码 7、计算编码前后的压缩比并输出 源代码: voidHuffmanTree: : Menu() { cout<<"请输入您要编码的文本,按回车键确定输入"< stringInput; charletter; do//将字符逐个读入Input变量中 { letter=cin、get(); Input、append(1,letter); }while(letter! ='\n'); Input、erase(Input、length()-1,1);//去掉Input末尾的回车符 Init(Input);//根据输入的字符串创建哈夫曼树及其编码表 cout<<"直观打印哈夫曼树"< PrintTree(2*tSize-1-1,1);//打印哈夫曼树 cout<<'\n'<<'\n'; stringd1,d2; cout<<"编码后的字符串为"< Encode(Input,d1);//编码并打印编码串 cout<<"解码后的字符串为"< Decode(d1,d2);//解码并打印解码串 cout<<"ASCII码编码与HUFFMAN编码的比较"< Calculate(Input,d1);//计算编码前后的压缩比 } 2、4其她 1、由于题目要求能输入任意长的字符串,所以本程序采用了string变量来记录输入的字符串,并采用string类的类成员函数来完成各项任务 2、打印哈夫曼树时采用了递归函数,且采用了凹凸表的形式打印哈夫曼树。 3、为了输入空格,输入时采取逐个字符输入的方式 三.程序运行结果分析: 主函数流程图: 运行结果 各函数运行正常,没有bug 四、总结: 在实现整个算法设计中运用了二叉树结构及类创新,同时又复习了上学期C++的相应内容。 总结与流程分析过程虽然很辛苦但屡败屡战,获益匪浅,收获了很多。 也认识到自己的不足,希望自己继续努力。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈夫曼树 实验 报告