北邮数据结构实验Huffman编码解码器.docx
- 文档编号:9783656
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:15
- 大小:159.57KB
北邮数据结构实验Huffman编码解码器.docx
《北邮数据结构实验Huffman编码解码器.docx》由会员分享,可在线阅读,更多相关《北邮数据结构实验Huffman编码解码器.docx(15页珍藏版)》请在冰豆网上搜索。
北邮数据结构实验Huffman编码解码器
数据结构
实
验
报
告
实验名称:
____Huffman编码/解码器_____
学生姓名:
__________________
班级:
__________________
班内序号:
__________________
学号:
__________________
日期:
___________________
1.实验要求
利用二叉树结构实现哈夫曼编/解码器。
基本要求:
1.初始化(Init):
能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树
2.建立编码表(CreateTable):
利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。
3.编码(Encoding):
根据编码表对输入的字符串进行编码,并将编码后的字符串输出。
4.译码(Decoding):
利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。
5.计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。
2.程序分析
2.1存储结构
静态三叉链表
2.2程序流程(或程序结构、或类关系图等表明程序构成的内容,一般为流程图等)
2.2.1.流程图
输出各字符串编码
对哈弗曼码进行译码
输出译码结果
计算分析内存占用情况
输出占用情况
结束
2.2.1.伪代码
1.输入进行编码的字符串
2.遍历字符串,并为叶子节点权重赋值
3.依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
4.显示各字符的哈弗曼编码。
5.对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。
6.对字符串的哈弗曼码进行译码。
自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
7.分析内存占用情况。
若用ASCII编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。
若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。
2.3关键算法分析
该程序关键算法即哈弗曼编码,语句如下:
voidCHTree:
:
huffmancode()
{
inti;
if(n<=1)return;
m=2*n-1;
for(i=1;i<=n;i++)//叶子节点的初始化
{ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(;i<=m;i++)//非叶子节点的初始化
{
ht[i].weight=0;
ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(i=n+1;i<=m;++i)//构造哈夫曼树
{
s1=select(i-1);//函数在ht[1]到ht[i-1]中选择parent为0且weight最小的结点,并将结点序号返s,并将ht[s1].parent设为-1
s2=select(i-1);
ht[s1].parent=i;
ht[s2].parent=i;
ht[i].lchild=s1;
ht[i].rchild=s2;
ht[i].weight=ht[s1].weight+ht[s2].weight;
}
intc,f;
for(i=1;i<=n;++i){
for(c=i,f=ht[i].parent;f!
=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码
if(ht[f].lchild==c){
str[i].insert(0,"0",0,1);}//在字符串str[i]的第0位置插入字符“0”
else{
str[i].insert(0,"1",0,1);}//在字符串str[i]的第0位置插入字符“1”
}
}
分析:
这段语句实现的功能是根据统计出来的各字符的频度,建立哈弗曼。
建立哈弗曼树的过程如程序所展示,每次选取权重最小且无双亲节点的节点组合,并将其权重之和赋给其双亲节点,加入到总结中进行下次判断。
哈弗曼树建立完全以后,开始对各字符进行编码,从下往上,以叶子节点为起始点,若它是双亲节点的左孩子,其编码前插入‘0’,若是右孩子则插入‘1’。
再判断双亲节点使其双亲节点的左孩子还是右孩子,以此类推直到根节点。
依次对每个字符进行上述过程编码。
算法复杂度:
最好情况为只有根结点和叶子节点:
O(n)
最坏情况为满二叉树情况:
O(n*logn/2)
3.程序运行结果分析
首先,要求用户输入进行编码的字符串,遍历字符串,并为叶子节点权重赋值。
然后,依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
屏幕上显示各字符的哈弗曼编码。
接下来对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。
对字符串的哈弗曼码进行译码。
自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
最后分析内存占用情况。
若用ASCII编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。
若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。
3.总结
4.1实验的难点和关键点
本实验的难点和关键点是进行哈弗曼的编码与译码。
编码之前先要遍历字符串,并统计各字符出现的频度。
这里就要区分目前的字符是否出现过,若出现过则字符权重加一,若没有出现则在结构体数组的当前末尾添加该元素。
统计完频度以后开始编码。
根据哈弗曼树的特点,每次选取结点里权重最小,且双亲不为0的节点结合,依次添加直至根节点。
编码过程是从下往上。
对于某字符所在叶子节点,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
直到双亲节点移动到根节点,所得到的编码即为该字符的编码。
译码过程是编码的逆过程。
依次读取哈弗曼码,自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
4.2心得体会
通过哈弗曼树的程序编写,更加深入了解了树这种数据结构的特点,并且熟悉了这种数据结构的应用。
同时,也对哈弗曼编码的优越性能有了根本的解释。
附:
程序代码
#include
#include
usingnamespacestd;
#definemax1000//哈夫曼数存储的最大叶子节点数
intjudge;//初始化过程中用于判断字符是否出现过
structHTNode
{
charc;
intweight;
intlchild,rchild,parent;
};
classCHTree
{
public:
CHTree(){ht=NULL;};
voidInit();
voidhuffmancode();
intselect(inti);
voidDisplay();
voidcanculate();
voidencoding();
voiddecoding();
private:
HTNode*ht;
intm;
intn;//叶子结点数
ints1;
ints2;
stringa;//存储输入的字符串
stringcode;//存储对字符串的编码
stringstr[max];//存储叶子结点的哈夫曼编码
};
voidCHTree:
:
Init()
{
inti=1;//用于记录叶子节点个数
intj=0;
intx=0,ru;
cout<<"请输入进行编码的字符串:
"< cin>>a; intl=a.length(); ht=(HTNode*)malloc((max)*sizeof(HTNode));//分配MAXSIZE个叶子结点的存储空间 while(x { judge=1; for(j=0;j if(ht[j].c==a[x]){//如果字符a[x]已经出现过,则记录,权值加1 ht[j].weight++; judge=0; break;} } if(judge){//若字符没有出现过,字符入列,且权值设为1 n=i;//记录叶子节点数 ht[i].weight=1; ht[i].c=a[x]; i++;} x++; } } intCHTree: : select(inti)//函数在ht[1]到ht[i]中选择parent为0且weight最小的结点,并将结点序号返回 { intj=1; intk=1; ints; while(ht[j].parent! =0){ j++; s=j; } k=j+1; while(k<=i) { while(ht[k].parent! =0)k++; if(k>i)returns; if(ht[j].weight>ht[k].weight){ ht[j].parent=0;//如果第二次和第二次以后循环中发现有比ht[j]权值还小的,将ht[j].parent重新设为0 j=k;//始终令“ht[j]”为二者中权值小的那一个 s=j; ht[j].parent=-1;//如果ht[j]是权值较小的,将ht[j]的parent记为-1, } else{ s=j; ht[j].parent=-1;} k++;} returns;} voidCHTree: : huffmancode() { inti; if(n<=1)return; m=2*n-1; for(i=1;i<=n;i++)//叶子节点的初始化 {ht[i].parent=0; ht[i].lchild=0; ht[i].rchild=0;} for(;i<=m;i++)//非叶子节点的初始化 { ht[i].weight=0; ht[i].parent=0; ht[i].lchild=0; ht[i].rchild=0;} for(i=n+1;i<=m;++i)//构造哈夫曼树 { s1=select(i-1);//函数在ht[1]到ht[i-1]中选择parent为0且weight最小的结点,并将结点序号返s,并将ht[s1].parent设为-1 s2=select(i-1); ht[s1].parent=i; ht[s2].parent=i; ht[i].lchild=s1; ht[i].rchild=s2; ht[i].weight=ht[s1].weight+ht[s2].weight; } intc,f; for(i=1;i<=n;++i){ for(c=i,f=ht[i].parent;f! =0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码 if(ht[f].lchild==c){ str[i].insert(0,"0",0,1);}//在字符串str[i]的第0位置插入字符“0” else{ str[i].insert(0,"1",0,1);}//在字符串str[i]的第0位置插入字符“1” } } voidCHTree: : Display(){ cout<<"huffman编码如下: \n"; cout<<"字符"<<'\t'<<"权值"<<'\t'<<"哈夫曼编码"< for(inti=1;i<=n;i++){ cout< } voidCHTree: : canculate(){ intm=0; for(inti=1;i<=n;i++){ m+=(ht[i].weight)*(str[i].length());//该字符所占位数为频度和每个字符huffman码长度乘积 } cout<<"\n\n内存分析: \n"<<"原始编码所占内存数为"<<8*sizeof(char)*(a.length())<<"bit"< cout<<"huffman编码所占内存数为"< } voidCHTree: : encoding(){ for(inti=0;i for(intj=1;j<=n;j++){//循环变量j用于寻找huffman编码中与该字符的相匹配的字符编码 if(a[i]==ht[j].c)code+=str[j]; } } cout<<"\n\n字符编码为"< } voidCHTree: : decoding(){ inti=0; intm=code.length(); cout<<"\n\n对编码译码后所得字符: "; while(i intparent=2*n-1;//根结点在HTree中的下表 while(ht[parent].rchild! =0||ht[parent].lchild! =0)//自根结点向叶子节点匹配编码,叶子节点左右孩子均为0,此时输出字符 { if(code[i]=='0') parent=ht[parent].lchild; else parent=ht[parent].rchild; i++; } cout< } } voidmain() { CHTreeh; h.Init();//初始化,统计输入字符的频度,赋值各叶子节点的权重 h.huffmancode();//建立huffman树 h.Display();//显示各字符对应的huffman码 h.encoding();//对输入的字符进行编码 h.decoding();//对以上编码进行解码 h.canculate();//计算分析编码前与编码后的所占内存 system("pause"); }
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 实验 Huffman 编码 解码器