霍夫曼编码的分析与实现Word格式文档下载.docx
- 文档编号:13194550
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:9
- 大小:118.80KB
霍夫曼编码的分析与实现Word格式文档下载.docx
《霍夫曼编码的分析与实现Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《霍夫曼编码的分析与实现Word格式文档下载.docx(9页珍藏版)》请在冰豆网上搜索。
1、MATLAB编程 6
2、运行结果及分析:
7
五.分工情况 8
8
一、设计内容
霍夫曼编码的分析与实现
1、根据霍夫曼编码算法,考虑一个有多种可能的符号(各种符号发生的概率不同的信源)得到霍夫曼编码和码树;
2、使用MATLAB进行编程,编写的函数具有通用性,理解每个函数的具体意义和适用范围,程序输出显示所有的码字,平均码长,编码效率。
例如:
一个有n个符号的信源X,各个符号出现的概率为:
P:
x1x2x3x4x5x6···
例:
P(X):
0.40,0.18,0.15,0.10,0.07,0.05,0.03,0.02
进行霍夫曼编码,计算出平均码长、编码效率、冗余度。
二、设计原理
(1)将信源消息符号按其出现的概率大小依次排列:
P1≥P2≥···≥Pn。
(2)取两个概率最小的字母分别配以0和1两个码元,并将这两个概率相加作为一个新的字母的概率,与未分配的二进制符号的字母重新排队。
(3)对重排后的两个概率最小符号重复步骤
(2)的过程。
(4)不断继续上述过程,直到最后两个符号配以0和1为止。
(5)从最后一级开始,向前返回得到各个信源符号所对应的码元序列,即相应的码字。
否
输入信源符号对应概率P(i)
判断P(i)是否>
是
判别概率总和是否<
=1
判断信源符号是否只剩两个符号
将数组q前两项加和,得到新的概率序
用0,1表示概率最小的两个信源符
Huffman编码的程序流程图:
开始
对概率数组q升序排序
生成n-1行n列,每个元素含有n个字符的空白矩阵
进行Huffman编码,并完成码字分配
计算一个Huffman码字的平均码长
计算信源熵和编码效率
结束
能载荷一定的信息量,且码字的平均长度最短,可分离的变长的码字集合称为最佳变长码。
为此必须将概率大的信息符号编以短的码字,概率小的符号编以长的码字,使得平均码字最短,为最佳编码方法。
霍夫曼码是用用概率匹配的方法进行信源编码。
1.霍夫曼的编码方法保证了概率大的符号对应于短码,概率小的符号度对应于长码,充分利用了短码;
2.霍夫曼是一种即时码:
由于代表信源符号的节点都是终端节点,因此其编码不可能是其他终端节点对应的编码的前缀,即霍夫曼编码所得的码字为即时码。
3.霍夫曼编码是一种分组码,各个信源符号都被映射成一组固定次序的码符号。
4.霍夫曼编码是一种唯一可解的码,任何符号序列只能以一种方式译码。
注:
它可以单个信源符号编码或用L较小的信源序列编码。
但是应当注,
要达到很高的效率仍然需要按长序列计算,这样才能使平均码字长度降低。
编码过程中,当缩减信源的概率分布重新排列时,应使合并得到的概率和尽量处于高的位置,这样可使合并的元素重复编码次数减少,使短码得到充分利用。
2.3霍夫曼编码的非唯一性
霍夫曼编码方法得到的码并非是唯一的,造成并非唯一的原因是:
(1)首先,每次对信源缩减时,赋予信源最后两个概率最小的符号,用0和1可以任意的,所以可以得到不同的霍夫曼码,但不会影响码字的长度。
(2)对信源进行缩减时两个概率最小的符号合并后的概率与其他信源符号的概率相同时,这两者在缩减信源中进行概率排序,其位置放置次序是可以任意的,故会得到不同的霍夫曼码。
此时将影响码字的长度,一般将合并的概率放在上面,这样可以获得较小的码方差。
三、设计步骤
1、以框图形式画出哈霍夫曼码过程
霍夫曼编码过程:
哈夫曼码树:
在变字长编码时每个符号的平均码长为:
L=å
p(xi)li=0.3´
2+0.2´
2+0.18´
2+0.1´
4+0.08´
4+0.07´
4+0.04´
5=0.03´
5
i=1
=2.71码元/符号
平均信息量就是信息熵为:
H(X)=-å
P(xi)logp(xi)
=0.3×
log(0.3)+0.2×
log(0.2)+0.18×
log(0.18)+0.1×
log(0.1)+0.08×
log(0.08)+0.07×
log(0.07)+0.04×
log(0.04)+0.03×
log(0.03)=2.66码元/符号
编码效率为:
h=H(X)=2.66=0.98
L 2.71
冗余度为:
r=1-h=1-0.98=0.02
四、霍夫曼编码的MATLAB实现:
1、MATLAB编程
p=input('
请输入数据:
'
)%提示输入界面
n=length(p);
%N取输入行向量P的长度,即需要编码元素个数。
fori=1:
n
ifp(i)<
0 %判断输入P矩阵各元素是否全为大于零的有效概率值;
fprintf('
\n提示:
概率值不能小于0!
\n'
);
请重新输入数据:
)end
end
ifabs(sum(p))>
1 %IF语句判断输入矩阵的概率和是否为合理值1
\n霍夫曼码中概率总和不能大于1!
q=p;
a=zeros(n-1,n);
%生成一个n-1行n列的数组,用来记录每行最小两概率叠加后概率排列次序。
n-1 %第一个FOR循环确定概率大小值的排列,得到a数组
[q,l]=sort(q)
a(i,:
)=[l(1:
n-i+1),zeros(1,i-1)]
q=[q
(1)+q
(2),q(3:
n),1];
n-1 %第二个FOR循环生成一个N-1行、N2(N×
N)列数组C,每行可看作N
个段,每段长为N,记录一个码字(每个码字的长度不会超过N)。
c(i,1:
n*n)=blanks(n*n);
end
c(n-1,n)='
0'
;
%给C矩阵的N-1行的第一个段赋值0。
c(n-1,2*n)='
1'
%第二个段赋值1。
(这两个码字对应编码中最后相加为一
的两个概率。
)
fori=2:
n-1 %主要的程序,循环N-2次
c(n-i,1:
n-1)=c(n-i+1,n*(find(a(n-i+1,:
)==1))-(n-2):
n*(find(a(n-i+1,:
)==1)))c(n-i,n)='
%根据之前的规则,在分支的第一个元素最后补0
c(n-i,n+1:
2*n-1)=c(n-i,1:
n-1)
c(n-i,2*n)='
%根据之前的规则,在分支的第一个元素最后补1
%决定矩阵C从倒数第二行开始到第一行的每
段的码字值。
每一行值都从下一行值得到,找到在下一行码字中相加本行
最码
forj=1:
i-1
小两个概率得到的概率的对应码字,本行两个最小概率对应码字分别为此字最后加“0”,加“1”。
c(n-i,(j+1)*n+1:
(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:
)==j+1)-1)+1:
n*find(a(n-i+1,:
==j+1))
end %完成huffman码字的分配
%FOR循环找到其余的本行在下一行对应的码字,该码字保持不变。
循环结束后,C矩阵第一行的N段对应输入N个概率所对应符号的码字。
该码字按码字长短排列
h(i,1:
n)=c(1,n*(find(a(1,:
)==i)-1)+1:
find(a(1,:
)==i)*n)ll(i)=length(find(abs(h(i,:
))~=32)) %计算每一个huffman编码的长度
end %第五个FOR循环根据M矩阵第一行记录的概率排序位置分配给每个概率对应符号的码字。
l=sum(p.*ll);
%计算平均码长fprintf('
\nHuffman编码结果为:
h
\n编码的平均码长为:
lhh=sum(p.*(-log2(p)));
%计算信源熵
\n信源熵为:
hh
\n编码效率为:
t=hh/l %计算编码效率
哈夫曼.m运用典
型的IF和FOR控制流循环语句,该程序包括两个IF控制流和5个FOR循环结构。
完成编写设计后,在MATLAB中运行并验证结果,首先输入概率向量:
>
p=[0.30,0.20,0.18,0.10,0.08,0.07,0.04,0.03]回车即可得到执行的结果,编码长
度为L=2.7100,H(X)=2.6606,结果如上图所得的结果与实际预测的理论结果
L=2.71,H(X)=2.66。
五.分工情况
资料查找:
袁冬梅、刘倩、陈青云
MATLAB实现:
陈青云报告制作:
刘倩、陈青云
Ppt制作:
袁冬梅、刘倩
Ppt讲解:
陈青云
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 霍夫曼 编码 分析 实现