书签分享收藏举报版权申诉 / 18

立即下载加入VIP,免费下载

当前位置：首页 > 高中教育 > 语文 > 讲义41信源编码讲解Word文档格式.docx

讲义41信源编码讲解Word文档格式.docx

文档编号：19237628
上传时间：2023-01-04
格式：DOCX
页数：18
大小：232.63KB

《讲义41信源编码讲解Word文档格式.docx》由会员分享，可在线阅读，更多相关《讲义41信源编码讲解Word文档格式.docx（18页珍藏版）》请在冰豆网上搜索。

讲义41信源编码讲解Word文档格式.docx

W:

{0,01,11}则为非单义可译码。

10011001111时，可以译为：

x,w1,w1（w2）……

（2）瞬时可译码（非续长码）定义：

如果一个码组中的任一个码字都不是另一个码字的续长，或者说，任何一个码字后加上若干码元后都不是码组中另一个码字。

则称为瞬时可译码，也称为非续长码。

W：

{0，10，100，111}不是瞬时可译码，100为10的续长。

▪瞬时可译码一定是单义的，单义可译码却不一定是瞬时可译码。

{0，01}是单义的，但不是瞬时可译码。

（3）单义可译码定理：

设原始信源符号集为S:

{s1,s2,…sn}，码元符号集为A:

{a1,a2,…,aq}，码字集合为W:

{W1,W2,…Wn}，其码长分别为L1,L2,…,Ln；

则单义可译码存在的充要条件为码长组合满足Kraft不等式，即

▪Kraft不等式不仅是单义可译码的充要条件，也是瞬时可译码的充要条件；

▪这里所说的充要条件是对于码长组合而言，而不是对于码字本身而言，就是说：

满足Kraft不等式的码长组合一定能构成单义码，单义码的码长组合一定满足Kraft不等式。

▪有些码字的码长组合满足Kraft不等式，但不是单义码。

（编码方法不对）

下面看一个例子：

n=4,q=2A:

{0,1}

信源符号

W1

W2

W3

W4

W5

W6

s1

00

s2

01

10

11

s3

011

110

100

s4

0111

1110

111

▪W1:

满足Kraft不等式，但只是单义的，不是瞬时可译码；

码长组合为1,2,3,4；

▪W2:

满足Kraft不等式，是单义的，也是瞬时可译码；

▪W3:

满足Kraft不等式，不是单义的，也不是瞬时可译码；

码长组合为1,2,3,3；

▪W4:

▪W5:

不满足Kraft不等式，不可能为单义的；

码长组合为1,2,2,3；

▪W6:

为等长码；

（4）用码树图构成瞬时可译码

▪从根开始，画出q条分支，任选一个分支作为W1；

▪在另一个分支上再分出q条分支，任选一个分支作为W2；

▪继续进行，直至结束；

▪从根到各端点，所经过的状态即为码字；

A:

{0,1},q=2,W:

{W1,W2,W3,W4}

根根

0110

W101W110

W2W2

0110

W3W4W3W4

▪这种方法构成的瞬时可译码是不唯一的；

▪码树图可以用于译码，有根，枝，节点等概念；

▪同样可以用于q元编码；

例：

{s1,s2,…s9},A={0,1,2},q=3

02

W1122W9

00101

W212W5W6W8

W3W4W7

W1=0;

W5=20;

W9=222;

W2=10;

W6=21;

W3=11;

W7=220;

W4=12;

W8=221;

4-1-3平均码子长度

如果一个码组的参数满足Kraft不等式，就一定可以构成无噪声信道下的无失真传输，然而，在一个通信系统中，信源编码的主要目的是提高编码效率，即每个码元符号要携带更多的信息量。

因此要定义平均码长的概念。

设原始信源的信源空间为

[S,P]=

…

sn

p（s1）

p（s2）

p（sn）

其中：

对此信源用码元符号集A;

{a1,a2,…aq}进行编码，得单义可译码W：

{W1，W2，…Wn}。

相应得码字长度分别为：

Li,（i=1,2,…,n）。

则这个信源编码的平均码长为：

这时看一下信息传输效率：

每个信道码元所携带的平均信息量。

当信源S给定，信源的熵为H（S），则每个信道码元所携带的平均信息量可以表示为

可见，当原始信源一定时，编码后的平均码长越小，信道传信率越高，编码效率越高。

▪编码效率可以用平均码长来描述；

▪每个码字的长度应当与对应的信源符号的先验概率有关。

为了提高编码效率，总希望平均码长越小越好，但平均码长能否无限小呢？

[定理]:

平均码长极限定理

若一个离散无记忆信源S的熵为H（S），对其进行q元编码，A:

{a1,a2,…aq}，则总可以找到一种无失真的编码方法，构成单义可译码，使其平均码长满足：

对于常用的二元编码来说：

H（S）≤L<

H（S）+1

[下界证明]根据平均码长和熵的定义有

由单义可译码的存在定理可知，当满足∑q-Li≤1时，取对数后为小于等于0。

则有：

H（S）-Llogq≤0

L≥H（S）/logq

下界证毕。

▪平均码长最小不能小于极限值，H（S）/logq，若小于，则不存在单义可译码；

▪当下界等号成立时，效率最高时，为

p（si）=q-Li

可得：

当然这要求信源符号的先验概率满足其是以q为底的对数为整数，这就要求信源符号的先验概率为p（si）=q-Li形式，如果满足这一条件，编出的码字称为最佳码。

{s1,s2,s3,s4};

P（S）:

{1/2,1/4,1/8,1/8}时，编码后码长为[1,2,3,3]，这时平均码长将为L=H（S）=1.74码元/符号。

[上界证明]我们考察在满足Kraft不等式的条件下，平均码长满足下界。

设每个码字的平均码长在以下区间取正整数。

考虑到对数为单调递增函数，则有：

进而有：

对上式的i连续取和：

即：

这表明这样选择每个码元的码长可以满足Kraft不等式，然后对所有的i相加，得:

即

上界证毕。

▪平均码长大于这个上界当然也可以构成单义可译码，但实际上总希望码长小；

▪当一个离散无记忆信源得统计特性确定后，信源熵就确定了，平均编码长度下界也就确定了，编码效率也就确定了，如果进一步提高效率，就要想其它方法。

下面得编码定理给出了方法。

4-2编码定理

以下是Shannon编码定理的三种形式。

它们是进一步提高编码效率的极限定理。

[定理一]：

离散无记忆信源S的N次扩展信源SN，其熵为H（SN），并且编码器的码元符号集为A:

{a1,a2,…aq}，对信源SN进行编码，总可以找到一种编码方法，构成单义可译码，使信源S中每个符号si所需要的平均码长满足：

说明：

H（SN）=NH（S），根据平均码长的界限定理有：

LN为N次扩展信源每个符号的平均码长，原始信源的每符号的平均码长则为

则上式可以变为：

即得：

当离散无记忆信源S的扩展次数N足够大时，有

▪定理一表明当将离散无记忆信源进行N次扩展后再进行编码，就可以使原始信源每个符号的平均码长接近信源熵H（S），即达到下限值。

▪这时就不要求原始信源的先验概率满足特殊条件了，但却要求扩展次数N趋于无穷。

因此，这也是一个极限定理，（给出一种不现实的方法）。

[定理二]：

离散平稳各态历经有记忆信源S的N次扩展信源[S]=S1,S2,…SN，其熵为H（[S]）=H（S1,S2,…SN），并且编码器的码元符号集为A:

{a1,a2,…aq}，对信源[S]进行编码，总可以找到一种编码方法，构成单义可译码，使信源S中每个符号所需要的平均码长满足：

已知N次扩展信源的熵为H（[S]）=H（S1,S2,…,SN），根据平均的界限定理，

将上式除以N得：

可以注意到：

对于平稳各态历经有记忆信源来说，当信源稳定后，即当N趋于无穷时，每发一个符号携带的平均信息量等于其极限熵。

又考虑到lim（1/N）=0，可知：

▪比较定理一和定理二，由于H（S）≤H∞，所以，有记忆信源的平均码长的下界将小于无记忆信源的平均码长的下界；

▪对于m阶马尔柯夫信源来说；

H∞=Hm+1（S），则有：

即，记忆长度越长，平均码长的下界就越小。

▪定理一和定理二说明：

可以用信源扩展的方法，达到数据压缩的目的，扩展程度越高，编码效率越高。

[定理三]：

设信源S的熵为H（S），无噪声离散信道的信道容量为C。

则总可以找到一种编码方法，使信道上的信源符号平均传输速率为[C/H（S）-ε]。

其中可以是任意小的正数。

要使符号平均传输速率大于C/H（S）是不可能的。

[关于编码定理的说明]：

▪在编码前，离散无噪声信道的信道容量为C，C=r0Hmax（S），Hmax（S）为信源的最大熵，r为符号传输速率，[C=Hmax（S）]，相当于r0=1。

▪在编码前，离散无噪声信道的实际熵速率为R=r0H（S），这时的符号传输速率就等于r0，单位是原始信源符号数/每秒。

▪这时的传输效率（编码效率）：

实际传输能力/最大传输能力，为：

η=R/C=H（S）/Hmax（S）

对于n个符号的原始信源，如果不进行编码就相当于n元编码，其最大熵为

Hmax（S）=logn;

传输效率（编码效率）η=R/C=H（S）/Hmax（S）=H（S）/logn。

▪编码后，每个原始信源符号si编成了Li个信道码元组成的码字Wi。

编码器的输出可以看成一个新的信源，它有q个信源符号（信道码元），每个信道码元所携带的信息量为H（S）/L。

如果将这个新信源记为A，则H（A）=H（S）/L，如果信道码元的符号速率为n1，则信道的实际熵速率为R=r1H（A）=r1H（S）/L。

▪编码器输出的码元符号集共有q个元素，这个新信源的最大熵为当q个信道码元符号为等概率时，即Hmax（A）=logq，信道容量为C=r1Hmax（A）。

▪这时编码器输出端的传输效率（编码效率）为：

η=R/C=H（A）/Hmax（A）=H（S）/[LHmax（A）]=H（S）/Llogq

当q=2时，为二元编码，logq=1;

传输效率就为：

η=R/C=H（S）/L。

▪这时从另一个角度，我们看一下编码定理中定义的符号传输速率，它是指原始信源符号的传输速率：

即每秒传输的原始信源符号的个数。

实际符号传输速率为：

为r0=R/H（S）[（比特/秒）/（比特/符号）=（信源符号/秒）]

有：

r0=R/H（S）≤C/H（S）;

编码定理指出：

总可以有方法使R趋进于C，并构成单义可译码，

实际上等效于：

L趋于H（S）/logq。

或者说：

编码后的编码效率趋于1。

▪由平均码长界限定理可知，要构成单义可以码，平均码长有一个下界：

▪结合这两个关系，可以得到：

单义可译码的信道码元符号在离散无噪声信道上的熵速率（传信率）就相应有一个上界；

▪我们知道logq是信道码元符号集A:

{a1,a2,…aq}的最大熵，也就是将A看作信源时，在离散无噪声信道上的信道容量C，所以有：

R≤C

▪这就是说，要编成单义可译码，就不可能使信道传信率（熵速率）大于信道容量。

关于Shannon编码第一定理：

定理一、定理二和定理三实际上是同一个定理，定理一和定理二是针对一个具体的信源形式，而定理三是一个概括性的。

这个定理称为无失真信源编码定理，也称为无噪声信道编码定理。

[例4-1]：

有一个离散无记忆信源，S:

{s1,s2},P（S）:

{0.2,0.8},

▪其原始信源熵为：

H（S）=1/5log5+4/5log（5/4）=0.72193bit/信源符号（si）

▪用二元信道码元符号A:

{0,1}进行编码，得到码字W:

{W1=0,W2=1},这时的平均码长为：

L=0.2×

1+0.8×

1=1信道码元符号/信源符号。

这时的信道传信率：

R=H（S）/L=0.72193比特/信道码元符号。

▪对这个信源进行二次扩展，得到S2，对其进行二元编码，得W:

{W1,W2,W3,W4}。

[Si]

P（[Si]）

Wi

[S1]=S1S1

1/25

000

[S2]=S1S2

4/25

001

[S3]=S2S1

[S4]=S2S2

16/25

1

这时的平均码长为：

L2=（16/25）×

1+（4/25）×

2+（4/25）×

3+（1/25）×

3=37/27信道码元符号/2个信源符号

则相应的原始信源每个信源符号的平均码长

L=L2/2=37/50信道码元符号/信源符号

▪这时的信道传信率为

R=H（S）/L=0.72193/（37/50）=0.97比特/信道码元符号。

可以看到：

经过信源的二次扩展，编码复杂一点，但使传信率（编码效率）明显提高，可知二元编码的信道容量为1比特/码元，当扩展次数增加时，传信率将无限接近信道容量。

4-3Huffman编码

上面我们看到，通过无失真信源编码可以使信道传信率无限接近于信道容量，为了评价信源编码的好坏，定义一个参数称为编码效率：

编码效率是一个小于等于1的参数，当然编码效率越高越好，只要保证是单义可译码。

当编码效率等于1时称为最佳码。

4-3-1Shannon-Fano算法

（1）Shannon编码思想：

由于概率的不均匀，使编码效率下降，因此，可以根据消息状态的概率来确定各码字的编码长度，概率大的编成短码，概率小的编成长码。

最初的Shaanon编码算法是一种简单的按概率编码的方法，对于一个离散无记忆信源，如果其某一状态si的先验概率为p（si），则就取其码长为：

其[X]符号表示为取不小于X的整数，即

其实这种方法是满足Kraft不等式的一种直接的应用；

一个离散信源S:

{s1,s2,s3,s4}p（S）:

{1/2,1/4,1/8,1/8}

这时有：

L1=log2=1;

L2=log4=2;

L3=L4=log8=3;

利用码树图的方法可以得到其编码：

0W1=0

10W2=10

10W3=110

1W4=111

这个例子可以验证其编码效率为1，即为最佳码。

但可以发现，这种方法对于多数情况下是不能实现最佳码的，而且编码效率比较低。

这种算法称为Shannon算法；

后来提出了一种改进方法为Shannon-Fano算法。

（2）Fano算法的步骤：

①把原始信源的符号按概率从大到小重新排列；

②把信源符号按尽可能概率相等分为q组，分别分配给a1,a2,…aq码元；

③将每个分组再次分组，直至分完；

④从左至右将分得的码元排列即得码字Wi。

[算法举例]：

设有一个离散无记忆信源S；

其信源空间为：

s5

s6

s7

s8

p（S）:

0.1

0.18

0.4

0.05

0.06

0.07

0.04

可知这个原始信源的熵为：

H（S）=-∑p（si）logp（si）=2.55bit/原始信源符号。

而这时的最大熵为：

Hmax（S）=log8=3bit/原始信源符号。

编码效率为η=R/C=H（S）/Hmax（S）=2.55/3=85%。

利用Shannon-Fano算法编码：

si

p（si）

第一次

第二次

第三次

第四次

Li

0.40

2

0.10

3

101

1100

4

1101

1111

这时可以用码树图描述：

00s3

11s2

00s1

11s6

10s7

01s5

1s8s4

▪注意：

1，0码元分配是任意的，因此编码的结果是不唯一的；

▪0/1分配的上下顺序也是不唯一的，能构成不同的单义可译码；

（3）关于编码效率

▲编码前信源熵为H（S），最大熵为Hmax（S），熵速率为R=rH（S），信道容量为C=rHmax（S）；

这时的编码效率为：

▲编码后一个信源状态si对应于一个码子Wi，Wi的码长为Li，[W]的平均码长为L，一个码元的熵为H（A）=H（S）/L，其最大熵为Hmax（A）=logq，熵速率和信道容量分别为R=rH（S）/L,C=rHmax（A）。

对于二元编码q=2，Hmax（A）=log2=1，同时考虑到H（S）与H（A）的关系，有

由于L总是大于等于H（S），因此编码效率总是小于1。

当L趋于H（S）时，编码效率也趋于1。

编码效率趋于1的过程，就是L趋于H（S），和R趋于C的过程。

看这个例题的编码效率：

其平均码长为L=2.64信道码元/信源符号。

H（S）=2.55bit/信源符号。

所以

可见编码效率得到提高。

▪如果将信源做n次扩展后再进行编码，可以进一步提高编码效率。

4-3-2Shannon-Fano算法的最佳条件

同样是上面的例子，如果我们将原始信源改变一下，信源空间为：

1/4

1/8

1/16

H（S）=-∑p（si）logp（si）=2.75bit/原始信源符号。

编码效率为η=R/C=H（S）/Hmax（S）=2.75/3=91.7%。

这时的平均码长为L=∑p（si）Li=2.75信道码元/信源符号。

编码效率为：

η=H（S）/L=2.75/2.75=1，表明R=C。

4-3-3Huffman算法

这种算法比Shannon-Fano算法的效率还要高，称为最佳编码算法。

（1）二元Huffman算法的步骤

①将信源S的n个符号状态{s1,s2,…sn}按概率从大到小排列，作为码树图的叶；

②将概率最小的两个符号分别分配给“0”和“1”码元，然后其概率相加，合成一个节点，作为一个新的符号，重新与其它符号按概率大小排列；

③重复这样的步骤，一直到处理完全部状态；

④从右到左将分配的码元排列后即得相应得编码。

将上一题的信源编为Huffman编码。

利用Huffman算法编码：

s30.41

s20.181

s10.1（0.37）01.0

s60.10（0.6）0

s70.070（0.23）1

s50.061（0.13）（0.19）0

s40.050（0.09）1

s80.041

编码结果：

W3=1W7=0100

W2=001W5=0101

W1=011W4=00010

W6=0000W8=00011

平均码长L=2.61码元/状态。

编码效率为

可见Huffman编码比Shannon-Fano编码可以得到更高的编码效率。

同样：

▪1/0码元分配是任意的，因此编码的结果是不唯一的；

▪但0/1分配的上下顺序在整个编码过程中应保持一致，否则不能构成单义可译码；

（2）q元Huffman算法

首先我们看一个例子；

设离散信源的信源空间为：

对其进行q=3,A:

{0,1,2}编码。

0.24

0.20

0.16

0.14

0.08

如果按二元Huffman编码的方法

LiWisip（si）S

（1）S

（2）S（3）

0

0.6211.0

0.380.38

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 讲义 41 信源编码讲解

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：讲义41信源编码讲解Word文档格式.docx
链接地址：https://www.bdocx.com/doc/19237628.html

讲义41信源编码讲解Word文档格式.docx

热门标签