高中信息技术竞赛班数据结构专项培训教程07树教案Word文档下载推荐.docx
- 文档编号:22644960
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:32
- 大小:117.96KB
高中信息技术竞赛班数据结构专项培训教程07树教案Word文档下载推荐.docx
《高中信息技术竞赛班数据结构专项培训教程07树教案Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《高中信息技术竞赛班数据结构专项培训教程07树教案Word文档下载推荐.docx(32页珍藏版)》请在冰豆网上搜索。
性质3:
对任意一棵二叉树,如果度为2的结点数为n2,则其叶子结点数为③。
性质4:
具有n个结点的完全二叉树的深度为
性质5:
如果对一棵有n个结点的完全二叉树的结点按层序编号(每层从左到右),则对任一结点i(1≤i≤n),有:
①如果i=1,则结点i是二叉树的根;
如果i>
1,则其双亲结点是idiv2
②如果2*i>
n,则结点i无左孩子(结点i为叶子结点);
否则其左孩子为2*i
③如果2*i+1>
n,则结点i无右孩子,否则其右孩子为2*i+1
[参考答案及证明]:
①2i-1
证明:
利用归纳法
当i=1时,只有一个根结点,显然,2i-1=20=1正确;
假设对所有的j,1≤j<
i,命题成立,即第j层上至多有2j-1个结点;
由假设,第i-1层上至多有2i-1个结点,由于二叉树中的每个结点的度至多为2,故在第i层上的最大结点数为第i-1层上最大结点数的2倍,即2*2i-2=2i-1
②2k-1
深度为K的二叉树的最大结点数为
③n2+1
设叶子结点数为n0,度为1的结点数为n1,则该数结点的总数为:
n=n0+n1+n2
(1)
树中结点之间的连线称为分支。
树中除根结点外,其余每个结点都有一个分支进入,设B为二叉树分支的总数,则有:
B=n–1
另一方面,这些分支是由度为1或2的结点射出的,所以:
B=n1+2n2
所以:
n–1=n1+2n2
(2)
由式
(1)和
(2)得:
n0+n1+n2–1=n1+2n2
即:
n0=n2+1
④
假设深度为K的完全二叉树的结点数为n,则根据性质2和完全二叉树定义有:
或
于是
∵k是整数∴
⑤证明略
7.2.2二叉树的存储结构
1.顺序存储结构
将二叉树的所有结点按一定的次序,存储到一片连续的存储单元中。
这种结构,较适用于满二叉树或近似满二叉树。
如图7.2.5中完全二叉树的存储结构如下:
A
B
C
D
E
F
G
H
I
J
K
L
M
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
图7.2.6中的二叉树的存储结构如下:
可以看出,当二叉树较稀疏时,采用顺序存储将造成浪费。
[练习]
1)如果完全二叉树最多有n层,那么存储该树的数组最少设________个单元;
2)某结点存储于S[i],则存在双亲结点的条件:
if______________________
其双亲结点位于S[____],其左孩子结点位于S[____];
2.链式存储结构
设计不同的结点结构可以构成不同形式的链式存储结构。
由二叉树的定义可知,二叉树的结点由一个数据元素和分别指向其左右子树的两个分支构成,则表示二叉树的链表中的结点至少包含三个域:
数据域和左、右指针域,如图7.2.7。
有时为了便于找到结点的双亲,则还可以在结点的结构中增加一个指向其双亲结点的指针域。
用这两种结点结构所得的二叉树的存储结构分别称为二叉链表和三叉链表,如图7.2.8。
(a)二叉链表
(b)三叉链表
图7.2.8
在具体应用中采用什么存储结构,除根据二叉树的形态之外,还应考虑需进行何种操作。
如找结点的双亲,在三叉链表中容易实现,而在二叉链表中则需从根中指针出发巡查。
7.3遍历二叉树
遍历二叉树(traversingbinarytree)是指按某种搜索路径巡访树中每个结点,使得每个结点均被访问一次,且仅访问一次。
根据二叉树的定义知,二叉树由三个基本单元组成:
根结点、左子树和右子树。
因此,若能依次遍历这三个部分,则遍历了整棵二叉树。
假设以D、L、R分别表示访问根结点、遍历左子树、遍历右子树,则可有DLR、LDR、LRD、DRL、RDL、RLD六种遍历方案。
前三种分别称为先(根)序、中(根)序、后(根)序,后三种称为逆先序、逆中序、逆后序。
通常只使用前三种。
先序遍历二叉树的操作定义为:
图7.3.1
【例7.3_1】
DLR(先序):
ABDICFMG
LDR(中序):
DIBAFMCG
LRD(后序):
IDBMFGCA
(1)访问根结点;
(2)先序遍历左子树;
(3)先序遍历右子树;
中序遍历二叉树的操作定义为:
(1)中序遍历左子树;
(2)访问根结点;
(3)中序遍历右子树;
后序遍历二叉树的操作定义为:
(1)后序遍历左子树;
(2)后序遍历右子树;
(3)访问根结点;
遍历算法的描述形式随存储结构的不同而不同,若定义二叉树的存储结构如下:
TYPE
Pointer=^node;
node=RECORD
data:
char;
lchild,rchild:
pointer;
END;
先序遍历二叉树的递归算法如下:
procedurepreorder(p:
pointer);
begin
ifp<
>
nilthenbegin
write(p^.data);
preorder(p^.lchild);
preorder(p^.rchild);
end;
请完成中序遍历二叉树的递归算法:
procedureinorder(p:
请完成后序遍历二叉树的递归算法:
procedurepostorder(p:
二叉树的三种遍历递归算法写得非常精妙,只要对它稍加修改(主要在process语句处),就可的各种不同功能、用途的算法。
如建立二叉树、查找结点、求每个结点所处的层次、求二叉树的高度、结点个数、复制二叉树等。
7.4二叉树的建立
二叉树的建立可分先序、中序、后序三种方法。
先序建立二叉树即输入结点数据的顺序按先序遍历所得的序列输入,输入“*”,表示该子树为空,如输入abc**d**e**,得到的二叉树如图7.4.1。
中序、后序类推。
【练习】:
请将前面遍历二叉树的算法稍加改动,分别写出先序、中序、后序建立二叉树的算法。
7.5树的存储结构
【思考】请先不要看下面内容,如果对一棵树(不定支数),你如何设计它的存储结构?
一、多重链表表示法
每个结点的设m个指针域指向该结点的子数,m为树的度,结点结构如下:
很容易看出,多重链表的缺点是,当树中结点的子树数相差较大,许多结点的度小于m时,链表中有很多空指针域,空间较浪费。
二、双亲表示法
这种存储结构利用每个结点(除根外)只有唯一的双亲的性质,以一组连续空间存储树的结点,同时在每个结点中附设一个指示器指示其双亲结点在链表中的位置。
data
parent
其存储结构说明如下:
TYPEtnode=record
Data:
Parent:
integer;
VARtree:
array[1..maxnode]oftnode;
三、孩子表示法
将每个结点的孩子结点用单链表链接起来,树中n个结点就有n条孩子链(叶子的孩子链为空),而将这n条链的头结点按顺序排列起来,组成一个线性表。
(a)孩子链表
(b)带双亲的孩子链表
图7.5.1
如图7.5.1(a)孩子链表的存储结构说明如下:
TYPEtlink=^tnode;
Tnode=RECORD
Data:
char;
Next:
tlink;
End;
Vartree:
array[1..n]oftlink;
这种方法较适用于涉及孩子的操作,但不适用于涉及双亲的操作。
我们可以采取改进的存储方法,在每一个孩子链的头结点中加一个域,存储其双亲结点的位置,如图7.5.1(b)。
四、孩子兄弟表示法
又称二叉链表表示法,链表中结点的两个链接域分别指向该结点的第一个孩子结点和下一个兄弟结点。
结点结构说明如下:
TYPEtlink=^tnode;
fch,nsib:
tlink;
END
7.6森林与二叉树的转换
从上面树的孩子兄弟表示法可以看出,二叉树和树都可用二叉链表作为存储结构,则以二叉链表作为媒介可导出树与二叉树之间的一个对应关系。
也就是说,给定一棵树,可以找出唯一的一棵二叉树与之对应。
将一般树或森林转换成二叉树表示,其目的是为了节省存储空间。
7.6.1树或森林转换成二叉树
树转换成二叉树的步骤如下:
①将结点的所有兄弟连接在一起;
②将所有不是连到最左子结点的子结点链表删除;
③将结点的右子树向顺时针方向旋转45°
。
①将森林中的各棵树分别转换成二叉树;
②将所有转换而成的二叉树的树根相连;
第二棵树作为第一棵
树的右子树,第三棵树作为第二棵树的右子树……,以第一棵树的树根为根。
算法描述如下:
如果F={T1,T2,…,Tm}是森林,则可按如下规则转换成一棵二叉树B={root,LB,RB}。
(1)若F为空,即m=0,则B为空树;
(2)若F非空,即m≠0,则B的根root即为森林中第一棵树的根root(T1);
B的左子树LB是第一棵树转换而成的二叉树;
B的右子树RB是从森林F’={T2,T3,…,Tm}转换而成的二叉树。
★转换所得的二叉树,左支是孩子,右支是兄弟。
7.6.2二叉树转换成森林或树
二叉树转换成树其实是树转二叉树的逆过程,步骤如下:
①将每个结点的右子树向逆时针方向旋转45°
②删除与左子树的横向连接;
③断开连接后的结点与左子树为兄弟,将其与双亲相连。
如果B={root,LB,RB}是一棵二叉树,则可按如下规则转换成森林F={T1,T2,…,Tm}。
(1)若B为空,则F为空;
(2)若B非空,则F中第一棵树T1的根root(T1)即为二叉树B的根root;
T1中根结点的子树森林是由B的左子树LB转换而成的森林;
F中其余的树F’={T2,T3,…,Tm}是由B的右子树RB转换而成的森林。
【练习】将下列的树或森林转换成二叉树
(1)
(2)
【练习】将下列的二叉树转换成树或森林
(1)(3)
(2)(4)
(5)
7.7树和森林的遍历
一、先序遍历森林
若森林非空,可按以下规则遍历:
(1)访问第一棵树的根;
(2)先序遍历第一棵树的子树;
(3)先序遍历余下的其它树;
二、中序遍历森林
(1)中序遍历森林中第一棵树的根结点
(2)访问第一棵树的根结点;
(3)中序遍历余下的其它树;
7.8哈夫曼树及其应用
7.8.1扩充二叉树
·
几个基本概念
从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径;
路径上的分支数目称为路径长度;
树的路径长度是从树根到每一结点的路径长度之和;
扩充二叉树是指将原二叉树中每个凡缺少左、右孩子的结点,均扩充为带左、右两个孩子。
例如图7.8.1(a)中的二叉树变为扩充二叉树后如图7.8.1(b)所示,图中圆形结点是原来的,称为内部结点;
方形结点是扩充结点,又称外部结点。
(a)二叉树
(b)扩充二叉树
【图7.8.1】
内路径长度I(从根到每一内结点的路径长度之和):
I=1+2+1+2+3+2=11
外路径长度E(从根到每一外结点的路径长度之和):
E=3+3+2+3+4+4+3+3=25
·
一些规律:
(1)若扩充二叉树有n个内部结点,则有个外部结点;
(2)扩充二叉树的内、外路径长度I、E的关系是E=。
答案:
(1)n+1
(2)E=I+2n
(1).n+1
证明:
根据二叉树性质3
(对任意一棵二叉树,如果度为2的结点数为n2,则其叶子结点数为n2+1)
扩充二叉树的内部结点的度都是2,有n个内部结点,则外部结点(即叶子)有n+1个。
证毕。
(2).E=I+2n
(数学归纳法)
当n=1时,由于只有一个内部结点,I=0,E=2,所以E=I+2n
假设对于所有的k,都有Ek=Ik+2k
当k+1时,即添加一个内部结点,设其路径长度为L,
则Ik+1=Ik+L
Ek+1=Ek-L+2(L+1)=Ek+L+2
=(Ik+2k)+L+2=Ik+L+2k+2
=Ik+1+2(k+1)
7.8.2最优二叉树(哈夫曼树)
对扩充二叉树的外部结点均赋于一个权值,则称带权二叉树。
其带权路径长度是每个外部结点到根的路径长度Lj乘以权值Wj的积之和。
(a)(b)(c)
图7.8.2
=W1L1+W2L2+……+WmLm
如图7.8.2中的几种扩充二叉树的带权路径长度分别为:
WEa=11×
2+5×
2+4×
2+2×
2=44
WEb=4×
3+11×
3+2×
1=58
WEc=11×
1+5×
3=39
规律:
权值越大的外部结点离根结点越近,其带权路径长度最短,如(c)中的树。
假设有n个权值{W1,W2,……,Wn},试构造一棵有n个叶子结点的二叉树,每个叶子结点(外部结点)带权Wi,则其中带权路径长度最小的二叉树称为最优二叉树或哈夫曼树。
【例】将学生百分制成绩用A、B、C、D、E等级表示,成绩分别规律如下:
分数
0~59
60~69
70~79
80~89
90~100
等级
比例数
0.05
0.15
0.40
0.30
0.10
若有10000个数据,按图(a)的判定过程进行转换,则有80%的数据至少要进行三次比较,完成10000个数据转换的比较次数为:
10000×
(1×
5%+2×
15%+3×
40%+4×
(30%+10%))=31500次
按图(b)的判定过程,完成10000个数据转换的比较次数为:
(2×
(10%+30%+40%)+3×
(5%+15%))=22000次
显然,后者的判定过程效率比前者高。
图(b)所示的判定过程是最优的,该二叉树称为最优二叉树,又称哈夫曼树。
7.8.3哈夫曼树的构造
如何构造哈夫曼树呢?
哈夫曼(Huffman)最早给出一个带有一般规律的算法(哈夫曼算法):
(1)根据给定的n个权值{W1,W2,……,Wn}构成n棵二叉树的集合F={T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为Wi的根结点,其左右子树均空。
(2)在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新树的根结点的权值为其左右子树根结点的权值之和。
(3)在F中删除这两棵树,同时将新树加入F中。
(4)重复
(2)和(3),直到F中只含一棵树为止。
哈夫曼树的构建过程如图7.8.3所示。
【图7.8.3】
(d)
7.8.4哈夫曼树的应用
1.用于判断过程
利用哈夫曼树可以构成最佳判断过程。
例如,要对一批正整数按下表要求分类:
数a
出现概率
属第几类
a≤20
2/18
20<
a≤50
4/18
50<
a≤100
5/18
100<
a
7/18
a属第三类
a属第四类
a属第二类
a属第一类
(a)
(b)
【图7.8.4】
其最佳判断过程如图7.8.4(b)所示,这是按哈夫曼树的原则来组织的判断过程,其平均执行时间最短。
而图7.8.4(a)的判断平均时间最长。
2.哈夫曼编码
一般通信中传送字符采用等长的ASCII码。
例如,假设需要传送的报文内容为“ABACCDA”,它只有四种字符,只需两个字符的串就可分辩。
设A、B、C、D的编码分别为:
00、01、10、11,则上述报文的电文为“00010010101100”,总长14位,对方接收时,可按2位一分进行译码。
图7.8.5
如果对字符设计不等长的编码,且出现频率高的采用尽可能短的编码,则可以提高通信速度。
例如设计A、B、C、D的编码分别为:
0、00、1、01,则上述电文可改为:
“000011010”,长度仅为9。
但这样的电文无法翻译,例如前四个字符“0000”就可有多种译法,或是“AAAA”,或是“ABA”,也可以是“BB”。
因此,要设计长短不等的编码,则要求任一字符的编码都不是另一个字符编码的前缀,这种编码称为前缀编码。
可以利用二叉树来设计二进制的前缀编码。
约定二叉树的左分支表示字符‘0’,右分支表示字符‘1’,树叶代表给定的字符,则可以从树根到叶子的路径上分支字符组成的字符串作为该叶子字符的编码。
如图7.8.5所示。
而哈夫曼树可使电文总长最短。
以字符出现的频率为权,设计一棵哈夫曼树,由此得到的二进制前缀编码称为哈夫曼编码。
下面讨论具体的做法:
设需要编码的字符集D={d1,d2,……,dn},设Wi为di在文本中出现的次数,则权值W={W1,W2,……,Wn}。
将权值作为外部结点构造成哈夫曼树,取左支为0,右支为1,从根至叶路径上0、1组成的二进制串作为该叶结点字符的编码。
将编码存入D对应的编码表。
发送:
根据字符从编码表中找到相应的编码发送出去,如发送abcbc字符串,发出的二进制串是111101100110。
接收译码:
对收到的二进制串,按顺序从哈夫曼树根走到叶结点,0走左支,1走右支,一直走到叶结点,就可译出一个字符。
下次再从根开始对后续二进制位串进行译码,译出下一个字符,如此下去,直至译完为止。
【练习】已知某系统在通信联络中只可能出现八种字符{a,b,c,d,e,f,g,h},其频率分别为:
0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11,试设计哈夫曼编码,进行报文编码和译码。
输入格式:
输入文件名:
hfm.in
第1行为字母B或Y,B代表进行报文编码,Y代表进行译码。
第2行为整数n,代表报文/电文行数
第3到n+3行为报文/电文内容
输出格式:
输出文件名:
hfm.out
第1行为报文/电文行数n
第2到n+2行为报文/电文内容(若非报文字符则该行输出‘error’)
输入输出举例:
输入:
deb
bdhd
输出:
111111010
10111101011
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中 信息技术 竞赛 数据结构 专项 培训 教程 07 教案