数据结构知识点总结.docx
- 文档编号:10692931
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:30
- 大小:34.37KB
数据结构知识点总结.docx
《数据结构知识点总结.docx》由会员分享,可在线阅读,更多相关《数据结构知识点总结.docx(30页珍藏版)》请在冰豆网上搜索。
数据结构知识点总结
1/35
第一章概论
数据就就是指能够被计算机识别、存储与加工处理得信息得载体。
数据元素就是数据得基本单位,可以由若干个数据项组成。
数据项就是具有独立含义得最小标识单位。
数据结构得定义:
·逻辑结构:
从逻辑结构上描述数据,独立于计算机。
·线性结构:
一对一关系。
·线性结构:
多对多关系。
·存储结构:
就是逻辑结构用计算机语言得实现。
·顺序存储结构:
如数组。
·链式存储结构:
如链表。
·索引存储结构:
·稠密索引:
每个结点都有索引项。
·稀疏xx:
每组结点都有xx项。
·散列存储结构:
如散列表。
·数据运算。
·对数据得操作。
定义在逻辑结构上,每种逻辑结构都有一个运算集合。
·常用得有:
检索、插入、删除、更新、排序。
数据类型:
就是一个值得集合以及在这些值上定义得一组操作得总称。
·结构类型:
由用户借助于描述机制定义,就是导出类型。
抽象数据类型ADT:
·就是抽象数据得组织与与之得操作。
相当于在概念层上描述问题。
·优点就是将数据与操作封装在一起实现了信息隐藏。
2/35
程序设计得实质就是对实际问题选择一种好得数据结构,设计一个好得算法。
算法取决于数据结构。
算法就是一个良定义得计算过程,以一个或多个值输入,并以一个或多个值输出。
评价算法得好坏得因素:
·算法就是正确得;
·执行算法得时间;
·执行算法得存储空间(主要就是辅助存储空间);
·算法易于理解、编码、调试。
时间复杂度:
就是某个算法得时间耗费,它就是该算法所求解问题规模n得函数。
渐近时间复杂度:
就是指当问题规模趋向无穷大时,该算法时间复杂度得数量级。
评价一个算法得时间性能时,主要标准就就是算法得渐近时间复杂度。
算法中语句得频度不仅与问题规模有关,还与输入实例中各元素得取值相关。
时间复杂度按数量级递增排列依次为:
常数阶O
(1)、对数阶O(log2n)、线性阶O(n)、线性对数阶O(nlog2n)、平方阶O(n^2)、立方阶O(n^3)、……k次方阶O(n^k)、指数阶O(2^n)。
空间复杂度:
就是某个算法得空间耗费,它就是该算法所求解问题规模n得函数。
算法得时间复杂度与空间复杂度合称算法复杂度。
第二章线性表
线性表就是由n≥0个数据元素组成得有限序列。
3/35
n=0就是空表;非空表,只能有一个开始结点,有且只能有一个终端结点。
线性表上定义得基本运算:
·构造空表:
Initlist(L)
·求表长:
Listlength(L)
·取结点:
GetNode(L,i)
·查找:
LocateNode(L,x)
·插入:
InsertList(L,x,i)
·删除:
Delete(L,i)
顺序表就是按线性表得逻辑结构次序依次存放在一组地址连续得存储单元中。
在存储单元中得各元素得物理位置与
逻辑结构中各结点相邻关系就是一致得。
地址计算:
LOCa(i)=LOCa
(1)+(i-1)*d;(首地址为1)在顺序表中实现得基本运算:
每个结点值得同时,还存储了其后继结点得地址信息(即指针或链)。
这两部分信息组成链表中得结点结构。
一个单链表由头指针得名字来命名。
单链表运算:
·建立单链表·头插法:
s->next=head;head=s;生成得顺序与输入顺序相反。
平均时间复杂度均为O(n)。
·尾插法:
head=rear=null;if(head=null)head=s;elser->next=s;r=s;平均时间复杂度均为O(n)·加头结点得算法:
对开始结点得操作无需特殊处理,统一了空表与非空表。
·查找·按序号:
与查找位置有关,平均时间复杂度均为O(n)。
·按值:
与输入实例有关,平均时间复杂度均为O(n)。
4/35
·插入运算:
p=GetNode(L,i-1);s->next=p->next;p->next=s;平均时间复杂度均为O(n)·删除运算:
p=GetNode(L,i-1);r=p->next;p->next=r->next;free(r);平均时间复杂度均为O(n)单循环链表就是一种首尾相接得单链表,终端结点得指针域指向开始结点或头结点。
链表终止条件就是以指针等于头指针或尾指针。
采用单循环链表在实用中多采用尾指针表示单循环链表。
优点就是查找头指针与尾指针得时间都就是O
(1),不用
遍历整个链表。
双链表就就是双向链表,就就是在单链表得每个结点里再增加一个指向其直接前趋得指针域prior,形成两条不同方
向得链。
由头指针head惟一确定。
双链表也可以头尾相链接构成双(向)循环链表。
双链表上得插入与删除时间复杂度均为O
(1)。
顺序表与链表得比较:
·基于空间:
·顺序表得存储空间就是静态分配,存储密度为1;适于线性表事先确定其大小时采用。
·链表得存储空间就是动态分配,存储密度<1;适于线性表长度变化大时采用。
·基于时间:
·顺序表就是随机存储结构,当线性表得操作主要就是查找时,宜采用。
·以插入与删除操作为主得线性表宜采用链表做存储结构。
·若插入与删除主要发生在表得首尾两端,则宜采用尾指针表示得单循环链表。
第三章栈与队列
5/35
栈(Stack)就是仅限制在表得一端进行插入与删除运算得线性表,称插入、删除这一端为栈顶,另一端称为栈底。
表中无元素时为空栈。
栈得修改就是按后进先出得原则进行得,我们又称栈为LIFO表(LastInFirstOut)。
通常栈有
顺序栈与链栈两种存储结构。
栈得基本运算有六种:
·构造空栈:
InitStack(S)
·判栈空:
StackEmpty(S)
·判栈满:
StackFull(S)
·进栈:
Push(S,x)
·退栈:
Pop(S)
·取栈顶元素:
StackTop(S)
在顺序栈中有“上溢”与“下溢”得现象。
·“上溢”就是栈顶指针指出栈得外面就是出错状态。
·“下溢”可以表示栈为空栈,因此用来作为控制转移得条件。
顺序栈中得基本操作有六种:
·构造空栈·判栈空·判栈满·进栈·退栈·取栈顶元素链栈则没有上溢得限制,因此进栈不要判栈满。
链栈不需要在头部附加头结点,只要有链表得头指针就可以了。
链栈中得基本操作有五种:
·构造空栈·判栈空·进栈·退栈·取栈顶元素
队列(Queue)就是一种运算受限得线性表,插入在表得一端进行,而删除在表得另一端进行,允许删除得一端称为队头(front),允许插入得一端称为队尾(rear),队列得操作原则就是先进先出得,又称作FIFO表(FirstInFirstOut)、队列也有顺序存储与链式存储两种存储结构。
·入队:
EnQueue(Q,x)
·出队:
DeQueue(Q)
·取队头元素:
QueueFront(Q)
6/35
顺序队列得“假上溢”现象:
由于头尾指针不断前移,超出向量空间。
这时整个向量空间及队列就是空得却产生了“上
溢”现象。
为了克服“假上溢”现象引入循环向量得概念,就是把向量空间形成一个头尾相接得环形,这时队列称循环队列。
判定循环队列就是空还就是满,方法有三种:
·一种就是另设一个xx变量来判断;
·第二种就是少用一个元素空间,入队时先测试((rear+1)%m=front)?
满:
空;
·第三种就就是用一个计数器记录队列中得元素得总数。
队列得链式存储结构称为链队列,一个链队列就就是一个操作受限得单链表。
为了便于在表尾进行插入(入队)得操作,在表尾增加一个尾指针,一个链队列就由一个头指针与一个尾指针唯一地确定。
链队列不存在队满与上溢得问题。
在链队列得出队算法中,要注意当原队中只有一个结点时,出队后要同进修改头尾指针并使队列变空。
第四章串
串就是零个或多个字符组成得有限序列。
·空串:
就是指长度为零得串,也就就是串中不包含任何字符(结点)。
·空白串:
指串中包含一个或多个空格字符得串。
·在一个串中任意个连续字符组成得子序列称为该串得子串,包含子串得串就称为主串。
·子串在主串中得序号就就是指子串在主串中首次出现得位置。
·空串就是任意串得子串,任意串就是自身得子串。
7/35
串分为两种:
·串常量在程序中只能引用不能改变;
·串变量得值可以改变。
串得基本运算有:
·求串长strlen(char*s)
·串复制strcpy(char*to,char*from)
·串联接strcat(char*to,char*from)
·串比较charcmp(char*s1,char*s2)
·字符定位strchr(char*s,charc)
串就是特殊得线性表(结点就是字符),所以串得存储结构与线性表得存储结构类似。
串得顺序存储结构简称为顺序串。
顺序串又可按存储分配得不同分为:
·静态存储分配:
直接用定长得字符数组来定义。
优点就是涉及串长得操作速度快,但不适合插入、链接操作。
·动态存储分配:
就是在定义串时不分配存储空间,需要使用时按所需串得长度分配存储单元。
串得链式存储就就是用单链表得方式存储串值,串得这种链式存储结构简称为链串。
链串与单链表得差异只就是它得结
点数据域为单个字符。
为了解决“存储密度”低得状况,可以让一个结点存储多个字符,即结点得大小。
顺序串上子串定位得运算:
又称串得“模式匹配”或“串匹配”,就是在主串中查找出子串出现得位置。
在串匹配中,将主串称为目标(串),子串称为模式(串)。
这就是比较容易理解得,串匹配问题就就是找出给定模式串P在给定目标串T中首次出现得有效位移或者就是全部有效位移。
最坏得情况下时间复杂度就是O((n-m+1)m),假如m与n同阶
8/35
得话则它就是O(n^2)。
链串上得子串定位运算位移就是结点地址而不就是整数
第五章多维数组
数组一般用顺序存储得方式表示。
存储得方式有:
·行优先顺序,也就就是把数组逐行依次排列。
PASCAL、C
·列优先顺序,就就是把数组逐列依次排列。
FORTRAN特殊矩阵得概念:
所谓特殊矩阵就是指非零元素或零元素分布有一定规律得矩阵。
稀疏矩阵得概念:
一个矩阵中若其非零元素得个数远远小于零元素得个数,则该矩阵称为稀疏矩阵。
特殊矩阵得类型:
·对称矩阵:
满足a(ij)=a(ji)。
元素总数n(n+1)/2、I=max(i,j),J=min(i,j),LOCa(ij)=LOC(sa[0])+(I*(I+1)/2+J)*d、
·三角矩阵:
·上三角阵:
k=i*(2n-i+1)/2+j-i,LOCa(ij)=LOC(sa[0])+k*d、
·下三角阵:
k=i*(i+1)/2+j,LOCa(ij)=LOC(sa[0])+k*d、
·对角矩阵:
k=2i+j,LOCa(ij)=LOC(sa[0])+k*d、
稀疏矩阵得压缩存储方式用三元组表把非零元素得值与它所在得行号列号做为一个结点存放在一起,用这些结点组成得一个线性表来表示。
但这种压缩存储方式将失去随机存储功能。
加入行表记录每行得非零元素在三元组表中得
起始位置,即带行表得三元组表。
第六章树
树就是n个结点得有限集合,非空时必须满足:
只有一个称为根得结点;其余结点形成m个不相交得子集,并称
根得子树。
9/35
根就是开始结点;结点得子树数称度;度为0得结点称叶子(终端结点);度不为0得结点称分支结点(非终端结
点);除根外得分支结点称内部结点;
有序树就是子树有左,右之分得树;无序树就是子树没有左,右之分得树;森林就是m个互不相交得树得集合;树得四种不同表示方法:
·树形表示法;·嵌套集合表示法;·凹入表示法·广义表表示法。
二叉树得定义:
就是n≥0个结点得有限集,它就是空集(n=0)或由一个根结点及两棵互不相交得分别称作这个根得
xx与右子树得二叉树组成。
二叉树不就是树得特殊情形,与度数为2得有序树不同。
二叉树得4个重要性质:
·二叉树上第i层上得结点数目最多为2^(i-1)(i≥1)。
;
·深度为k得二叉树至多有(2^k)-1个结点(k≥1);
·在任意一棵二叉树中,若终端结点得个数为n0,度为2得结点数为n2,则n0=n2+1;·具有n个结点得完全二叉树得深度为int(log2n)+1、
满二叉树就是一棵深度为k,结点数为(2^k)-1得二叉树;完全二叉树就是满二叉树在最下层自右向左去处部分结点;
二叉树得顺序存储结构就就是把二叉树得所有结点按照层次顺序存储到连续得存储单元中。
(存储前先将其画成完全
二叉树)
树得存储结构多用得就是链式存储。
BinTNode得结构为lchild|data|rchild,把所有BinTNode类型得结点,加上一个指向根结点得BinTree型头指针就构成了二叉树得链式存储结构,称为二叉链表。
它就就是由根指针root唯一确定得。
共有2n个指针域,n+1个空指针。
10/35
根据访问结点得次序不同可得三种遍历:
先序遍历(前序遍历或先根遍历),中序遍历(或中根遍历)、后序遍历(或后根遍历)。
时间复杂度为O(n)。
利用二叉链表中得n+1个空指针域来存放指向某种遍历次序下得前趋结点与后继结点得指针,这些附加得指针就称为“线索”,加上线索得二叉链表就称为线索链表。
线索使得查找中序前趋与中序后继变得简单有效,但对于查找指定结
点得前序前趋与后序xx并没有什么作用。
树与森林及二叉树得转换就是唯一对应得。
转换方法:
·树变二叉树:
兄弟相连,保留长子得连线。
·二叉树变树:
结点得右孩子与其双亲连。
点得孩子及后代。
·孩子链表表示法:
为树中每个结点data|next设置一个孩子链表firstchild,并将data|firstchild存放在一个向量中。
·双亲孩子链表表示法:
将双亲链表与孩子链表结合。
·孩子兄弟链表表示法:
结点结构leftmostchild|data|rightsibing,附加两个分别指向该结点得最左孩子与右邻兄弟得
指针域。
树得前序遍历与相对应得二叉树得前序遍历一致;树得后序遍历与相对应得二叉树得中序遍历一致。
树得带权路径长度就是树中所有叶结点得带权路径长度之与。
树得带权路径长度最小得二叉树就称为最优二叉树
(即xx树)。
在叶子得权值相同得二叉树中,完全二叉树得路径长度最短。
11/35
哈夫曼树有n个叶结点,共有2n-1个结点,没有度为1得结点,这类树又称为严格二叉树。
变长编码技术可以使频度高得字符编码短,而频度低得字符编码长,但就是变长编码可能使解码产生二义性。
如00、01、0001这三个码无法在解码时确定就是哪一个,所以要求在字符编码时任一字符得编码都不就是其她字符编码得
前缀,这种码称为前缀码(其实就是非前缀码)。
哈夫曼树得应用最广泛地就是在编码技术上,它能够容易地求出给定字符集及其概率分布得最优前缀码。
哈夫曼编码得构造很容易,只要画好了哈夫曼树,按分支情况在左路径上写代码0,右路径上写代码1,然后从上到下到叶结
点得相应路径上得代码得序列就就是该结点得最优前缀码。
第七章图
图得逻辑结构特征就就是其结点(顶点)得前趋与后继得个数都就是没有限制得,即任意两个结点之间之间都可能相关。
图GraphG=(V,E),V就是顶点得有穷非空集合,E就是顶点偶对得有穷集。
有向图Digraph:
每条边有方向;无向图Undigraph:
每条边没有方向。
有向完全图:
具有n*(n-1)条边得有向图;无向完全图:
具有n*(n-1)/2条边得无向图;有根图:
有一个顶点有路径到达其它顶点得有向图;简单路径:
就是经过顶点不同得路径;简单回路就是开始与终端重
得简单路径;
网络:
就是带权得图。
图得存储结构:
12/35
·邻接矩阵表示法:
用一个n阶方阵来表示图得结构就是唯一得,适合稠密图。
·无向图:
邻接矩阵就是对称得。
·xx:
行就是出度,列就是xx。
建立邻接矩阵算法得时间就是O(n+n^2+e),其时间复杂度为O(n^2)
·邻接表表示法:
用顶点表与邻接表构成不就是唯一得,适合稀疏图。
·顶点表结构vertex|firstedge,指针域存放邻接表头指针。
·邻接表:
用头指针确定。
·无向图称边表;
·xx又分出边表与逆邻接表;
·邻接表结点结构为adjvex|next,
时间复杂度为O(n+e)。
,空间复杂度为O(n+e)。
。
图得遍历:
·深度优先遍历:
借助于邻接矩阵得列。
使用栈保存已访问结点。
·广度优先遍历:
借助于邻接矩阵得行。
使用队列保存已访问结点。
生成树得定义:
若从图得某个顶点出发,可以系统地访问到图中所有顶点,则遍历时经过得边与图得所有顶点构成得子图称作该图得生成树。
构造最小生成树得算法:
·Prim算法得时间复杂度为O(n^2)与边数无关适于稠密图。
·Kruskal算法得时间复杂度为O(lge),主要取决于边数,较适合于稀疏图。
最短路径得算法:
·Dijkstra算法,时间复杂度为O(n^2)。
·类似于prim算法。
13/35
拓扑排序:
就是将有向无环图G中所有顶点排成一个线性序列,若∈E(G),则在线性序列u在v之前,这种线性序列称为拓扑序列。
拓扑排序也有两种方法:
·无前趋得顶点优先,每次输出一个无前趋得结点并删去此结点及其出边,最后得到得序列即拓扑序列。
·无后继得结点优先:
每次输出一个无后继得结点并删去此结点及其入边,最后得到得序列就是逆拓扑序列。
第八章排序
记录中可用某一项来标识一个记录,则称为关键字项,该数据项得值称为关键字。
排序就是使文件中得记录按关键字递增(或递减)次序排列起来。
·基本操作:
比较关键字大小;改变指向记录得指针或移动记录。
·存储结构:
顺序结构、链表结构、索引结构。
经过排序后这些具有相同关键字得记录之间得相对次序保持不变,则称这种排序方法就是稳定得,否则排序算法就是不稳定得。
排序过程中不涉及数据得内、外存交换则称之为“内部排序”(内排序),反之,若存在数据得内外存交换,则称之为外排序。
内部排序方法可分五类:
插入排序、选择排序、交换排序、归并排序与分配排序。
评价排序算法好坏得标准主要有两条:
执行时间与所需得辅助空间,另外算法得复杂程序也就是要考虑得一个因素。
插入排序:
·直接插入排序:
·逐个向前插入到合适位置。
·哨兵(监视哨)有两个作用:
·作为临变量存放R[i]
14/35
·就是在查找循环中用来监视下标变量j就是否越界。
·直接插入排序就是就地得稳定排序。
时间复杂度为O(n^2),比较次数为(n+2)(n-1)/2;移动次数为(n+4)(n-1)/2;
·希尔排序:
·等间隔得数据比较并按要求顺序排列,最后间隔为1、
·希尔排序就是就地得不稳定排序。
时间复杂度为O(n^1、25),比较次数为(n^1、25);移动次数为(1、6n^1、25);
交换排序:
·冒泡排序:
·自下向上确定最轻得一个。
·自上向下确定最重得一个。
·自下向上确定最轻得一个,后自上向下确定最重得一个。
·冒泡排序就是就地得稳定排序。
时间复杂度为O(n^2),比较次数为n(n-1)/2;移动次数为3n(n-1)/2;·快速排序:
·以第一个元素为参考基准,设定、动两个指针,发生交换后指针交换位置,直到指针重合。
重复直到排序完成。
·快速排序就是非就地得不稳定排序。
时间复杂度为O(nlog2n),比较次数为n(n-1)/2;选择排序:
·直接选择排序:
·选择最小得放在比较区前。
·直接选择排序就地得不稳定排序。
时间复杂度为O(n^2)。
比较次数为n(n-1)/2;·堆排序·建堆:
按层次将数据填入完全二叉树,从int(n/2)处向前逐个调整位置。
·然后将树根与最后一个叶子交换值并断开与树得连接并重建堆,直到全断开。
·堆排序就是就地不稳定得排序,时间复杂度为O(nlog2n),不适宜于记录数较少得文件。
归并排序:
·先两个一组排序,形成(n+1)/2组,再将两组并一组,直到剩下一组为止。
·归并排序就是非就地稳定排序,时间复杂度就是O(nlog2n),
15/35
分配排序:
·箱排序:
·按关键字得取值范围确定箱子数,按关键字投入箱子,链接所有非空箱。
·箱排序得平均时间复杂度就是线性得O(n)。
·基数排序:
·从低位到高位依次对关键字进行箱排序。
·基数排序就是非就稳定得排序,时间复杂度就是O(d*n+d*rd)。
各种排序方法得比较与选择:
·待排序得记录数目n;n较大得要用时间复杂度为O(nlog2n)得排序方法;
第九章查找
查找得同时对表做修改操作(如插入或删除)则相应得表称之为动态查找表,否则称之为静态查找表。
衡量查找算法效率优劣得标准就是在查找过程中对关键字需要执行得平均比较次数(即平均查找长度ASL)。
线性表查找得方法:
·顺序查找:
逐个查找,ASL=(n+1)/2;
·二分查找:
取中点int(n/2)比较,若小就比左区间,大就比右区间。
用二叉判定树表示。
ASL=(∑(每层结点数*层数))/N、
·分块查找。
要求“分块有序”,将表分成若干块内部不一定有序,并抽取各块中得最大关键字及其位置建立有序索引表。
二叉排序树(BST)定义就是:
二叉排序树就是空树或者满足如下性质得二叉树:
·若它得左子树非空,则左子树上所有结点得值均小于根结点得值;
·若它得右子树非空,则右子树上所有结点得值均大于根结点得值;
·左、右子树本身又就是一棵二叉排序树。
二叉排序树得插入、建立、删除得算法平均时间性能就是O(nlog2n)。
16/35
二叉排序树得删除操作可分三种情况进行处理:
·*P就是叶子,则直接删除*P,即将*P得双亲*parent中指向*P得指针域置空即可。
·*P只有一个孩子*child,此时只需将*child与*p得双亲直接连接就可删去*p、
·*p有两个孩子,则先将*p结点得中序后继结点得数据到*p,删除中序后继结点。
关于B-树(多路平衡查找树)。
它适合在磁盘等直接存取设备上组织动态得查找表,就是一种外查找算法。
建立得方式就是从下向上拱起。
散列技术:
将结点按其关键字得散列地址存储到散列表得过程称为散列。
散列函数得选择有两条标准:
简单与均匀。
常见得散列函数构得造方法:
·平方取中法:
hash=int((x^2)_x0010_0)
·除余法:
表长为m,hash=x%m
·相乘取整法:
hash=int(m*(x*A-int(x*A));A=0、618·随机数法:
hash=random(x)。
处理冲突得方法:
·开放定址法:
·一般形式为hi=(h(key)+di)%m1≤i≤m-1,开放定址法要求散列表得装填因子α≤1、
·开放定址法类型:
·线性探查法:
address=(hash(x)+i)%m;
·二次探查法:
address=(hash(x)+i^2)%m;
·双重散列法:
address=(hash(x)+i*hash(y))%m;
·拉链法:
·就是将所有关键字为同义词得结点链接在同一个单链表中。
·拉链法得优点:
·拉链法处理冲突简单,且无堆积现象;
·链表上得结点空间就是动态申请得适于无法确定表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 知识点 总结