数据库系统概论复习重点文档格式.docx
- 文档编号:16163757
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:6
- 大小:20.44KB
数据库系统概论复习重点文档格式.docx
《数据库系统概论复习重点文档格式.docx》由会员分享,可在线阅读,更多相关《数据库系统概论复习重点文档格式.docx(6页珍藏版)》请在冰豆网上搜索。
两个实体型之间的联系可以分为三种:
1、一对一联系。
2、一对多联系。
3、多对多联系。
E-R图
关系模型是目前最重要的一种数据模型。
关系数据库系统采用关系模型作为数据的组织方式。
关系数据模型的操纵与完整性约束。
操作主要包括查询、插入、删除和更新数据。
这些操作必须满足关系的完整性约束条件。
关系的完整性约束条件包括三大类:
实体完整性、参照完整性和用户定义的完整性。
在关系数据模型中,实体及实体间的联系都用表来表示。
关系数据模型的优点:
1、关系模型与格式化模型不同,它是建立在严格的数学概念的基础上的。
2、关系模型的概念单一,都用表来表示。
3、关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。
关系数据模型的主要欠缺点是由于存取路径对用户透明,查询效率往往不如格式化数据模型。
在数据模型中有型和值的概念。
型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。
模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。
数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。
关系数据库系统是支持关系模型的数据库系统。
域是一组具有相同数据类型的值的集合。
笛卡尔积是域上面的一种集合运算。
若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。
若一个关系有多个候选码,则选定一个为主码。
候选码的诸属性成为主属性。
不包含在任何候选码中的属性称为非主属性或非码属性。
在最简单的情况下,候选码只包含一个属性。
在最极端的情况下,关系模式的所有属性是这个关系模式的候选码,称为全码。
关系可以有三种类型:
基本关系、查询表和视图表。
基本表示实际存在的表,他是实际存储数据的逻辑表示。
查询表是查询结果对应的表
视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。
基本关系具有六条性质:
1、列是同质的,即每一列中的分量是同一类型的数据,来自同一个域。
2、不同的列可出自同一个域,
称其中的每一列为一个属性,不同的属性要给与不同的属性名。
3、列的顺序无所谓,即列的次序可以任意交换。
4、任意两个元组的候选码不能相同。
5、行的顺序无所谓,即行的次序可以任意交换。
6、分量必须取原子值,即每一个分量都必须是不可分的数据项。
关系模型中常用的关系操作包括查询操作和插入、删除、修改操作两大部分。
关系的查询表达能力很强,是关系操作中最主要的部分。
关系操作的特点是集合操作方式,即操作的对象和结果都是集合。
关系模型的完整性规则是对关系的某种约束条件。
也就是说关系的值随着时间变化时应该满足一些约束条件。
实体完整性规则:
若属性A是基本关系R的主属性,则A不能取空值。
参照完整性规则:
若属性F是基本关系R的外码,它与基本关系S的主码KS相对应,则对于R中每个元组在F上的值必须为:
或者取空值,或者等于S中某个元组的主码值。
数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。
数据库安全性所关心的主要是DBMS的存取控制机制。
存取控制机制主要包括两部分:
1、定义用户权限,并将用户权限登记到数据字典中。
2、合法权限检查。
当前大型的DBMS一般都支持C2级中的自主存取控制,有些DBMS同时还支持B1级中的强制存取控制。
在自主存取控制方法中,用户对于不同的数据库对象有不同的存取权限,不同的用户对同一对象也有不同的权限,而且用户还可将其拥有的存取权限转授给其他用户。
非常灵活。
在强制存取控制方法中,每一个数据库对象被标以一定的密级,每一个用户也被授予某一个级别的许可证。
相对比较严格。
数据的完整性是为了防止数据库中存在不符合语义的数据,也就是防止数据库中存在不正确的数据。
数据的安全性是保护数据库防止恶意的破坏和非法的存取。
因此完整性检查和控制的防范对象是不合语义的、不正确的数据,防止它们进入数据库。
安全性控制的防范对象是非法用户和非法操作,防止他们对数据库数据的非法存取。
关系模型的实体完整性在CREATETABNLE中用PRIMARYKEY定义。
对单属性构成的码有两种说明方法,一种是定义为列级约束条件,另一种是定义为表级约束条件。
对多个属性构成的码只有一种说明方法,即定义为表级约束条件。
实体完整性检查包括:
1、检查主码值是否唯一,如果不唯一则拒绝插入或修改。
2、检查主码的各个属性是否为空,只要有一个为空就拒绝插入或修改。
关系模型的参照完整性在CREATETABLE中用FOREIGNKEY短语定义哪些列为外码,用REFERENCES短语指明这些外码参照哪些表的主码。
一个参照完整性将两个表中的相应元组联系起来了。
因此,对被参照表和参照表进行增删改操作时可能破坏参照完整性,必须进行检查。
被参照表参照表违约处理
可能破坏参照完整性插入元组拒绝
可能破坏参照完整性修改外码值拒绝
删除元组可能破坏参照完整性拒绝/级连删除/设置为空值
修改主码值可能破坏参照完整性拒绝/级连删除/设置为空值
拒绝:
不允许该操作执行
级连操作:
当删除或修改被参照表(SC)的一个元组造成了与参照表的不一致,则删除或修改参照表中的所有造成不一致的元组
设置为空值:
当删除或修改被参照表的一个元组时造成了不一致,则将参照表中的所有造成不一致的元组的对应属性设置为空值。
在CREATETABLE中定义属性的同时可以根据应用要求,定义属性上的约束条件,即属性值限制,包括:
1、列值非空(NOTNULL短语)2、列值唯一(UNIQUE短语)3、检查列值是否满足一个布尔表达式(CHECK短语)
数据依赖是一个关系内部属性与属性之间的一种约束关系。
这种约束关系是通过属性间值的相等与否体现出来的数据间相关联系。
它是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。
数据依赖中最重要的是函数依赖和多值依赖。
设R(U)是属性集U上的关系模式。
X,Y是U得子集。
若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖于X,记作X→Y。
关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。
满足最低要求的叫第一范式,简称1NF。
在第一范式中满足进一步要求的为第二范式,其余以此类推。
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化。
给一个关系模式,写出函数依赖,候选码,判断第几范式,然后将一种范式分解为另一种范式。
模式分解算法
数据字典,数据流图表达了数据和处理的关系,数据字典则是系统中给类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分。
其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
数据项:
数据项是不可再分的数据单位。
数据结构反映了数据之间的组合关系。
数据流是数据结构在系统内传输的路径。
数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。
处理过程的具体处理逻辑一般用判定表或判定树来描述。
概念结构是对现实世界的一种抽象。
所谓抽象是对实际的人物事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。
一般有三种抽象:
1、分类:
定义某一类概念作为现实世界中一组对象的类型。
2、聚集:
定义某一类型的组成成分。
3、概括:
定义类型之间的一种子集联系。
从数据字典出发定义E-R图,之后进行必要的调整,在调整中遵循的一条原则是:
为了简化E-R图的处置,现实世界的事物能作为属性对待的,尽量作为属性对待。
符合什么条件的事物可以作为属性对待,两条准则:
1、作为属性,不能再具有需要描述的性质。
属性必须是不可分的数据项,不能包含其他属性。
2、属性不能与其他实体具有联系,即E-R图中所表示的联系是实体之间的联系。
视图的集成。
视图集成可以有两种方式:
1、多个分E-R图一次集成。
2、逐步集成,用累加的方式一次集成两个分E-R图。
无论哪种方式都需要分两步走。
1、合并,解决各分E-R图之间的冲突,将各分E-R图合并起来生成初步E-R图。
2、修改和重构,消除不必要的冗余,生成基本E-R图。
合并分E-R图,生成初步E-R图。
合理消除各分E-R图的冲突是合并分E-R图的主要工作与关键所在。
各分E-R图之间的冲突主要有三类:
属性冲突、命名冲突和结构冲突。
所谓冗余的数据是指可由基本数据导出的数据,冗余的联系是指可由其他联系导出的联系。
消除冗余主要采用分析方法,即以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余
E-R图向关系模型的转换。
转换规则。
查询处理步骤,RDBMS查询处理可以分为四个阶段:
查询分析、查询检查、查询优化和查询执行。
所谓事务是用户定义的一个数据库操作序列。
这些操作要么全做要么全不做,是一个不可分割的工作单位。
事务具有四个特性:
原子性,一致性,隔离性和持续性。
这四个特性简称为ACID特性。
事务故障的恢复。
事务故障是指事务在运行至正常终点前被终止,这时恢复子系统应利用日志文件撤销此事务已对数据库进行的修改。
事务故障的恢复是由系统自动完成的,对用户是透明的。
系统的恢复步骤是:
1、反向扫描日志文件,查找该事务的更新操作。
2、对该事务的更新操作实行逆操作。
3、继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。
4、如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。
系统故障的恢复。
系统故障造成数据库不一致状态的原因有两个:
一是未完成事务对数据库的更新可能已写入数据库,二是已提交事务对数据库的更新可能还留在缓冲区没来得及写入数据库。
因此恢复操作就是要撤销故障发生时未完成的事务,重做已完成的事务。
系统故障的恢复是由系统在重新启动时自动完成的,不需要用户干预。
其步骤是:
1、正向扫描日志文件,找出在故障发生前已经提交的事务,将其事务标识记入重做队列。
2、对撤销队列中的各个事务进行撤销处理。
3、对重做队列中的各个事务进行重做处理。
介质故障是最严重的一种故障,恢复方法是重装数据库,然后重做已完成的事务。
事务是并发控制的基本单位,保证事务ACID特性是事务处理的重要任务,而事务ACID特性可能遭到破坏的原因之一是多个事务对数据库的并发操作造成的。
仔细分析并发操作带来的数据不一致性包括丢失修改、不可重复读和读脏数据等。
产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性。
并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。
并发控制的主要技术有封锁、时间戳和乐观控制法。
避免活锁的简单方法是采用先来先服务的策略
预防死锁通常两种方法:
1、一次封锁法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 系统 概论 复习 重点