数据库原理自考复习资料.docx
- 文档编号:9860843
- 上传时间:2023-02-07
- 格式:DOCX
- 页数:20
- 大小:38.16KB
数据库原理自考复习资料.docx
《数据库原理自考复习资料.docx》由会员分享,可在线阅读,更多相关《数据库原理自考复习资料.docx(20页珍藏版)》请在冰豆网上搜索。
数据库原理自考复习资料
第一章数据库概论
1.人工管理阶段数据管理的特点:
(1)数据不保存在机器中
(2)无专用的软件对数据进行管理(3)只有程序的概念,没有文件的概念(4)数据面向程序
2.文件系统阶段数据管理的特点:
(1)数据可长期保存在外存的磁盘上
(2)数据的逻辑结构和物理结构有了区别(3)文件组织已呈多样化。
有索引、链接和散列文件(4) 数据不再属于某个特定的程序,可重复使用。
3.文件系统显露出三个缺陷:
(1) 数据冗余性
(2)数据不一致性 (3)数据联系弱
4.数据库阶段的管理方式具有以下特点:
(1)采用复杂的数据模型表示数据结构(2) 有较高的数据独立性(3)数据库系统为用户提供方便的用户接口(4) 系统提供四方面的数据控制功能 (5)对数据的操作既可以以记录为单位,又可以以数据项为单位
5.数据描述三个领域之间的关系:
从事物的特性到计算机中的数据表示,经历了三个领域:
现实世界、信息世界、机器世界。
(1)现实世界:
存在于人们头脑之外的客观世界,称为现实世界。
(2)信息世界:
是现实世界在人们头脑中的反映。
(3)机器世界:
信息世界的信息在机器世界中以数据形式存储。
信息世界中数据描述的术语有:
实体、实体集、属性、实体标识符机器世界中数据描述的术语有:
字段、记录、文件、关键码它们的对应关系是:
在数据库中每个概念都有类型和值之区分,类型是概念的内涵,值是概念的外延
6.数据描述的两种形式:
数据描述有物理描述和逻辑描述两种形式。
物理数据描述指数据在存储设备上的存储方式,物理数据是实际存放在存储设备上的数据。
逻辑数据描述指程序员或用户用以操作的数据形式,是抽象的概念化数据。
数据管理软件的功能之一,就是要把逻辑数据转换成物理数据,以及把物理数据转换成逻辑数据。
7.物理存储介质层次:
8.数据模型的种类:
目前广泛使用的数据模型可分为两种类型:
概念数据模型、结构数据模型概念数据模型:
是独立于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构;它是现实世界的第一层抽象,是用户和数据库设计人员之间进行交流的工具;这一类中著名的模型是“实体联系模型”,简称“ER”模型。
结构数据模型:
是直接面向数据库的逻辑结构;它是现实世界的第二层抽象,涉及到计算机系统和数据库管理系统; 这一类中的例子有层次、网状、关系、面向对象等模型。
9.结构数据模型的三个组成部分:
数据结构、数据操作、数据完整性约束是结构数据模型的三个组成部分。
数据结构:
是指对实体类型和实体间联系的表达和实现 数据操作:
是指对数据库的检索和更新(插、删、改)两类操作的实现数据完整性约束:
给出数据及其联系应具有的制约和依赖规则。
10.层次模型的特点:
用树型结构表示实体类型及实体间联系的数据模型称为层次模型。
层次模型的特点是:
记录之间的联系通过指针实现,查询效率较高。
缺点是:
(1)只能表示1:
N联系
(2)由于树型结构层次顺序的严格复杂,引起数据的查询和更新操作也很复杂,因此编写应用程序也很复杂。
网状模型的特点:
用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。
网状模型的特点是:
记录之间联系通过指针实现,M:
N联系也容易实现,查询效率较高。
缺点是:
编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。
12.关系模型的特点:
关系模型的主要特征是用二维表格结构表达实体集,用外键表示实体间联系。
特点是:
关系模型与层次、网状的最大差别是用关键码而不是用指针导航数据,表格简单,用户易懂,编程时不涉及存储结构、访问技术等细节。
13.数据库体系结构中的三级结构、两级映象:
数据库的体系结构分为三级:
内部级、概念级、外部级。
外部级:
最接近用户,是单个用户所能看到的数据特性。
单个用户使用的数据视图的描述称为“外模式”。
概念级:
涉及到所有用户的数据定义,是全局的数据视图。
全局数据视图的描述称为“概念模式”。
内部级:
最接于物理存储设备,涉及到实际数据存储的结构。
物理存储数据视图的描述称为“内模式”。
为实现这三个抽象级别的联系和转换,DBMS在级级结构之间提供两个层次的映象:
外模式/模式映象,模式/内模式映象。
14.二级数据独立性:
数据独立性是指:
应用程序和数据之间相互独立,不受影响。
分为物理独立性和逻辑独立性。
(1)ﻩ物理数据独立性:
如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。
也就是对内模式的修改尽量不影响概念模式。
(2)ﻩ逻辑数据独立性:
如果数据库的概念模式要进行修改,如增加记录类型或增加数据项,那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。
也就是概念模式的修改尽量不影响外模式和应用程序。
15.DBMS的主要功能:
(1)ﻩ数据库的定义功能:
DBMS提供数据定义语言(DDL)定义数据库的三级结构及其相互之间的映象、完整性、安全控制等约束。
(2)数据库的操纵功能:
DBMS提供数据操纵语言(DML)实现对数据库中数据的操作。
(3)数据库的保护功能:
DBMS对数据库的保护主要通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等四个方面实现。
(4)ﻩ数据库的存储管理:
DBMS的存储管理子系统提供了数据库中数据和应用程序的一个界面,其职责是把各种DML语句转换成低层的文件系统命令,起到数据的存储、检索和更新的作用。
(5)ﻩ数据库的维护功能:
DBMS中实现数据库维护功能的实用程序主要有数据装载程序、备份程序、文件重组织程序、性能监控程序。
(6)数据字典(DD):
数据库系统中存放三级结构定义的数据库称为数据字典,对数据库的操作都要通过访问DD才能实现。
16.DBMS的组成:
DBMS是由两大部分组成:
查询处理器和存储管理器。
(1)ﻩ查询处理器有四个主要成分:
DDL编译器、DML编译器、嵌入型DML的预编译器、查询运行核心程序。
(2)存储管理器有四个主要成分:
授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。
17.DBS的组成:
DBS是一个实际可运行的,按照数据库方法存储、维护和向应用系统提供数据支持的系统,它是数据库、硬件、软件、数据库管理员(DBA)的集合体。
(1)数据库(DB):
是与一个特定组织各项应用有关的全部数据的集合,由应用数据的集合(物理数据库)、关于各级数据结构的描述(描述数据库)两部分组成。
(2)ﻩ硬件:
包括中央处理机、内存、输入输出设备、数据通道等硬件设备。
(3)软件:
包括DBMS、OS、各种宿主语言和应用开发支持软件等程序。
(4)ﻩDBA:
DBA是控制数据整体结构的人,负责DBS的正常运行。
18.DBS的全局结构:
(1)ﻩ数据库用户。
可分为四类:
DBA、专业用户、应用程序员、终端用户(2)DBMS的查询处理器。
包括四部分:
DML编译器、嵌入型DML的预编译器、DLL编译器、查询运行核心程序。
(3)ﻩDBMS的存储管理器。
包括四部分:
授权和完整性管理器、事务管理器、文件管理器、缓冲区管理器。
(4)磁盘存储器中的数据结构。
包括四种形式:
数据文件、数据字典、索引文件、统计数据组织。
第二章数据库设计和ER模型
19.什么是软件生存期:
软件生存期是软件工程的一个重要概念。
是指从软件的规划、研制、实现、投入运行后的维护,直到它被新的软件所取代而停止使用的整个期间。
通常分为六个阶段:
(1)规划阶段
(2)需求分析阶段 (3)设计阶段 (4)ﻩ程序编制阶段(5)调试阶段 (6)运行维护阶段
20.ﻩ数据库系统的生存期:
一般分为七个阶段,即:
(1)规划阶段
(2)需求分析阶段 (3)概念设计阶段 (4)逻辑设计阶段 (5)物理设计阶段 (6)实现阶段 (7)运行维护阶段
21.规划阶段的具体工作:
1)系统调查2)可行性分析 3)确定数据库系统的总目标,并对应用单位的工作流程进行优化和制定项目开发计划。
22.需求分析阶段的主要工作:
1)分析用户活动,产生业务流程图 2)确定系统范围,产生系统关联图3)分析用户活动设计的数据,产生数据流图 4)分析系统数据,产生数据字典
23.概念设计的目标和主要步骤:
目标:
产生反映用户单位信息需求的数据库概念结构,即概念模型主要步骤有三步:
1)进行数据抽象,设计局部概念模型 2)将局部概念模型综合成全局概念模型3)评审
24.逻辑设计的目的和步骤:
目的是把概念设计阶段设计好的概念模型转换成与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构。
步骤有五步:
1)把概念模型转换成逻辑模型2)设计外模型3)设计应用程序与数据库的接口4)评价模型5)修正模型
25.物理设计阶段的主要步骤:
1)存储记录结构设计2)确定数据存放位置3)存取方法的设计4)完整性和安全性考虑 5)程序设计
26.数据库的实现工作:
1)用DDL定义数据库结构 2)组织数据入库3)编制与调试应用程序4)数据库运行
27.数据库运行与维护的工作:
1)数据库的转储与恢复 2)数据库安全性、完整性控制3)数据库性能的监督、分析和改进 4)数据库的重组织和重构造
28.ﻩ数据库设计过程的输入有哪些内容:
(1)ﻩ总体信息需求
(2)处理需求 (3)DBMS的特征 (4)ﻩ硬件和OS特征
29.数据库设计过程的输出有哪两部分:
一部分是完整的数据库结构,其中包括逻辑结构与物理结构。
另一部分是基于数据库结构和处理要求的应用程序的设计原则。
30.常见的数据库设计方法有哪几种:
(1)ﻩ视图模式化及视图汇总设计方法
(2)关系模式的设计方法 (3)ﻩ新奥尔良设计方法 (4)基于E-R模型的数据库设计方法(5)基于3NF的设计方法 (6)ﻩ基于抽象语法规范的设计方法(7)ﻩ计算机辅助数据库设计方法
31.ﻩ实用的数据库设计方法至少应包括哪些内容:
(1)设计过程 (2)设计技术(3)评价准则(4)信息需求 (5)描述机制
32.ﻩ一种设计方法学需要有三种基本类型的描述机制:
(1)实现设计过程的最终结果将用DBMS的DDL表示。
(2)信息输入的描述。
(3)在信息输入和DDL描述之间的其它中间步骤的结果的描述。
33.数据库设计中的规划阶段的主要任务:
是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。
34.ﻩ数据字典由哪几部分组成:
(1)数据项
(2)数据结构(3)数据流 (4)ﻩ数据存储 (5)加工过程
35.数据抽象:
抽象是对实际的人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。
抽象有两种形式,系统状态抽象(抽象对象)和系统转换抽象(抽象运算)。
36.ﻩ对象的两种形式:
(1)ﻩ聚集:
的数学意义就是笛卡尔积的概念。
通过聚集,形成对象之间的一个联系对象。
(2)概括:
是从一类其它对象形成一个对象。
对于一类对象{O1,O2,……,On}可以概括成对象O,那么Oi称为O的其中一个。
37.ﻩ依赖联系:
在现实世界中,常常有某些实体对于另一些实体具有很强的依赖关系,即一个实体的存在必须以另一个实体的存在为前提。
我们通常把前者称为弱实体。
在ER图中,用双线框表示弱实体,用指向弱实体的箭头表明依赖联系。
38.ﻩ子类、超类:
某个实体类型中所有实体同时也是另一实体类型中的实体。
此时,我们称前一实体类型是后一实体类型的子类,后一实体类型称为超类。
在ER图中,带有子类的实体类型(超类)以两端双线的矩形框表示,并用加圈的弧线与其子类相连,子类本身仍用普通矩形框表示。
子类具有一个很重要的性质:
继承性。
它可继承超类上定义的全部属性,其本身还可包含其它另外的属性。
39.ﻩER模型的操作:
(1)实体类型的分裂:
垂直分割、水平分割 (2)ﻩ实体类型合并:
分裂的逆过程。
(3)联系类型的分裂 (4)ﻩ联系类型的合并40.采用ER方法的数据库概念设计分成哪三步:
(1)ﻩ设计局部ER模式:
1)确定局部结构范围;2)实体定义;3)联系定义 ;4)属性分配
(2)设计全局ER模式:
1)确定公共实体类型 ;2)局部ER模式的合并 ;3)消除冲突。
(3)全局ER模式的优化:
1)实体类型的合并;2)冗余属性的消除 ;3)冗余联系的消除 41.冲突分为哪三种:
属性冲突,包括属性域的冲突、属性取值单位冲突。
结构冲突,包括:
1)同一对象在不同应用中的不同抽象。
(2)同一实体在不同局部ER图中属性组成不同。
(3)实体之间的联系在不同的局部ER图中呈现不同的类型。
命名冲突,包括属性名,实体名,联系名之间的冲突:
同名异义、异名同义
42.ER模型向关系模型的转换:
ER模型中的主要成分是实体类型和联系类型。
对实体类型,将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符即为关系模式的键。
对联系类型,就视1:
1、1:
N、M:
N三种不同的情况做不同处理。
(1)ﻩ对1:
1可在两个实体类型转换成的两个关系模式中任意一个关系模式的属性中加入另一个关系模式的键和联系类型的属性。
(2)ﻩ对1:
N,则在N端实体类型转换成的关系模式中加入1端实体类型转换成的关系模式的键和联系类型的属性。
(3)对M:
N,则将联系类型也转换成关系模式,其属性为两端实体类型的键盘加上联系类型的属性,而键为两端实体键的组合。
43.在数据库系统生存期中,生存期的总开销可分为几项:
规划开销、设计开销、实现与测试开销、操作开销、维护开销。
44.用户使用和计算机资源的操作开销是:
(1)查询响应时间
(2)ﻩ更新事务的开销(3)ﻩ报告生成的开销(4)ﻩ改组频率和开销(5)ﻩ主存储空间(6)辅助存储空间
45.数据库的重新组织设计:
对数据库的概念模式、逻辑结构或物理结构的改变称为重新组织,其中改变概念模式或逻辑结构又称为重新构造,改变物理结构则称为重新格式化。
第三章关系模式设计理论
46.ﻩ什么是关系数据库:
关系数据库是以关系模型为基础的数据库,它利用关系来描述现实世界。
一个关系既可以用来描述一个实体及其属性,也可以用来描述实体间的联系。
关系实质上是一张二维表。
47.ﻩ一个关系模型有哪两个方面内容:
一个关系模型包括外延和内涵两个方面的内容。
外延就是通常所说的关系,或实例,或当前值。
它与时间有关,随着时间的推移在不断变化。
(由于元组的插入、删除、修改引起的) 内涵是与时间独立的,包括关系、属性、及域的一些定义和说明,还有各种数据完整性约束。
48.ﻩ数据完整性约束分为哪两类:
数据完整性约束分为静态约束和动态约束。
静态约束:
包括各种数据之间的联系(数据依赖),主键的设计和关系值的各种限制等等。
这一类约束是如何定义关系的有效数据问题。
动态约束:
主要定义如插入、删除、和修改等各种操作的影响。
49.关系数据库设计理论主要包括哪些内容:
关系数据库设计理论主要包括三个方面的内容:
数据依赖、范式、模式设计方法。
其中数据依赖起着核心的作用。
50.ﻩ数据库使用过程中存在的问题是什么:
数据冗余、更新异常、插入异常、删除异常。
51.函数依赖(FD)的定义:
设有关系模式R(A1,A2,……,An)(即R(U)),X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y],则称X函数决定Y,或Y函数依赖于X,记为X→Y,X→Y为模式R的一个函数依赖。
或者说,对于X的每一个具体值,都有Y惟一的具体值与之对应,即Y值由X值决定,因而这种数据依赖称为函数依赖。
52.候选键、主属性、非主属性:
设有关系模式R(A1,A2,……,An),F是R的一个函数依赖集,X是{A1,A2,……,An}的一个子集。
如果 ①ﻩX→A1A2……An∈F+,且②ﻩ不存在X真子集Y,使得Y→A1A2……An成立,则称X是R的候选键。
包含在任何一个候选键中的属性称为主属性,不包含在任何一个候选键中的属性称为非主属性。
53.ﻩ函数依赖的推理规则:
设有关系模式R(A1,A2,……,An)和属性集U= ;A1,A2,……,An,X,Y,Z,W是U的一个子集,F是R的一个函数依赖集,推理规则如下:
54.ﻩ什么是平凡的FD?
平凡的FD可根据哪一条推理规则推出?
55.ﻩ关系模式的分解有几个不同的衡量标准:
分解具有无损联接;分解要保持函数依赖;分解既要保持依赖,又要具有无损联接。
56.ﻩ什么是无损分解:
57.试叙保持函数依赖的定义:
58.ﻩ第一范式(1NF):
如果关系模式R的所有属性的值域中每一个值都是不可再分解的值,则称R是属于第一范式模式。
59.ﻩ第二范式(2NF):
如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的候选键,则称R是第二范式模式。
60.ﻩ第三范式(3NF):
如果关系模式R是第一范式,且每个非主属性都不传递依赖于R的候选键,则称R是第三范式的模式。
61.BCNF:
如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。
从BCNF的定义可明显地得出如下结论:
(1)所有非主属性对键是完全函数依赖。
(2)所有主属性对不包含它的键是完全函数依赖。
(3)ﻩ没有属性完全函数依赖于非键的任何属性组。
如果模式R是BCNF,则它必定是第三范式,反之,则不一定。
62.ﻩ模式设计方法的原则:
关系模式R相对于函数依赖集F分解成数据库模式ρ={R1,R2,……Rk},一般应具有下面三个特性:
(1)ﻩρ中每个关系模式Ri是3NF或BCNF
(2)ﻩ保持无损联结 (3)保持函数依赖集 (4)ﻩρ中模式个数最少和属性总数最少。
63.ﻩ一个好的模式设计方法应符合哪三条原则:
表达性,分离性,最小冗余性。
表达性涉及到两个数据库模式的等价性问题,即数据等价和依赖等价,分别用无损联接和保持函数依赖性来衡量。
分离性是指属性间的“独立联系”应该用不同的关系模式表达。
最小冗余性要求在分解后的数据库能表达原来数据库的所有信息这个前提下实现。
关系模式设计方法基本上可以分为分解与合成两大类。
64.ﻩ多值依赖MVD:
设R(U)是属性集U上的一个关系模式,X,Y是U的子集,若对R(U)的任一关系r,对于X的一个给定的值存在着Y的一组值与其对应,同时Y的这组值又不以任何方式与U-X-Y中的属性相关,那么称Y多值依赖于X,记为X→→Y。
65.ﻩ第四范式(4NF):
设关系模式R,D是一个多值依赖集,如果D中存在一个非平凡多值依赖X→→Y,并且X必是R的超键,那么称R是4NF模式。
第四章关系代数
66.ﻩ超键、主键、候选键的定义:
超键(super ;key):
在关系中能唯一标识元组的属性集称为关系模式的超键。
候选键(candidate ;key):
不含有多余属性的超键称为候选键。
(候选键可以有多个) 主键(primary ;key):
用户选作元组标识的一个候选键称为主键。
(主键是候选键中一个)
67.关系模式、关系子模式和存储模式:
关系模型基本上遵循数据库的三级体系结构。
概念模式是关系模式的集合,外模式是关系子模式的集合,内模式是存储模式的集合。
(1)关系模式:
关系模式实际上是记录类型。
它的定义包括:
模式名,属性名,值域名以及模式的主键。
(2)关系子模式:
是用户所用到的那部分数据的描述。
除了指出用户的数据外,还应指出模式与子模式之间的对应性。
(3)ﻩ存储模式:
关系存储时的基本组织方式是文件,元组是文件中的记录。
存储一个关系可以用散列方法或索引方法实现。
如果关系中元组数目较少,也可以用堆文件方式实现。
68.ﻩ关系模型的三类完整性规则:
(1)实体完整性规则:
这条规则要求关系中元组在组成主键的属性上不能有空值。
(2)参照完整性规则:
这条规则要求“不引用不存在的实体”。
(3)用户定义的完整性规则:
它反映某一具体应用涉及的数据必须满足的语义要求。
69.ﻩ参照完整性规则的形式定义:
如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么在R2的关系中,K的取值只允许两种可能,或者为空,或者等于R1关系中某个主键值。
此规则使用时还要注意三点:
(1)外键和相应的主键可以不同名,只要定义在相同值域上即可。
(2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。
(3)ﻩ外键值是否允许空,应视具体问题而定。
上述形式定义中,关系模式R1称为“参照关系”模式,R2称为“依赖关系”模式。
70.模式分解的优缺点:
1。
模式分解的优点:
1)模式分解能消除数据冗余和操作异常现象2)在分解了的数据库中可以存储悬挂元组,存储泛关系中无法存储的信息2.模式分解的缺点 1)分解以后检索操作需要做笛卡尔积或连接操作,这将付出时间代价2)在有泛关系假设时,对数据库中关系进行自然连接时,可能产生寄生元组,即损失了信息,在无泛关系假设时,由于数据库中可能存在悬挂元组,就有可能不存在泛关系。
71.关系查询语言根据其理论基础的不同分为哪两类:
关系代数语言:
查询操作是以集合操作为基础运算的DML语言。
(非过程性弱)关系演算语言:
查询操作是以谓词演算为基础运算的DML语言。
(非过程性强)
72.ﻩ关系代数中的操作有哪些?
关系代数中的操作可分为两类:
传统的集合操作:
并、差、交、笛卡尔积扩充的集合操作:
对关系进行垂直分割(投影)、水平分割(选择),关系的结合(联接、自然联接),笛卡尔积的逆运算(除法)等。
其中五个基本操作为:
并、差、笛卡尔积、投影、选择。
四个常用组合操作为:
交、连接、自然连接、除法两种扩充的关系代数操作为:
外连接和外部并
73.ﻩ关系演算有哪两种:
关系演算可分为元组关系演算和域关系演算。
前者以元组为变量,后者以属性(域)为变量。
74.关系代数表达式的启发式优化算法:
1)尽可能早地执行选择操作2)尽可能早地执行投影操作3)避免直接做笛卡尔积
75.ﻩ什么是安全运算:
在数据库技术中,不产生无限关系和无穷验证的运算称为安全运算,相应的表达式称为安全表达式,所采取的措施称为安全约束。
在关系演算中约定,运算只对表达式中公式在涉及到的关系的值范
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 原理 自考 复习资料