数据库原理复习.docx
- 文档编号:5517516
- 上传时间:2022-12-18
- 格式:DOCX
- 页数:15
- 大小:98.35KB
数据库原理复习.docx
《数据库原理复习.docx》由会员分享,可在线阅读,更多相关《数据库原理复习.docx(15页珍藏版)》请在冰豆网上搜索。
数据库原理复习
简述下列问题
1、软件生存期有哪几个阶段?
答:
软件生存期分为:
软件定义时期,软件开发时期,软件维护时期。
2、数据库系统的生存期分成哪几个阶段?
数据库结构的设计在生存期中的地位如何?
答:
数据库系统的生存期分为:
规划,需求分析,慨念设计,
逻辑设计,物理设计,实现,运行和维护;数据库结构设计在生存期中的地位很重要,包括逻辑设计,物理设计,逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB在物理设备上的存储结构与存取方法。
3、数据库设计过程的输入和输出有哪些内容?
答:
数据库设计过成的输入包括四部分:
总体信息需求,处理需求,DBMS的特征,硬件和操作系统的特征;数据库设计过程的输出包括两部分:
完整的数据库结构,物理结构和逻辑结构;基于数据库结构和处理需求的应用程序设计原则。
4、什么是比较好的数据库设计方法学?
数据库设计方法学应包括哪些内容?
答:
一个好的数据库设计方法应该能在合理的期限内以合理的工作量产生一个有实用价值的数据库结构;一种实用的数据库设计方法应包括以下内容:
设计过程,设计技术,评价准则,信息需求,描述机制。
5、数据库设计的规划阶段应做哪些事情?
答:
数据库设计的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统的地位,以及各个数据库之间的联系。
6、数据库设计的需求阶段是如何实现的?
目标是什么?
答:
数据库设计的需求分析分三步:
需求信息的收集,分析整理和评审。
其目的在于对系统的应用情况做全面详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据设计都能接受的文档。
7、评审在数据库设计中有什么重要作用?
为什么允许设计过程中有多次的回溯和反复?
答:
评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。
如在数据库设计已经实现时再发现设计的错误,那么代价比较大,因此应该允许设计过程的回溯与反复。
8、数据字典的内容和作用是什么?
答:
数据库字典的内容有:
数据项,数据结构,数据流,数据存储和加工过程。
作用在于对系统中的数据做详细的描述,提供对数据库数据的集中管理。
9、对概念模型有些什么要求?
概念模型设计的具体步骤是什么?
答:
对概念模型一般有以下要求:
它是对现实世界的抽象和概括,它应真实,充分的反应现实世界中事物之间的联系,具有丰富的语义表达能力,能表达用户的各种需求,包括对现实世界中各种对象及其复杂联系,用户对数据对象的处理要求和手段;它应简洁,明晰,独立于机器,容易理解,方便数据库设计人员与应用人员交换意见,使用户能积极参与数据库的设计工作;它应易于变动,当应用环境和应用要求改变时,容易对概念模型修改和补充;它更应该容易向关系,层次或网状模型转换,易于从概念模式导出DBMS有关的逻辑模式。
10、什么是数据抽象?
主要有哪两种形式的抽象?
数据抽象在数据库设计过程中起什么作用?
答:
数据抽象是对人物事或概念的认为处理,他抽取人们关心的共同特征,忽略非本质的细节,并把这些特征用各种概念精确地加以描述,这些概念组成了某种模型。
数据抽象有两种形式:
系统状态的抽象,及抽象对象;系统转换的抽象,及抽象运算。
数据抽象是概念设计中非常重要的一步,通过数据抽象可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。
11、什么是ER图?
构成ER图的要素是什么?
并简述采用ER方法的数据库概念结构设计的过程。
答:
ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性、和联系方法。
构成ER图的基本要素是实体属性和联系。
利用ER方法进行数据库的概念设计,分为三步:
设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式,最后对全局ER模式进行优化,得到最终的ER模式,及概念模式。
12、逻辑设计的目的是什么?
简述逻辑设计过程的输入和输出环境。
答:
逻辑涉及的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据模式和外模式)。
逻辑设计过程中的输入信息有:
独立于DBMS的概念模式,及概念设计阶段产生的所有局部和全局概念模式;处理需求,及需求分析阶段产生的业务活动分析结果;约束条件,及完整性,一致性,安全性要求及响应时间要求;DBMS特性,及特定的DNMS所支持的模式,子模式和程序语法的形式规则。
逻辑过程输出的信息有:
DBMS可处理模式,子模式,应用程序设计指南,物理设计指南。
13、简述逻辑设计阶段的主要步骤和内容。
答:
逻辑设计阶段主要是把概念模式转换成DBMS能处理的模式。
转换过程中主要对模式进行评价和性能测试,以便获得较好的模式设计。
14、规范化理论对数据库设计有什么指导意义?
答:
在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准,在逻辑设计阶段,仍要使用关系规范化的理论来设计模式和评价模式,规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。
15、简述数据库物理设计的内容和具体步骤。
答:
数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。
物理设计步骤为:
设计存储记录结构;确定数据存储安排;设计访问方法;进行完整性和安全性的分析、设计;程序设计。
16、数据库实现阶段主要做哪几件事情?
答:
数据库实现阶段主要工作有:
建立实际数据库结构;试运行;装入数据。
17、什么是数据库的再组织设计?
简述其重要性。
答:
对数据的概念模式、逻辑结构、物理结构的改变称作数据再组织。
数据在组织通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变,增加新的数据类型,对原有的数据提出了新的使用要求,改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。
18、简述数据管理的发展过程,每个过程都有哪些特点?
答:
1、人工管理阶段:
数据不保存;数据不共享;数据由应用程序自己管理,没有相应的系统软件负责数据管理工作;数据不具有独立性。
2.文件系统阶段:
数据可以长期保存;数据共享性差;有专门的软件即文件系统惊醒数据管理,程序和数据之间由软件提供存取方法进行转换;数据独立性低。
3.数据库系统阶段:
数据结构化;数据的共享性好,冗余度低;数据独立性高,;数据由DBMS统一管理和控制。
19、简述概念模型的概念、特点、建立方法及概念模型在数据库设计中的地位。
答:
概念:
概念模型也称信息模型。
它是对信息世界的管理对象、属性及联系等信息的描述形式。
特点:
概念模型不依赖计算机及DBMS,它是现实世界的真实而全面地反映。
建立方法:
概念模型通过系统需求分析得到,对概念模型数据化处理后就得到了数据库的数据模型。
地位:
主要在系统开发的数据库设计阶段使用,是按照用户的观点来对数据和信息进行建模,利用实体关系图来实现。
它描述系统中的各个实体以及相关实体之间的关系,是系统特性和静态描述。
20、简述概念模型向关系模型转换的方法。
答:
1.每一个实体必须转换为一个关系;
2.多对多的联系必须转换为关系,去对应两个实体的关键字加上联系的属性,构成一个新的关系;
3.三元联系(三个实体间具有联系)也必须用关系来表达;
4.一对一的联系和一对多的联系可以单独用关键字来表达,也可以将一方的关键字加入到多方实体中;
5.关键字相同的可以合并为一个关系。
21、简述DBMS的概念、组成及功能。
答:
DBMS就是数据库管理系统,是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库它是位于用户与操作系统之间的一层数据管理软件。
用户通过DBMS访问数据库中的数据,数据库管理员也通过DBMS进行数据库的维护工作。
它可使多个应用程序和用户用不同的方法在同时或不同时刻去建立,修改和询问数据库。
其功能有:
数据定义,数据操纵,数据库运行管理,数据组织、存储和管理,数据库的建立和维护,数据通信接口。
数据库管理系统由数据定义语言及其翻译处理程序,数据操纵语言及其编译程序,数据库运行控制,实用程序组成。
22、数据独立性和数据联系有什么区别?
答:
数据独立性是指应用程序与数据之间相互独立,不受影响。
数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。
23、简述DBS的概念。
答:
DBS是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理、应用系统、数据库管理员和用户构成。
24、为某百货公司设计一个ER模型:
百货公司管辖若干个连锁商店,每家商店经营若干商品,一类商品可以在多家商店销售。
每家商店有若干职工,但每个职工只能服务于一家商店。
实体类型商店的属性有:
商店编号,店名,店址,店经理。
实体类型商品的属性有:
商品编号,商品名,单价,产地。
实体类型职工的属性有:
职工编号,职工名,性别,工资。
在联系中应反应出职工参加某商店工作的开始时间,商店销售商品的月销售量。
请画出反映商店、商品、职工实体类型及其联系类型的ER图,并将其转换为关系模式集。
答:
实体及其属性图a:
商店
商品
职工
实体及其联系图b:
n
1
n
1
1
n
商店
商品
职工
商品编号
商品名
店址
店经理
商品编号
商品名
单价
产地
职工编号
职工名
性别
工资
25、关系中的元组没有先后顺序?
为什么属性也没有先后顺序?
答:
是。
因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。
因此不考虑元组的顺序,即没有先后顺序。
实体有很多特性,每一个特性称为属性,每个属性有一个值域。
每个值域之间并互相互控制的关系。
所以没有先后顺序之分。
26、关系与普通的表格、文件有什么区别?
答:
关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:
(1)关系中每一个属性值都是不可分解的。
(2)关系中不允许出现相同的元组(没有重复元组)。
(3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。
(4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。
27、请解释关系的完整性规则。
答:
分为实体完整性和参照完整性。
实体完整性:
要求关系中元组在组成主键的属性上不能有空值。
如果出现空值,那么主键值就起不了唯一标识元组的作用。
参照完整性:
如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中,K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。
这条规则在使用时有三点应注意:
1)外键和相应的主键可以不同名,只要定义在相同值域上即可;
2)R1和R2也可以是同一个关系模式,表示了属性之间的联系;
3)外键值是否允许空应视具体问题而定。
28、外键值何以允许取空?
何时不允许空?
答:
允许为空:
业务和主表没有关系
不允许为空:
值必须在主表中存在。
29、关系代数表达式的查询有哪些优化策略?
答:
1.选择运算应尽可能先做。
在优化策略中这是最重要最基本的一条;
2.把投影运算和选择运算同时进行;
3.把投影同其前或其后的双目运算结合起来;
4.把某些选择同他前面要执行的笛卡尔结合起来成为一个连接运算;
5.找出公共字表达式。
30、有如下关系R和S:
R-
A
B
C
A1
B1
C2
A2
B3
C7
A3
B4
C6
A1
B2
C3
A4
B6
C6
A2
B2
C3
A1
B2
C1
计算R/S的结果。
答:
R的属性集(A,B,C),S的属性集(B,C)。
A1的象集为:
(B1,C2),(B2,C3),(B2,C1);
A2的象集为:
(B3,C7),(B2,C3);
A3的象集为:
(B4,C6);
A4的象集为:
(B6,C6)。
S在(B,C)上的投影为:
(B1,C2),(B2,C1)。
以上可以看出只有A1的象集完全包含S在(B,C)上的投影,因此R/S的结果为A1。
31、设关系模式R(ABCD),F是R上成立的FD集,F={AB→C,AB→D,B→C}。
1、试说明R不是2NF(二范式)的理由。
2、试分析模式R的数据冗余问题。
3、将R分解为2NF模式集。
答:
1、AB的闭包:
(AB,C,D)
B的闭包:
(B,C)
C的闭包:
(C)
D的闭包:
(D)
则AB是R的候选码,但有B的闭包是(B,C),也就是说存在非主属性对候选码的部分依赖,所以R没有达到二范式。
2、由1可知R只达到了一范式,C或D出现都会导致AB出现是R的数据冗余。
3、将R分解为:
R1(ABD),R2(BC)两个关系模式则R达到2NF。
32、设关系模式R(ABC),F是R上成立的FD集,F={A→B,B→C}。
1.试说明R不是3NF(三范式)的理由。
2.试分析模式R的数据冗余问题。
3.将R分解为3NF模式集。
答:
1、由F可知,C对A是传递依赖的,所以R没有达到3NF。
2、因为A的闭包为(A,B,C),B的闭包为(B,C),C的闭包为(C)所以R的候选码为A,当C出现时A与B均会出现,出现了数据的多次重复出现,使得数据冗余。
3、将R分解为:
R1(AB),R2(BC)则R达到三范式。
33、设有关系模式R(ABCDE),F是R上成立的FD集,F={ABC→DE,BC→D,D→E},问R达到了几范式?
并说明理由。
答:
由F可知,R的候选码是ABC,但存在D对ABC的部分依赖,且E对BC传递依赖,所以R只达到了一范式。
34、设有关系模式R(职工编号,日期,日营业额,部门名,部门经理),该模式统计商店里每个职工的日营业额,以及职工所在的部门和经理信息。
如果规定:
每个职工每天只有一个营业额,每个职工只在一个部门工作,每个部门只有一个经理。
回答下列问题:
1、按上述规定,写出R的基本FD和侯选码。
2、说明R不是2NF的理由,并把R分解为2NF模式集。
3、进而分解为3NF模式集。
答:
1、R的基本FD((职工编号,日期)→日营业额,职工编号→部门名,部门名→部门经理)
由上可知:
(职工编号,日期)的闭包为:
((职工编号,日期),日营业额,部门名,部门经理);(职工编号)的闭包为:
(职工编号,部门名);(日营业额)的闭包为:
(日营业额);(部门名)的闭包为:
(部门名,部门经理);(部门经理)的闭包为:
(部门经理);因此R的候选码为:
(职工编号,日期)。
2、因为R的FD中存在部门名对职工编号的函数依赖,此依赖为非主属性对候选码的部分依赖,所以R没有达到2NF;且部门经理对职工编号是传递依赖,但是也是对非主属性的部分依赖。
将R分解为:
R1(职工编号,日期,日营业额),R2(职工编号,部门名,部门经理),则R达到了二范式。
3、在2中的R2中部门经理对职工编号是传递依赖,因此2中分解的R并没有达到3NF,将R2分解为:
R21(职工编号,部门名);R22(部门名,部门经理)时,R达到了三范式。
35、某汽车运输公司数据库中有一个记录司机运输里程的关系模式:
R(司机编号,汽车牌照,行驶公里,车队编号,车队主管)
此处每个汽车牌照对应一辆汽车,“行驶公里”为某司机驾驶某辆汽车行驶的总公里数,如果规定每个司机属于一个车队,每个车队只有一个主管。
1、试写出关系模式R的基本FD和侯选码。
2、说明R不是2NF的理由,并指出数据冗余之所在。
试把R分解为2NF模式集。
3、进而把R分解为3NF,并说明理由。
答:
1、关系模式R的基本FD((司机编号,汽车牌照)→行驶公里,司机编号→车队编号,车队编号→车队主管);R的候选码为:
(司机编号,汽车牌照)。
2、在R的基本FD中存在车队编号对司机编号的函数依赖,车队主管对司机编号的传递依赖,此依赖为对候选码的部分依赖,所以R不是2NF。
数据冗余在于当司机编号出现一次时,车队编号与车队主管必出现。
将R分解为:
R1(司机编号,汽车牌照,行驶公里),R2(司机编号,车队编号,车队主管)时R达到2NF。
3、上述2中的R并没有达到3NF,因为在R2中还存在车队主管对司机编号的传递依赖,将R2分解为R21(司机编号,车队编号),R22(车队编号,车队主管)时R达到3NF。
36、设某商业集团数据库中有一关系模式R如下:
R(商店编号,商品编号,数量,部门编号,负责人)
如果规定:
每个商店的每种商品只在一个部门销售;每个商店的每个部门只有一个负责人;每个商店的每种商品只有一个库存数量。
回答下列问题:
1、写出关系模式R的基本FD和侯选码。
2、关系模式R最高达到第几范式?
为什么?
3、如果R不属于3NF,请将R分解为3NF模式集。
答:
1、R的基本FD((商店编号,商品编号)→部门编号,部门编号→负责人,(商店编号,商品编号)→数量);R的候选码是(商店编号,商品编号)。
2、R最高达到了第二范式,因为R的FD中没有非主属性对候选码的部分依赖,R达到了二范式,但有负责人对(商店编号,商品编号)的传递依赖,所以R没有达到三范式。
3、将R分解为R1(商店编号,商品编号,部门编号,数量),R2(部门编号,负责人)时R达到了3NF。
37、某企业集团有若干工厂,每个工厂生产多种产品,且每一种产品可以在多个工厂生产,每个工厂按照固定的计划数量生产产品;每个工厂聘用多名职工,且每名职工只能在一个工厂工作,工厂聘用职工有聘期和工资。
工厂的属性有工厂编号,厂名,地址,产品的属性有产品编号,产品名,规格,职工的属性有职工号和姓名。
1、根据上述语义画出ER图,在ER图中需注明实体的属性、联系的类型及实体的标识符。
2、将ER模型转换为关系模型,并指出每个关系模式的主键和外键。
3、分析每个关系模式已经达到第几范式。
答:
1、ER图如下
1
n
n
1
1
1
1
n
2、工厂的关系模型为:
产品的关系模式为:
职工的关系模式为:
38、设有关系模式R(ABCDE),F是R上成立的FD集,F={ABC→DE,BC→D,D→E},问R达到了几范式?
并说明理由。
答:
在FD中有BC→D,D→E,E对BC属于传递依赖,R没有达到3NF,由FD可知,R的候选码为ABC,但有BC→D属于非主属性对候选码的部分依赖,R没有达到2NF,所以R只达到了1NF。
39、解释2NF、3NF的概念,并举例说明一个关系模式如果未达到3NF,可能会存在哪些问题。
答:
若关系模式属于1NF(第一范式),并且每一个非主属性都完全依赖于R的码,则R属于2NF(第二范式)。
如果关系模式R中不存在候选码X、属性组Y以及非主属性Z(Z∉Y),使得X→Y,Y→Z和Y!
→X成立,则R∈3NF(第三范式)。
若一个关系模式未达到3NF可能会不能做插入、删除、修改操作,还可能某一信息重复出现。
40、解释函数依赖的概念。
答:
定义:
设有一关系模式R(A1,A2,…,An),X和Y均为(A1,A2,…,An)的子集,对于R的值r来说,当其中任意两个元组u,v中对应于X的那些属性分量的值均相等时,则有u,v中对应于Y的那些属性分量的值也相等,称X函数决定Y,或Y依赖于X,记为X->Y。
42、DB的并发操作可能对关系产生哪些不一致?
答:
DB的并发操作可能带来的不一致有三类:
丢失修改,不可重复读和读“脏”数据。
43、请回答三级封锁协议包括的内容。
答:
•一级封锁协议:
Ø任一事务在修改某数据之前,必须先对其加上自己的X锁,直至事务结束后才能释放之。
事务结束包括正常结束(Commit)和非正常结束(Rollback)。
在一级封锁协议中,如果仅仅是读数据而不对其进行修改,是不需要加锁的。
Ø所以一级封锁协议解决了丢失修改问题,但不能保证可重复讯和不读“脏”数据。
•二级封锁协议,内容包括:
Ø一级封锁协议;Ø任一事务在读取某数据前,必须先对其加上S锁,读完后即可释放S锁;Ø二级封锁协议既可防止数据丢失修改,又可防止读“脏”数据,但不能保证可重复读。
•三级封锁协议,内容包括:
Ø一级封锁协议;Ø任一事务在读取某数据前,必须先对其加上S锁,直至事务结束才释放此S锁;YYNSYNNXNoneSXT1T2N:
不相容的请求,Y:
相容的请求封锁相容矩阵NoneYY4Ø三级封锁协议既可防止数据丢失修改和读“脏”数据问题的发生,又能保证数据的可重复读。
45、请回答概念模型向关系模型转换的规则。
答:
(1)实体类型的转换将每个实体类型转换成一个关系模式,实体的属性即为关系的属性,实体标识符即为关系的键;
(2)联系类型的转换
1)实体间的联系是1:
1可以在两个实体类型转换成两个关系模式中的任意一个关系模式的属性中加入另一个关系模式的键和联系类型的属性;
2)如实体间的联系是1:
N则在N端实体类型转换成的关系模式中加入1端实体类型转换成的关系模式的键和联系类型的属性;
3)如实体间的联系是M:
N则将联系类型也转换成关系模式,其属性为两端实体类型的键加上联系类型的属性,而键为两端实体键的组合。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 原理 复习