数据库系统讲义Word文档格式.docx
- 文档编号:21388570
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:17
- 大小:30.11KB
数据库系统讲义Word文档格式.docx
《数据库系统讲义Word文档格式.docx》由会员分享,可在线阅读,更多相关《数据库系统讲义Word文档格式.docx(17页珍藏版)》请在冰豆网上搜索。
机器世界中的四个概念:
字段、记录、文件、键(关键码)。
2、数据描述的两种形式:
物理描述和逻辑描述。
前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。
3、数据联系的描述:
1:
1联系:
如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,好么实体集E1对E2的联系称为"
一对一联系"
,记为"
1:
1"
。
N联系:
如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是"
一对多联系"
N"
M:
如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是"
多对多联系"
M:
三、数据模型
1、数据模型的概念(领会):
表示实体类型及实体类型间联系的模型称为"
数据模型"
它可分为两种类型:
概念数据模型和结构数据模型。
2、概念数据模型(领会):
它是独立于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。
(掌握ER模型)
3、结构数据模型:
它是直接面向数据库的逻辑结构,是现实世界的第二层抽象。
这类模型涉及到计算机系统和数据库管理系统,所以称为"
结构数据模型"
结构数据模型应包含:
数据结构、数据操作、数据完整性约束三部分。
层次模型(识记):
用树型结构表示实体间联系的数据模型
关系模型(领会):
是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。
四、数据库的体系结构(领会)
1、三级结构模式:
数据库的体系结构分为三级:
内部级、概念级和外部级:
外部级:
单个用户所能看到的数据特性,称外模式。
概念级:
涉及到所有用户的数据定义,是全局的数据视图,称"
概念模式"
内部级:
最接近于物理存储,涉及到实际数据存储的结构,称"
内模式"
2、两级映象:
模式/内模式映象:
用于定义概念模式和内模式之间的对应性。
一般在内模式中描述。
外模式/模式映象:
用于定义外模式和概念模式间的对应性。
一般在外模式中描述。
3.两级数据独立性:
物理数据独立性:
修改内模式时尽量不影响概念模式及外模式,则达到物理数据独立性。
逻辑数据独立性:
修改概念模式时尽量不影响外模式和应用程序。
五、数据库管理系统(DBMS领会)
1、DBMS的主要功能:
(1)数据库的定义功能
(2)数据库的操纵功能
(3)数据库的保护功能
(4)数据库的存储管理
(5)数据库的维护功能
(6)数据字典
2、DBMS的组成:
由两大部分组成:
查询处理器和存储管理器,前者包括DDL编译器、DML编译器、嵌入型DML预编译器、查询运行核心程序。
后者包括授权和完整性管理器,事务管理器、文件管理器,缓冲区管理器。
六、数据库系统(DBS领会)
DBS由四部分组成:
数据库、硬件、软件、数据库管理员。
DBS的全局结构及DBS的效益,了解一下。
第二章关系数据库
本章为次重点章,我们经常使用的数据库均采用关系模型,本章主要介绍了关系模型的关系运算理论,主要在于对关系演算运算的理解,为后面章节的SQL作准备。
一、关系模型的基本概念(识记)
1、关系模型的基本术语:
用二维表格结构表示实体集、外键表示实体间联系的数据模型称为关系模型。
基本术语有:
字段(属性)、字段值(属性值)、记录(元组)、二维表格(元组集合、关系或实例)。
在这里,括号中的表述为关系模型中的术语。
它与表格中术语可以一一对应。
还有,关系中属性个数称为元数,元组个数为基数。
键:
由一个或几个属性组成。
(注意键不一定是唯一的一个属性)。
超键:
在关系中能唯一标识元组的属性集称为关系模式的超键。
(注意,超键也是一个属性集,不一定只是一个属性)
候选键:
不含有多余属性的超键称为候选键。
主键:
用户选作元组标识的一个候选键为主键。
外键:
某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。
2、关系模式、关系子模式
关系模式:
关系模式实际上就是记录类型。
它包括:
模式名,属性名,值域名以及模式的主键。
关系模式仅是对数据特性的描述。
(这通常在数据库中表现为一个数据表的结构)
关系子模式:
就是用户所用到那部分数据的描述。
3、关系模型的三类完整性规则
实体完整性规则:
要求关系中组成主键的属性上不能有空值。
参照完整性规则:
要求不引用不存在的实体。
用户定义完整性规则:
由具体应用环境决定,系统提供定义和检验这类完整性的机制。
4、关系模型的形式定义:
数据结构、数据操作和完整性规则。
二、关系代数运算(简单应用)
1、关系代数的五个基本操作:
并、差、笛卡尔积、投影和选择。
并(∪):
两个关系需有相同的关系模式,并的对象是元组,由两个关系所有元组构成。
差(-):
同样,两个关系有相同的模式,R和S的差是由属于R但不属于S的元组构成的集合。
投影(σ):
对关系进行垂直分割,消去某些列,并重新安排列的顺序。
选择(π):
根据某些条件关系作水平分割,即选择符合条件的元组。
2、关系代数的四个组合操作:
交、联接、自然联接和除法
交(∩):
R和S的交是由既属于R又属于S的元组构成的集合。
联接包括θ联接和F联接,是选择R×
S中满足iθ(r+j)或F条件的元组构成的集合,特别注意等值联接(θ为等号"
="
)。
自然联接(R|X|S):
在R×
S中,选择R和S公共属性值均相等的元组,并去掉R×
S中重复的公共属性列。
如果两个关系没有公共属性,则自然联接就转化为笛卡尔积。
除法(÷
):
首先除法的结果中元数为两个元数的差,以例2.6为例,我们可以直接用观察法来得到结果,把S看作一个块,拿到R中去和相同属性集中的元组作比较,如果有相同的块,且除去此块后留下的相应元组均相同,那么可以得到一条元组,所有这些元组的集合就是除法的结果。
对于上述的五个基本操作和组合操作,应当从实际运算方面进行理解和运用,对其形式定义可不必深究。
注意课本上的例子和给的练习题。
3、关系代数表达式及应用
在关系代数表达式中,复合了上述五个基本操作,在给出相应的表格(关系)中,应该能够根据给出的关系代数表达式计算关系值,也要能根据相应查询要求列出关系表达式。
在列关系表达式时,通常有以下形式:
π...(σ...(R×
S))或者π...(σ...(R|X|S))
首先把查询涉及到的关系取来,执行笛卡尔积或自然联接操作得到一张大的表格,然后对大表格执行水平分割(选择)和垂直分割(投影)操作。
但是注意当查询涉及到否定或全部值时,就不能用上述形式,而要用到差或除法操作。
第三章关系数据库SQL语言
本章为重点章,应熟悉和掌握SQL的数据定义、数据查询、数据更新的句法及其应用,特别是数据查询的应用。
结合上机操作进行理解和掌握。
一、SQL概述。
1、SQL发展历程(识记)
SQL从1970年美国IBM研究中心的E.F.Codd发表论文到1974年Boyce和Chamberlin把SQUARE语言改为SEQUEL语言,到现在还在不断完善和发展之中,SQL(结构式查询语言)虽然名为查询,但实际上具有定义、查询、更新和控制等多种功能。
2、SQL数据库的体系结构(领会)
SQL数据库的体系结构也是三级结构,但术语与传统关系模型术语不同,在SQL中,关系模式称为"
基本表"
,存储模式称为"
存储文件"
,子模式称为"
视图"
,元组称"
行"
,属性称"
列"
SQL数据库体系的结构要点如下:
(1)一个SQL数据库是表的汇集。
(2)一个SQL表由行集构成,行是列的序列,每列对应一个数据项。
(3)表或者是基本表,或者是视图。
基本表是实际存储在数据库中的表,视图由是由若干基本表或其他视图构成的表的定义。
(4)一个基本表可以跨一个或多个存储文件,一个存储文件也可存放一个或多个基本表。
存储文件与物理文件对应。
(5)用户可以用SQL语句对表进行操作,包括视图和基本表。
(6)SQL的用户可以是应用程序,也可以是终端用户。
3、SQL的组成(识记)
SQL由三部分组成:
(1)数据定义:
SQLDDL。
定义SQL模式,基本表、视图和索引。
(2)数据操纵:
SQLDML。
包括数据查询和数据更新(增、删、改)。
(3)数据控制:
包括对基本表和视图的授权、完整性规则的描述,事务控制等。
二、SQL的数据定义(简单应用)
1、SQL模式的创建和撤消:
SQL模式的创建可简单理解为建立一个数据库,定义一个存储空间,其句法是:
CREATSCHEMA
<
模式名>
AUTHORIZATION<
用户名>
撤消SQL模式的句法为:
DROPSCHEMA<
[CASCADE|RESTRICT]
方括号中的选项参数CASCADE表示连锁方式,执行时将模式下所有基本表、视图、索引等元素全部撤消。
RESTRICT表示约束式,执行时必须在SQL模式中没有任何下属元素时方可撤消模式。
2、SQL提供的基本数据类型
数值型:
包括integer、smallint、real、doubleprecision、float(n),numeric(p,d)
字符串型:
char(n)、varchar(n),前者是定长,后者为变长串
位串型:
bit(n),bitvarying(n),同上。
时间型:
date、time。
3、基本表的创建、修改和撤消
基本表的创建:
(可理解为建立表结构)
CREATTABLESQL模式名.基本表名
(列名,类型,
……
完整性约束...)
完整性约束包括主键子句(PRIMARYKEY)、检查子句(CHECK)和外键子句(ForeignKEY).
基本表结构的修改
ALTERTABLE基本表名ADD/DROP(增加/删除)列名类型名(增加时写出)
删除时有子句[CASCADE|RESTRICT],前者为连锁删除,后者为约束删除,即没有对本列的任何引用时才能删除。
基本表的撤消
DROPTABLE基本表名[CASCADE|RESTRICT]
4、视图的创建和撤消
创建:
CREATVIEW视图名(列名表)ASSELECT查询语句
撤消:
DROPVIEW视图名
5、索引的创建和撤消
CREAT[UNIQUE]INDEX索引名ON基本表名(列名表[ASC|DESC])
DROPINDEX索引名
总结:
凡创建都用CREAT,删除都用DROP,改变用alter,再跟类型和名字,附加子句很容易了。
三、SQL的数据查询(综合应用)
这一段是本章的重点内容,应该熟练掌握。
首先了解基本句法:
1、SELECT-FROM-WHERE句型
SELECT列名表(逗号隔开)FROM基本表或视图序列WHERE条件表达式
在这里,重点要掌握条件表达式中各种运算符的应用,如=,>
<
>
等算术比较运算符、逻辑运算符AND、OR、NOT、集合成员资格运算符:
IN,NOT
IN,以及嵌套的SELECT语句的用法要特别注意理解。
针对课本的例题和课后习题进行掌握。
在查询时,SELECT语句可以有多种写法,如联接查询、嵌套查询和使用存在量词的嵌套查询等。
最好都掌握,但是起码应能写出一种正确的查询语句。
2.SELECT语句完整的句法:
SELECT列名表(逗号隔开)
FROM基本表或视图序列
[WHERE条件表达式](此为和条件子句)
[GROUPBY列名序列](分组子句)
[HAVING组条件表达式](组条件子句)
[ORDERBY列名[ASC|DESC]..](排序子句)
这段关于完整句法的内容能够理解也就问题不大了。
3、SELECT语句中的限定
这一段内容主要是对SELECT语句进一步使用进行的深入学习,领会下列各种限定的使用目的和方法。
要求输出表格中不出现重复元组,则在SELECT后加一DISTINCT
SELECT子句中允许出现加减乘除及列名,常数的算术表达式
WHERE子句中可以用BETWEEN...AND...来限定一个值的范围
同一个基本表在SELECT语句中多次引用时可用AS来增加别名
WHERE子句中字符串匹配用LIKE和两个通配符,%和下划线_.
查询结果的结构完全一致时可将两个查询进行并(UNION)交(INTERSECT)差(EXCPT)操作
查询空值操作不是用='
null'
而是用ISNULL来测试。
集合成员资格比较用IN/NOTIN,集合成员算术比较用元组θSOME/ALL
可以用子查询结果取名(表名(列名序列))来作为导出表使用
基本表的自然联接操作是用NATURALINNERJOIN来实现的。
四、SQL的数据更新(简单应用)
简单应用就是掌握基本的句型并能套用在一些简单的查询要求上。
1、数据插入:
INSERTINTO基本表名(列名表)
VALUES(元组值)
或
SELECT查询语句
其中元组值可以连续插入。
用查询语句可以按要求插入所需数据。
2、数据删除:
DELETEFROM基本表名[WHERE条件表达式]
3、数据修改:
UPDATE基本表名
SET列名=值表达式,[列名=值表达式...]
[WHERE条件表达式]
这一节的关于增删改的操作要和前面关于数据库模式、表的增删改操作进行对比学习,以加深理解。
不要忘记上机实践。
第五章关系数据理论
本章的理论性较强,学习时有无从下手的感觉,在学习时应多加思考,从概念出发去理解理论,前后的理论有较强的联系,因此要逐个理解,但对于理论的证明等内容则不必深究,本章重点是函数依赖和范式的概念。
一、关系模式的设计问题(识记)
关系数据库是以关系模型为基础的数据库,它利用关系来描述现实世界。
一个关系既可以用来描述一个实体及其属性,也可以用来描述实体间的联系。
关系实质上就是一张二维表,表的行称为元组,列称为属性。
关系模式是用来定义关系的,这里的关系模式我们可以简单地理解为一个表的结构,一个关系数据库包含一组关系,也就是包含一组二维表,这些二维表结构体的集合就构成数据库的模式(也可以理解为数据库的结构)。
关系数据库设计理论包括三个方面内容:
数据依赖、范式、模式设计方法。
核心内容是数据依赖。
关系模式的存储异常:
数据冗余、更新异常、插入异常和删除异常
二、函数依赖(FD)
1、函数依赖的定义(领会):
设有关系模式R(A1,A2,...An)或简记为R(U),X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y],则称X函数决定Y,或Y函数依赖于X,记为X→Y。
X→Y为模式R的一个函数依赖。
这个定义可以这样理解:
有一张设计好的二维表,X,Y是表的某些列(可以是一列,也可以是多列),若在表中的第t1行,和第t2行上的X值相等,那么必有t1行和t2行上的Y值也相等,这就是说Y函数依赖于X。
如下图所示:
教师
课程
张老师
物理
杨老师
化学
李老师
在表中,凡教师名相同的,对应的课程名也必是相同的,则此时说
教师名函数决定课程名,或"
课程名"
函数依赖于"
教师名"
但是反过来不一定,课程名相同时并不一定教师名相同,所以这里的Y→X是不成立的。
要特别注意的是,在这张表中,任何一行的关系均应符合上述条件,如果有一行不符合函数依赖的条件,则函数依赖对于这个关系就不成立。
还有应该了解的是,函数依赖是否成立是不可证明的,只能通过属性的含义来判断,上述表是一个关系实例,可以一条条进行验证,但是对于模式设计来说,开始时并没有数据插入,我们只能从属性的含义出发,如这个关系模式保存了全校所有教师和课程对应关系,则有可能出现相同的教师名而课程名不是一样的情况(有同名教师),那么"
课程名→教师名"
这个函数依赖就不成立了。
上述例子可对照课本理论进行领会。
2、键和FD的关系(领会)
键是唯一标识实体的属性集。
对于键和函数依赖的关系:
有两个条件:
设关系模式R(A1,A2...An),F是R上的函数依赖集,X是R的一个子集,
(1)X→A1A2...An∈F+(它的意思是X能够决定唯一的一个元组)
(2)不存在X的真子集Y,使得Y也能决定唯一的一个元组,则X就是R的一个候选键。
(它的意思是X能决定唯一的一个元组但又没有多余的属性集)
包含在任何一个候选键中的属性称为主属性,不包含在任何键中的属性为非主属性(非键属性),注意主属性应当包含在候选键中。
3、函数依赖(FD)的推理规则(了解)
前面我们举的例子中是以实际经验来确定一个函数依赖的逻辑蕴涵,但是我们需要一个推理规则才能完全确定F或F+的所有函数依赖。
设有关系模式R(U),X,Y,Z,W均是U的子集,F是R上只涉及到U中属性的函数依赖集,推理规则如下:
自反律:
如果YXU,则X→Y在R上成立。
增广律:
如果X→Y为F所蕴涵,ZU,则XZ→YZ在R上成立。
(XZ表示X∪Z,下同)
传递律:
如果X→Y和Y→Z在R上成立,则X→Z在R上成立。
合并律:
如果X→Y和X→Z成立,那么X→YZ成立。
伪传递律:
如果X→Y和WY→Z成立,那么WX→Z成立。
分解律:
如果X→Y和ZY成立,那么X→Z成立。
三、关系模式的范式(领会)
1、1NF、2NF、3NF、BCNF的定义:
1NF:
第一范式。
即关系模式中的属性的值域中每一个值都是不可再分解的值。
如果某个数据库模式都是第一范式的,则称该数据库模式是属于第一范式的数据库模式。
比如有一个关系顾客={顾客,送货地址},若有这样几行记录:
顾客送货地址
张三北京、上海
李四北京
这时的第一条记录就表示本关系模式不是1NF的,因为课程中的值域还是可以分解的,它包括了两个地址,如分为:
张三北京
张三上海
就成为第一范式的关系模式。
2NF:
第二范式。
如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称为第二范式模式。
在这里要先了解"
非主属性"
、"
完全函数依赖"
候选键"
这三个名词的含义。
候选键就是指可以唯一决定关系模式R中某元组值且不含有多余属性的属性集。
非主属性也就是非键属性,指关系模式R中不包含在任何建中的属性。
设有函数依赖W→A,若存在XW,有X→A成立,那么称W→A是局部依赖,否则就称W→A是完全函数依赖。
在分析是否为第2范式时,应首先确定候选键,然后把关系模式中的非主属性与键的依赖关系进行考察,是否都为完全函数依赖,如是,则此关系模式为2NF。
如果数据库模式中每个关系模式都是2NF的,则此数据库模式属于2NF的数据库模式。
3NF:
第三范式。
如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R为第三范式的模式。
这里首先要了解传递依赖的含义:
在关系模式中,如果Y→X,X→A,且X不决定Y和A不属于X,那么Y→A是传递依赖。
注意的是,这里要求非主属性都不传递依赖于候选键。
BCNF:
这个范式和第三范式有联系,它是3NF的改进形式。
若关系模式R是第一范式,且每个属性都不传递依赖于R的候选键。
这种关系模式就是BCNF模式。
纵观四种范式,可以发现它们之间存在如下关系:
BCNF3NF2NF1NF
1NF
↓消去非主属性对键的部分函数依赖
2NF
↓消去非主属性对键的传递函数依赖
3NF
↓消去主属性对键的传递函数依赖
BCNF
2、多值依赖。
简单了解一下。
第六章数据库设计
与上一章不同,本章的实用性较强,详细讲述了数据库应用系统设计的全过程。
重点是概念设计中ER模型的设计方法,逻辑设计中ER模型向关系模型的转换方法。
一、数据库设计概述(识记)
1、软件生存期:
是指从软件的规划、研制、实现、投入运行后的维护、直到它被新的软件所取代而停止使用的整个期间。
它包括六个阶段:
(规需设编试运维)
(1)规划阶段
(2)需求分析阶段
(3)设计阶段
(4)程序编制阶段
(5)调试阶段
(6)运行维护阶段
2、数据库系统生存期
数据库应用系统的开发也是一项软件工程,称为数据库工程,数据库应用系统也有生存期的概念,通常包括七个阶段:
(3)概念设计阶段
(4)逻辑设计阶段
(5)物理设计阶段
(6)实现阶段
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 系统 讲义