数据库基础.docx
- 文档编号:7443332
- 上传时间:2023-01-24
- 格式:DOCX
- 页数:18
- 大小:96.05KB
数据库基础.docx
《数据库基础.docx》由会员分享,可在线阅读,更多相关《数据库基础.docx(18页珍藏版)》请在冰豆网上搜索。
数据库基础
第4章数据库基础
4.1数据库系统的基本概念
4.1.1数据、数据库、数据库管理系统
1.数据
数据(Data)实际上就是描述事物的符号记录。
计算机中的数据一般分为两部分,其中一部分存放于计算机内存中,与程序仅有短时间的交互关系,随着程序的结束而消亡,它们称为临时性数据,这类数据一般;而另一部分数据则对系统起着长期持久的作用,它们称为持久性数据。
数据库系统中处理的就是这种持久性数据。
2.数据库
数据库(DataBase,简称DB)是数据的集合,它具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。
3.数据库管理系统
数据库管理系统(DatabaseManagementSystem,简称DBMS)是数据库的机构,它是一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控制及保护和数据服务等。
数据库管理系统是数据库系统的核心,它有如下功能:
(l)数据模式定义。
(2)数据存取的物理构建。
(3)数据操纵。
(4)数据的完整性、安全性定义与检查。
(5)数据库的并发控制与故障恢复。
(6)数据的服务。
为完成以上六个功能,数据库管理系统提供相应的数据语言(DataLanguage):
(1)数据定义语言(DataDefinitionLanguage简称DDL)。
(2)数据操纵语言(DataManipulationsLanguage简称DML)。
(3)数据控制语言(DataControlLanguage。
简称DCL)。
上述数据语言有两种结构形式:
(1)交互式命令语言。
(2)宿主型语言。
4.数据库管理员
由于数据库的共享性,因此对数据库的规划、设计、维护、监视等需要有专人管理,称他们为数据库管理员(DatabaseAdministrator简称DBA)。
其主要工作如下:
(1)数据库设计(DatabaseDesign)。
(2)数据库维护。
(3)改善系统性能,提高系统效率。
5.数据库系统
数据库系统(DatabaseSystem简称DBS)由如下几部分组成:
数据库(数据)、数据库管理系统(软件)、数据库管理员(人员)、系统平台之一——硬件平台(硬件)、系统平台之二——软件平台(软件)。
这五个部分构成了一个以数据库为核心的完整的运行实体,称为数据库系统。
6.数据库应用系统(DatabaseApplicationSystem简称DBAS)
利用数据库系统进行应用开发可构成一个数据库应用系统,数据库应用系统是数据库系统再加上应用软件及应用界面这三者所组成,具体包括:
数据库、数据库管理系统、数据库管理员,硬件平台、软件平台、应用软件、应用界面。
4.1.2数据库系统的发展
数据管理技术经历了三个阶段:
人工管理阶段、文件系统阶段和数据库系统阶段。
表4.1数据管理三个阶段的比较
人工管理
文件系统
数据库系统
背景
应用背景
科学计算
科学计算、管理
大规模管理
硬件背景
无直接存取设备
磁盘、磁鼓
大容量磁盘
软件背景
没有操作系统
有文件系统
有数据库管理系统
处理方式
批处理
联机实时处理批处理
联机实时处理、分布处理、批处理
特点
数据管理者
人
文件系统
数据库管理系统
数据面向对象
某个应用程序
某个应用程序
现实世界
数据共享程度
无共享、冗余度大
共享性差、冗余度大
共享性大、冗余度小
数据独立性
不独立,完全依赖于程序
独立性差
具有高度的物理独立性和一定的逻辑独立性
数据结构化
无结构
记录内有结构、整体无结构
整体结构化,用数据模型描述
数据控制能力
应用程序自己控制
应用程序自己控制
由DBMS提供数据安全性、完整性、并发控制和恢复
4.1.3数据库系统的基本特点
1.数据的集成性
2.数据的高共享性与低冗余性
3.数据独立性
分为物理独立性与逻辑独立性两级。
4.数据统一管理与控制
包含以下三个方面:
(l)数据的完整性检查;
(2)数据的安全性保护;
(3)并发控制。
4.1.4数据库系统的内部结构体系
数据库系统在其内部具有三级模式及二级映射,三级模式分别是概念级模式、内部级模式与外部级模式,二级映射则分别是概念级到内部级的映射以及外部级到概念级的映射。
这种三级模式与二级映射构成了数据库系统内部的抽象结构体系,如图4.2所示。
4.2数据模型
4.2.1数据模型的基本概念
数据模型所描述的内容有三个部分,它们是数据结构、数据操作与数据约束。
(1)数据结构:
主要描述数据的类型、内容、性质以及数据间的联系等。
(2)数据操作:
主要描述在相应数据结构上的操作类型与操作方式。
(3)数据约束:
主要描述数据结构内数据间的语法、语义联系,它们之间的制约与依存关系,以及数据动态变化的规则,以保证数据的正确、有效与相容。
数据模型按不同的应用层次分成三种类型,它们是概念数据模型、逻辑数据模型、物理数据模型。
4.2.2E-R模型
被广泛使用的概念模型是E-R模型(entity-relationshipmodel)(或实体联系模型)。
1.E-R模型的基本概念
(l)实体
实体是概念世界中的基本单位,它们是客观存在的且又能相互区别的事物。
实体集(entityset):
有共性的实体组成的集合。
(2)属性
属性刻画了实体的特征。
(3)联系
实体集间关系。
有下面几种:
一对一的联系;
一对多或多对一联系;
多对多联系。
2.E-R模型三个基本概念之间的联接关系
E-R模型由上面三个基本概念组成。
由实体、联系、属性三者结合起来才能表示现实世界。
(l)实体集(联系)与属性间的联接关系
实体是概念世界中的基本单位,属性附属于实体,它本身并不构成独立单位。
一个实体可以有若干个属性,实体以及它的所有属性构成了实体的一个完整描述。
属性有属性域,每个实体可取属性域内的值。
实体有型与值之别,一个实体的所有属性构成了这个实体的型。
相同型的实体构成了实体集。
(2)实体(集)与联系
实体集间可通过联系建立联接关系,一般而言,实体集间无法建立直接关系,它只能通过联系才能建立起联接关系。
3.E-R模型的图示法
E-R模型可以用一种非常直观的图的形式表示,这种图称为E-R图(entity-relationshipdiagram)。
(1)实体集表示法
用矩形表示实体集,在矩形内写上该实体集的名字。
如:
图4.3实体集表示法图4.4属性表示法图4.5联系表示法
(2)属性表示法
用椭圆形表示属性,在椭圆形内写上该属性的名称。
(3)联系表示法
菱形(内写上联系名)表示联系。
三个基本概念分别用三种几何图形表示。
它们之间的联接关系也可用图形表示。
(4)实体集(联系)与属性间的联接关系
属性依附于实体集,因此,它们之间有联接关系。
属性也依附于联系,它们之间也有联接关系。
图4.6实体集的属性间的联接图4.7联系与属性间的联接
(5)实体集与联系间的联接关系
7.2.3层次模型
层次模型的基本结构是树形结构,这种结构方式在现实世界中很普遍,如家族结构、行政组织机构,它们自顶向下、层次分明,如图4.13所示。
7.2.4网状模型
网状模型的出现略晚于层次模型。
网状模型是一个不加任何条件限制的无向图。
网状模型在结构上较层次模型好,不像层次模型那样要满足严格的条件,如图4.14所示。
7.2.5关系模型
1.关系的数据结构
关系模型采用二维表来表示,简称表。
如:
学生表
学号
姓名
性别
出生日期
籍贯
民族
0403101
张平
男
02/18/86
辽宁
汉
0403102
王芳
女
10/25/86
陕西
汉
0403103
刘岩
男
08/16/87
吉林
朝
0403104
高丽
女
06/10/85
广西
壮
二维表由表框架(Frame)及表的元组(Tuple)组成。
表框架由n个命名的属性(Attribute)组成,n称为属性元数(Arity)。
每个属性有一个取值范围称为值域(Domain)。
一个n元表框架及框架内m个元组构成了一个完整的二维表。
二维表一般满足下面7个性质:
①二维表中元组个数是有限的——元组个数有限性。
②二维表中元组均不相同——元组的惟一性。
③二维表中元组的次序可以任意交换——元组的次序无关性。
④二维表中元组的分量是不可分割的基本数据项——元组分量的原子性。
⑤二维表中属性名各不相同——属性名惟一性。
⑥二维表中属性与次序无关,可任意交换——属性的次序无关性。
⑦二维表属性的分量具有与该属性相同的值域——分量值域的同一性。
满足以上7个性质的二维表称为关系(Relation),以二维表为基本结构所建立的模型称为关系模型。
2.关系操纵
关系模型的数据操纵即是建立在关系上的数据操纵,一般有查询、增加、删除及修改四种操作。
(1)数据查询
(2)数据删除
(3)数据插入
(4)数据修改
以上四种操作的对象都是关系,而操作结果也是关系,因此都是建立在关系上的操作。
这四种操作可以分解成六种基本操作,称为关系模型的基本操作:
①关系的属性指定;
②关系的元组选择;,
③两个关系合并;
④一个或多个关系的查询;
⑤关系中元组的插入;
⑥关系中元组的删除。
3.关系中的数据约束
(l)实体完整性约束;
(2)参照完整性约束;
(3)用户定义的完整性约束。
4.3关系代数
1.关系模型的基本操作
设有一个n元关系R,它有n个域,分别是D1,D2,…,Dn,此时,它们的笛卡尔积是:
D1×D2×…×Dn
该集合的每个元素都是具有如下形式的n元有序组:
(d1,d2,…,dn)di∈Di(i=l,2,…,n)
该集合与n元关系R有如下联系:
R
D1×D2×…Dn。
即n元关系R是n元有序组的集合,是它的域的笛卡尔积的子集。
关系模型有插入、删除、修改和查询四种操作,它们又可以进一步分解成六种基本操作:
①关系的属性指定;
②关系的元组的选择;
③两个关系的合并;
④关系的查询;
⑤关系元组的插入;
⑥关系元组的删除。
2.关系模型的基本运算
由于操作是对关系的运算,而关系是有序组的集合,因此,可以将操作看成是集合的运算。
(1)插入
设有关系R需插入若干元组,要插入的元组组成关系R',则插入可用集合并运算表示为:
RUR’,
(2)删除
设有关系R需删除一些元组,要删除的元组组成关系R',则删除可用集合差运算表示为:
R-R’
(3)修改
修改关系R内的元组内容可用下面的方法实现:
①设需修改的元组构成关系R',则先做删除得:
R-R′
②设修改后的元组构成关系R",此时将其插入即得到结果:
(R-R′)∪R",
(4)查询
用于查询的三个操作无法用传统的集合运算表示,需要引入一些新的运算。
①投影(Projection)运算
对于关系内的域指定可引入新的运算叫投影运算。
投影运算是一个一元运算,一个关系通过投影运算(并由该运算给出所指定的属性)后仍为一个关系R′。
R′是这样一个关系,它是R中投影运算所指出的那些域的列所组成的关系。
设R有n个域:
A1,A2,…An,则在R上对域Ai1,Ai2,…,Aim(Aij∈{Al,A2,…,An})的投影可表示成为下面的一元运算:
Ai1,Ai2,,Aim(R)
②选择(selection)运算
选择运算也是一个一元运算,关系R通过选择运算(并由该运算给出所选择的逻辑条件)后仍为一个关系。
这个关系是由R中那些满足逻辑条件的元组所组成。
设关系的逻辑条件为F,则R满足F的选择运算可写成为:
σF(R)
逻辑条件F是一个逻辑表达式,它由下面的规则组成。
它可以具有αθβ的形式,其中α,β是域(变量)或常量,但α,β又不能同为常量,θ是比较符,它可以是<,>,≤,≥,=及≠。
αθβ叫基本逻辑条件。
由若干个基本逻辑条件经逻辑运算得到,逻辑运算为∧(并且)、∨(或者)及~(否)构成,称为复合逻辑条件。
有了上述两个运算后,我们对一个关系内的任意行、列的数据都可以方便地找到。
③笛卡尔积(CartesianProduct)运算
对于两个关系的合并操作可以用笛卡尔积表示。
设有n元关系R及m元关系S,它们分别有p、q个元组,则关系R与S经笛卡尔积记为R×S,该关系是一个n+m元关系,元组个数是p×q,由R与S的有序组组合而成。
4.4数据库设计与管理
4.4.1数据库设计概述
在数据库应用系统中的一个核心问题就是设计一个能满足用户要求,性能良好的数据库,这就是数据库设计(Databasedesign)。
在数据库设计中有两种方法:
一种是以信息需求为主,兼顾处理需求,称为面向数据的方法;
另一种是以处理需求为主,兼顾信息需求,称为面向过程的方法。
数据库设计目前一般采用生命周期(lifecycle)法,即将整个数据库应用系统的开发分解成目标独立的若干阶段。
它们是:
需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、运行阶段、进一步修改阶段。
在数据库设计中采用上面几个阶段中的前四个阶段,并且重点以数据结构与模型的设计为主线,如图4.15所示。
4.4.2数据库设计的需求分析
①信息要求。
指用户需要从数据库中获得信息的内容与性质。
由信息要求可以导出数据要求,即在数据库中需存储哪些数据。
②处理要求。
指用户要完成什么处理功能,对处理的响应时间有何要求,处理的方式是批处理还是联机处理。
③安全性和完整性的要求。
4.4.3数据库概念设计
1.数据库概念设计概述
数据库概念设计的目的是分析数据间内在语义关联,在此基础上建立一个数据的抽象模型。
数据库概念设计的方法有以下两种:
(l)集中式模式设计法
(2)视图集成设计法
2.数据库概念设计的过程
使用E-R模型与视图集成法进行设计时,需要按以下步骤进行:
首先选择局部应用,再进行局部视图设计,最后对局部视图进行集成得到概念模式。
(1)选择局部应用
(2)视图设计
(3)视图集成
4.4.4数据库的逻辑设计
1.从E-R图向关系模式转换
数据库的逻辑设计主要工作是将E-R图转换成指定RDBMS中的关系模式。
2.逻辑模式规范化及调整、实现
3.关系视图设计
4.4.5数据库的物理设计
数据库物理设计的主要目标是对数据库内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度及有效利用存储空间。
4.4.6数据库管理
数据库是一种共享资源,它需要维护与管理,这种工作称为数据库管理,而实施此项管理的人则称为数据库管理员。
数据库管理一般包含如下一些内容:
1.数据库的建立
2.数据库的调整
3.数据库的重组
4.数据库安全性控制与完整性控制
5.数据库的故障校复
6.数据库监控
在数据库管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。
在这几个阶段中,数据独立性最高的是()。
A)数据库系统B)文件系统
C)人工管理D)数据项管理
数据库系统的核心是()。
A)数据库B)数据库管理系统
C)数据模型D)软件工具
在数据库系统的3级模式结构中,用来描述数据库中全体数据的全局逻辑结构和特性的是()。
A)外模式B)内模式
c)存储模式D)模式
在数据库系统中,当总体逻辑结构改变时,通过改变(),使局部逻辑结构不变,从而使建立在局部逻辑结构之上的应用程序也保持不变,称之为数据和程序的逻辑独立性。
A)应用程序B)逻辑结构和物理结构之间的映射
c)存储结构D)局部逻辑结构到总体逻辑结构的映射
.数据的完整性是指数据的正确性、有效性和()。
A)可维护性B)独立性
C)安全性D)相容性
对关系数据库来讲,下面()的说法是错误的。
A)每一列的分量是同一类型的数据,来自同一个域
B)不同列的数据可以出自同一个域
c)行的顺序可以任意交换,但是列的顺序不能任意交换
D)关系中的任意两个元组不能完全相同
用树型结构来表示实体之间联系的模型称为()。
A)关系模型B)层次模型
C)网状模型D)数据模型
用二维表形式结构表示实体类型以及实体类型之间联系的数据模型是()。
A)关系数据模型B)层次数据模型
c)网状数据模型D)面向对象数据模型
数据库的3级模式结构由外模式、概念模式和内模式组成,它适合于()。
I.关系型数据库
Ⅱ.层次型数据库
III.网状型数据库
A)只有IB)I和Ⅱ
C)1I和ⅢD)都适合
对于数据库系统,负责定义数据库内容,决定存储结构和存取策略及安全授权等工作的是()。
A)应用程序员B)用户
C)数据库管理员D)数据库管理系统的软件设计员
将E—R图转换到关系模式时,实体与联系都可以表示成()。
A)属性B)关系C)键D)域
在关系数据模型中可以有3类完整性约束条件,任何关系必须满足其中的()约束条件。
A)参照完整性、用户自定义完整性B)数据完整性、实体完整性
c)实体完整性、参照完整性D)动态完整性、实体完整性
下列有关数据库的叙述中,错误的是()。
A)数据库减少了数据冗余
B)数据库数据可以为经DBA认可的各用户使用
c)用户程序按照所对应的子模式使用数据库中的数据,
D)数据库的存储模式如有改变,则概念模式也应做改变
下列工作中,不属于数据库管理员(DBA)的职责的是()。
A)建立数据库B)输入和存储数据库数据
C)监督和控制数据库的使用D)数据库的维护和改进
关系模型是把实体之间的联系用()来表示。
A)二维表格B)树
C)图D)E—R图
对数据库中的数据可以进行查询、插入、删除、修改(更新),这是因为数据库管理系统提供了()。
A)数据定义功能B)数据操纵功能
c)数据维护功能D)数据控制功能
数据字典是软件需求分析阶段的最重要的工具之一,其最基本的功能是()。
A)数据库设计B)数据通信
C)数据定义D)数据维护
在数据库设计的概念设计阶段,表示概念结构的常用方法和描述工具是()。
A)层次分析法和层次结构图B)数据流程分析法和数据流程图
c)结构分析法和模块结构图D)实体一联系法和实体一联系图
实体一联系模型可以形象地用E—R图表示,在E—R图中以()来表示实体类型。
A)菱形B)椭圆形c)矩形D)三角形
在关系数据库中,视图是3级模式结构中的()。
A)内模式B)模式
C)存储模式D)外模式
下述()不属于数据库设计的内容。
A)数据库管理系统B)数据库概念结构
c)数据库逻辑结构D)数据库物理结构
在数据库的3级模式结构中,内模式有()个。
A)1B)2
C)3D)任意多
下列对于关系的叙述中,()的叙述是不正确的。
A)关系中的每个属性是不可分解的
B)在关系中元组的顺序是无关紧要的
c)任意的一个二维表都是一个关系
D)每一个关系只有一种记录类型
在关系数据库设计中,设计视图(View)是()阶段的内容
A)需求分析B)概念设计
c)逻辑设计D)物理设计
数据库系统与文件系统的主要区别是()。
A)数据库系统复杂,而文件系统简单
B)文件系统不能解决数据冗余和数据独立性问题,而数据库系统可以解决
c)文件系统只能管理程序文件,而数据库系统可以管理庞大的各种类型的文件
D)文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量
下面列出的数据库管理技术发展的3个阶段中,()没有专门的软件对数据进行管理。
I.人工管理阶段
Ⅱ.文件系统阶段
Ⅲ.数据库阶段
A)只有IB)只有Ⅱ
C)I和ⅡD)Ⅱ和Ⅲ
数据库的概念模型独立于()。
A)具体的机器和DBMSB)E—R图
c)信息世界D)现实世界
数据库的基本特点是()。
A)数据可以共享(或数据结构化);数据独立性;数据冗余大,易移植;统一管理和控制
B)数据可以共享(或数据结构化);数据独立性;数据冗余小,易扩充;统一管理和控制
C)数据可以共享(或数据结构化);数据互换性;数据冗余小,易扩充;统一管理和控制
D)数据非结构化;数据独立性;数据冗余小,易扩充;统一管理和控制
设关系R和关系s的元素分别是3和4,关系T是尺与s的笛卡儿积,即T=R×s,则关系T的元数是()。
A)7B)9C)12D)16
数据库的安全性是指保护数据库,以防止不合法的使用而造成的数据泄露、更改或破坏,下列的措施中,()不属于实现安全性的措施。
A)数据备份B)授权规则
C)数据加密D)用户标识和鉴别
数据库技术采用分级方法将其结构划分成多个层次,是为了提高数据库的()。
A)数据规范性和逻辑独立性B)数据规范性和管理规范性
C)逻辑独立性和物理独立性D)数据的共享
DBMS提供的DML有两种使用方式,其中一种是将DML嵌人到某一高级语言中,则此高级语言称为()。
A)查询语言B)宿主语言
C)自含语言D)会话语言
数据库的3级模式之间存在的映射关系正确的是()。
A)外模式/内模式B)外模式/模式
C)外模式/外模式D)模式/模式
数据模型是()。
A)文件的集合B)记录的集合
c)数据的集合D)记录及其联系的集合
数据模型的3要素是()。
A)外模式、模式和内模式
B)关系模型、层次模型和网状模型
c)实体、属性和联系
D)数据结构、数据操作和完整性约束
数据库的完整性是指数据库的正确性和相容性。
下列叙述不是DBMS的完整性控制机制的是()。
A)提供定义完整性约束
B)检查用户发出的操作请求是否违背了完整性约束条件
c)系统提供一定的方式让用户标识自己的名字或身份,用户进入系统时,由系统核对用户提供身份标识
D)如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性
层次模型、网状模型和关系模型的划分原则是()。
A)记录长度B)文件的大小
C)联系的复杂程度D)数据之间的联系
数据库的网状模型应该满足的条件是()。
A)允许一个以上的结点无父结点,也允许一个结点有多个父结点
B)必须有两个以上的结点
c)有且仅有一个结点无父结点,其余结点都只有一个父结点
D)每个结点有且仅有一个父结点
对关系模型叙述错误的是()。
A)建立在严格的数学理论、集合论和谓词演算公式基础之上
B)微机DBMS绝大部分采取关系数据模型
c)用二维表表示关系模型是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 基础
![提示](https://static.bdocx.com/images/bang_tan.gif)