数据库系统概论第四版王珊萨师煊第一章知识点.docx
- 文档编号:12412400
- 上传时间:2023-04-18
- 格式:DOCX
- 页数:13
- 大小:20.30KB
数据库系统概论第四版王珊萨师煊第一章知识点.docx
《数据库系统概论第四版王珊萨师煊第一章知识点.docx》由会员分享,可在线阅读,更多相关《数据库系统概论第四版王珊萨师煊第一章知识点.docx(13页珍藏版)》请在冰豆网上搜索。
数据库系统概论第四版王珊萨师煊第一章知识点
第一章绪论
数据库系统概述
数据、数据库、数据库管理系统、数据库系统
数据(Data):
数据库中存储的基本对象。
描述事物的符号记录成为数据。
数据的表现形式不能完全表达其内容,需要经过解释,数据和关于数据的解释(语义)是不可分
的。
数据库(DB):
严格地讲,数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和
易扩展性,并可为各种用户共享。
数据库数据具有三个特点:
永久存储、有组织、可共享。
数据库管理系统(DBMS):
位于用户与操作系统之间的一层数据管理软件。
用于科学地组织和存储数据、高效地获取和维护数据
主要功能:
1.数据定义功能
2.数据组织、存储和管理
3.数据操纵功能
4.数据库的事务管理和运行管理
5.数据库的建立和维护功能
6.其他功能(DBMS与网络中其他软件系统的通信功能;与另一个DBMS或文件系统的
数据转换功能;异构数据库之间的互访和互操作功能等)
数据库系统(DBS):
数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(DBA)构成。
数据库技术的产生和发展
对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。
数据管理技术经历了人工管理、文件系统、数据库系统3个阶段。
人工管理阶段:
科学计算;无直接存取存储设备;没有操作系统;数据处理方式是批处理。
特点:
数据不保存、应用程序管理数据、数据不共享、数据不具有独立性。
文件系统阶段:
科学计算、数据管理;磁盘、磁鼓存取存储;有文件系统;数据处理方式是联机实时处理和批处理。
特点:
数据可以长期保存、由文件系统管理数据、但仍然存在数据共享性差,冗余度大、数据独立
性差的缺点。
数据库系统阶段:
进行大规模数据管理;有了大容量磁盘、磁盘阵列;有数据库管理系统;数据处理方式有联机实时处理、分布处理、批处理。
数据库系统的特点
数据库系统与人工管理和文件系统相比的特点有:
1.数据结构化
数据库系统实现整体数据的结构化,这是数据库系统与文件系统的本质区别。
所谓整体数据的结构化指数据不仅针对某一应用,而是面向全组织,且数据之间是具有联系
的。
2.数据的共享性高,冗余度低、易扩充
数据共享可以大大减少数据冗余,节约存储空间,还能避免数据之间的不相容性与不一致性。
3.数据独立性高
包括数据的物理独立性和数据的逻辑独立性。
数据独立性由DBMS的二级映像功能来保证。
4.数据由DBMS统一管理和控制
由于数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据甚至是存储同一
个数据,因而DBMS必须提供几方面的数据控制功能:
1)数据的安全性保护
2)数据的完整性检查
3)并发控制
4)数据库恢复
数据模型
数据模型是对现实世界数据特征的抽象,它是用来描述数据、组织数据和对数据进行操作的。
两大类数据模型
根据模型应用的不同目的,数据模型划分为两类:
第一类是概念模型。
也称信息模型,是按照用户的观念对数据和信息建模,主要用于数据库设计。
第二类是逻辑模型和物理模型。
逻辑模型主要包括层次模型、网状模型、面向对象模型和对象关系模型等。
它是按照计算机系统的
观点对数据建模,主要用于DBMS的实现。
物理模型是对数据最低层的抽象,描述数据在系统内部的表示方式和存取方式,在磁盘或磁带上的
存储方式和存取方式,是面向计算机系统的。
数据模型是数据库系统的核心和基础。
数据模型的组成要素
数据模型通常由数据结构、数据操作和完整性约束三部分组成。
一般地讲,数据模型是严格定义的一组概念的集合,这些概念精确的描述了系统的静态特性、动态特性和完整性约束条件。
数据结构:
描述数据库的组成对象以及对象之间的联系。
在数据库系统中通常按照其数据结构的类型来命名数据模型。
数据结构是所描述的对象类型的集合,是对系统静态特性的描述。
数据操作:
指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。
主要有查询和更新(包括插入、删除、修改)两大类操作。
数据操作时对系统动态特性的描述。
数据的完整性约束条件:
即一组完整性规则,是给定的数据模型中数据及其联系所具有的制约和依存条件,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
概念模型
概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象。
信息世界中的基本概念:
实体:
客观存在并可相互区别的事物。
既可以是具体的人事物,也可以是抽象的概念或联系。
属性:
实体所具有的某一特性。
一个实体可以由若干属性刻画。
码:
唯一标识实体的属性集。
域:
一组具有相同数据类型的值的集合。
属性的取值范围来自某个域。
实体型:
用实体名及其属性名集合来抽象和刻画同类实体,成为实体型。
实体集:
同一类型实体的集合。
联系:
实体(型)内部的联系和实体(型)之间的联系。
两个实体型之间的联系可分为三种:
一对一联系(1:
1)
对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然。
一对多联系(1:
n)
对于实体集A中的每一个实体,实体集B中至多有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系。
多对多联系(m:
n)
对于实体集A中的每一个实体,实体集B中至多有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系。
两个以上的实体型之间的联系
要注意,3个实体型之间多对多的联系和3个实体型两两之间的(3个)多对多联系的语义是不同的。
多实体型之间一对多联系的定义:
若实体型E
1,E
2
…E
n
之间存在联系,对于实体型
E
j(j=1,2,…,i-1,i+1,…,n)中的给定实体,最多只和Ei中的一个实体相联系,则说E
i
与
E
1,E
2
…,E
i-1
E
i+1
…,E
n
之间的联系是一对多的。
单个实体型内的联系
概念模型的一种表示方法:
实体-联系方法
实体-联系方法用E-R图来描述现实世界的概念模型,E-R方法也成为E-R模型。
E-R图提供了表示实体型、属性和联系的方法:
实体型:
用矩形表示,矩形框内写明实体名。
属性:
用椭圆形表示,并用无向边将其与相应的实体型连接起来。
联系:
用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体型连接起来,同时在无
向边旁标上联系的类型(1:
1,1:
n或m:
n)
最常用的数据模型
层次模型和网状模型统称为格式化模型。
在格式化模型中,实体用记录表示,实体的属性对应记录的数据项(或字段)。
实体之间的联系在格式化模型中转换成记录之间的两两联系。
格式化模型中的数据结构的单位是基本层次联系。
所谓基本层次联系是指两个记录以及它们之间的一对多的联系。
层次模型
层次模型用树形结构来表示各类实体以及实体间的联系。
层次数据模型的数据结构:
满足以下两个条件的基本层次联系的集合为层次模型:
有且只有一个结点没有双亲结点,这个结点成为根节点。
根以外的其他节点有且只有一个双亲结点。
在层次模型中,同一双亲的子女结点成为兄弟结点,没有子女结点的结点成为叶结点。
层次模型的一个基本特点:
任何一个给定的记录纸只有按其路径查看时,才能显示出它的全部意义,没有一个子女记录纸能脱离双亲记录值而独立存在。
多对多联系在层次模型中的表示:
层次模型中表示多对多联系,需将多对多联系分解成一对多联系,分解方法有两种:
冗余结点法和虚拟结点法。
层次模型的数据操纵与完整性约束:
插入操作,如果没有相应的双亲结点值就不能插入它的子女结点值。
删除操作,如果删除双亲结点值,则相应的子女结点值也被同时删除。
层次数据模型的存储结构:
邻接法:
按照层次树前序穿越的顺序把所有记录纸依次邻接存放,即通过物理空间的位置相邻来体现(或隐含)层次顺序。
链接法:
用指针来反映数据之间的层次联系。
子女-兄弟链接法:
每个记录设两类指针,分别指向最左边的子女和最近的兄弟。
层次-序列链接法:
按树的前序穿越顺序链接各记录值。
层次模型的优缺点:
优点:
数据结构比较简单清晰;查询效率高;提供了良好的完整性支持。
缺点:
现实世界中很多联系是非层次性的;
一个结点具有多个双亲等,层次模型表示这类联系的方法很笨拙,对插入和删除操作的限制
比较多;
查询子女结点必须通过双亲结点;
由于结构严密,层次命令趋于程序化。
网状模型
网状数据模型的数据结构:
满足以下两个条件的基本层次联系集合称为网状模型:
允许一个以上的结点无双亲;
一个结点可以有多于一个的双亲。
网状模型中要为每个联系命名,并指出与该联系有关的双亲记录和子女记录。
网状数据模型的操纵与完整性约束:
DBTG在模式DDL中提供了定义数据库完整性的概念和语句,有
支持记录码的概念;
保证一个联系中双亲记录和子女记录之前是一对多的联系
支持双亲记录和子女记录之间某些约束条件。
网状数据模型的存储结构:
链接法(包括单向链接、双向链接、环状链接、向首链接等),此外还有指引元阵列法、二进制阵列法、索引法等。
网状数据模型的优缺点:
优点:
能更为直接地描述现实世界;具有良好的性能,存取效率较高。
缺点:
结构比较复杂,不利于最终用户掌握;网状模型的DDL、DML复杂,并且要嵌入某一种高级语言中。
用户不容易掌握,不容易使用。
关系模型
关系数据模型的数据结构:
从用户观点看,关系模型由一组关系组成。
每个关系的数据结构是一张规范化的二维表。
关系模型中的一些术语:
关系:
一个关系对应一张表;
元组:
表中的一行即为一个元组;
属性:
表中的一列即为一个属性;
码:
也成为码键。
表中的某个属性组,它可以唯一确定一个元组,也就成为本关系的码;
域:
属性的取值范围;
分量:
元组中的一个属性值;
关系模式:
对关系的描述,一般表示为关系名(属性1,属性2,…,属性n)关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。
关系数据模型的操纵与完整性约束:
关系的完整性约束条件包括三大类:
实体完整性、参照完整性和用户定义的完整性。
关系模型中的数据操作都是集合操作,操作对象和操作对象都是关系,即若干元组的集合。
关系数据模型的存储结构
关系数据模型的优缺点:
优点:
建立在严格的数学概念的基础上;概念单一,数据结构简单、清晰,用户易懂易用;存取路
径对用户透明,从而具有更高的数据独立性、更好的安全保密性,简化了程序员的工作和数据库开
发建立的工作。
缺点:
由于存取路径对用户透明,查询效率不如格式化数据模型。
数据库系统结构
从数据库管理系统角度看,数据库系统通常采用三级模式结构,这是数据库管理系统内部的系统结构;
从数据库最终用户角度看,数据库系统的结构分为单用户结构、主从式结构、分布式结构、客户/服务器、浏览器/应用服务器/数据库服务器多层机构等,这是数据库系统外部的体系结构。
数据库系统模式的概念
数据模型中有“型”和“值”的概念,模式是数据库中全体数据的逻辑结构和特征的描述,仅涉及型的
描述,不涉及具体的值。
模式的一个具体指成为模式的一个实例。
模式是相对稳定的,而实例是相对变动的。
模式反映的是数据的结构及其联系,而实例反映的是数据库
某一时刻的状态。
数据库系统的三级模式结构
数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。
模式:
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
一个数据库只有一个模式;
定义模式时不仅要定义数据的逻辑结构,而且要定义数据之间的联系,定义与数据有关的安全性、
完整性要求。
外模式:
也称为子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
一个数据库可以有多个外模式;
同一外模式可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。
内模式:
也称存储模式,它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
一个数据库只有一个内模式;
数据库的二级映像功能与数据独立性
外模式/模式映像:
对于每一个外模式,都有一个外模式/模式映像,这些映像定义通常包含在各自外模式的描述中。
当模式改变时,由数据库管理员对外模式/模式的映像作相应改变,可以使外模式保持不变。
应用程
序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数
据的逻辑独立性。
模式/内模式映像:
模式/内模式映像是唯一的,它定义了数据全局逻辑结构与存储结构之间的对应关系,该映像定义通
常包含在模式描述中。
当数据库的存储结构改变了,由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,
从而应用程序也不必改变。
保证了数据与程序的物理独立性,简称数据的物理独立性,数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去。
数据库系统的组成
硬件平台及数据库
足够大的内存,存放操作系统、DBMS的核心模块、数据缓冲区和应用程序;
足够的大的磁盘或磁盘阵列等设备存放数据库,足够的磁带(或光盘)作数据备份;
系统有较高的通道能力,提高数据传送率。
软件
DBMS;
支持DBMS运行的操作系统;
具有与数据库接口的高级语言及其编译系统,便于开发应用程序;
以DBMS为核心的应用开发工具;
为特定应用环境开发的数据库应用系统。
人员
数据库管理员(DBA):
负责全面管理和控制数据库系统,具体职责包括:
决定数据库中的信息内容和结构;
决定数据库的存储结构和存储策略;
定义数据的安全性要求和完整性约束条件;
监控数据库的使用和运行;
数据库的改进和重组重构。
系统分析员和数据库设计人员
系统分析员负责应用程序的需求分析和规范说明,和用户及DBA相结合,确定系统的硬件软
件配置,并参与数据库系统的概要设计。
数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。
数据库设计人员必须参
加用户需求调查和系统分,然后进行数据库设计。
应用程序员
应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。
用户
最终用户通过应用系统的用户接口使用数据库,最终接口方式有浏览器、菜单驱动、表格操
作、图形显示、报表书写等。
最终用户可分为三类:
偶然用户、简单用户、复杂用户。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 系统 概论 第四 版王珊萨师煊 第一章 知识点