第1章 数据库技术及应用.docx
- 文档编号:30207896
- 上传时间:2023-08-07
- 格式:DOCX
- 页数:23
- 大小:88.76KB
第1章 数据库技术及应用.docx
《第1章 数据库技术及应用.docx》由会员分享,可在线阅读,更多相关《第1章 数据库技术及应用.docx(23页珍藏版)》请在冰豆网上搜索。
第1章数据库技术及应用
课程目标
▪了解并结合关系型数据库系统深入理解数据库系统的基本概念、原理和方法。
▪掌握关系数据模型及关系数据语言,能熟练应用SQL语言表达各种数据操作。
▪掌握E-R模型的概念和方法,关系数据库规范化理论和数据库设计方法,通过上机实习的训练,初步具备进行数据库应用系统开发的能力。
▪掌握大型数据库MSSQLServer的基本使用方法。
▪能够使用VisualFoxPr6.0/PowerBuilder9.0进行数据库系统的开发。
课程内容简介
数据库系统概论课程的主要目的是使同学们了解数据库的基本原理,掌握数据库技术的基本方法和应用技术,能够有效的使用现有的数据库管理系统,掌握数据库结构的设计和数据库应用系统的开发方式,同时能够利用前端开发工具完成企业管理信息系统的开发。
数据库系统概论的授课方式采用理论与实践相结合,注重于基本理论的理解和实践能力的培养。
参考书
《数据库技术及应用》地质出版社焦华
〈数据库系统概论〉高教出版社萨师煊王珊
〈数据库系统教程〉高教出版社施伯乐
《SQLServer2000/2005操作教程》
《VisualFoxPro程序设计》
《Access数据库应用技术》
第1章绪论
本章目标
本章对数据库系统进行概括性的描述,主要介绍数据库的产生和发展、数据模型、数据库的三级模式结构、数据库管理系统、数据库系统等基本概念。
要求能够理解主要的概念。
教学目标
掌握数据库技术相关的基本概念;了解数据管理技术发展的各个阶段;掌握数据库系统的特点;了解数据库系统的外部体系结构;理解并掌握数据库系统的三级模式绘声结构;了解数据库技术的发展趋势。
教学重点
数据库的基本概念;数据库系统的特点;数据库系统的三级模式结构。
教学难点
数据库系统的三级模式结构
教学过程及内容:
引言:
数据与信息
信息、能源、材料并列,构成现代社会的三大柱。
信息是现[实世界事物存在方式或运动状态的反映。
例如。
黑板(长,高,材料,颜色)。
信息来源于物质和能量;是可感知、可存贮、可加工、可传递、可再生等特点。
数据,通常指用符号记录下来的,可能识别的信息。
数据,是数据库系统研究和处理的对象,数据与信息是分不开的,一个国家的发达程序如何,可通过数据库的应用来反映。
新授内容:
1.1数据库系统概述
1.1.1数据库的产生和发展
▪数据库(Database)起源于20世纪50年代,当时是美国为了战争的需要,把各种情报集中到一起,存储在计算机里,称为InformationBase或Database。
▪1963年IDS系统投入运行,揭开了数据库技术的序幕。
▪20世纪70年代是数据库蓬勃发展时代,网状系统和层次系统占据了整个数据库的商用市场。
▪20世纪80年代,关系数据库逐渐取代网状系统和层次系统占据了市场。
▪20世纪90年代,关系数据库成为数据库技术的主流。
数据处理手工---机械---计算机化
数据处理(收集、存贮、加工、传递)技术的发展经历了三个阶段:
v人工管理阶段(50年代中期以前)
v文件系统阶段(50年代后期—60年代中期)
v数据库系统阶段(60年代后期开始)
1.1.1人工管理阶段
❑背景
❑计算机主要用于科学计算:
数据量小、结构简单,如高阶方程、曲线拟和等;
❑外存为顺序存取设备:
数据不保存在计算机内部,而是存储在磁带、卡片、纸带,没有磁盘等直接存取设备;
❑没有专用数据管理软件:
用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户上机操作;
❑数据是面向程序的:
每一组数据对应一个程序,两个程序之间不能共享数据。
❑特点
❑用户完全负责数据管理工作:
数据的组织、存储结构、存取方法、输入输出等
❑数据完全面向特定的应用程序:
每个用户使用自己的数据,数据不保存,用完就撤走
❑数据与程序没有独立性:
程序中存取数据的子程序随着存储结构的改变而改变
❑磁带的特点
1.1.2文件系统阶段
❑背景
❑计算机不但用于科学计算,还用于管理
❑外存有了磁盘、磁鼓等直接存取设备
▪直接存取设备(DASD)
•无须顺序存取
•由地址直接访问所需记录
•有了专门管理数据的软件,一般称为文件系统
▪文件存储空间的管理
▪目录管理
▪文件读写管理
▪文件保护
▪向用户提供操作接口
❑特点
▪数据以文件的形式长期存储于外部存储器
▪系统提供一定的数据管理功能
•存取方法(索引文件、链接文件、直接存取文件、倒排文件等)
•支持对文件的添加、查询、删除等基本操作,用户程序不必考虑物理细节
•数据的存取基本上以记录为单位
▪数据是面向应用的
•一个数据文件对应一个或几个用户程序
▪数据与程序有一定的独立性
•文件的逻辑结构与存储结构有所区别,由系统进行转换,数据在存储上的改变不一定反映在程序上
❑三个缺陷
▪数据冗余
•数据面向应用:
即使不同应用程序所需要的数据有部分相同时,也必须建立各自的文件,而不能共享相同的数据。
•数据孤立:
数据分散管理,许多文件,许多数据格式。
▪数据不一致
•由于数据存在很多副本,给数据的修改与维护带来了困难,容易造成数据的不一致性文件系统的出现并没有从根本上改变数据与程序紧密结合的状况,数据的逻辑结构改变则必须修改应用程序。
▪数据之间的联系弱
•数据分散管理,文件类型多,数据格式多。
1.1.3数据库系统阶段
采用数据模型表示复杂的数据结构
数据冗余度小
有较高的数据独立性
为用户提供方便的用户接口
用户可以使用查询语言或终端命令操作数据库,也可以使用程序的方式来操作数据库。
用户接口一般都是通用接口,不同的编程语言可以使用相同的用户接口。
1.1.4高级数据库系统阶段
1.2数据库系统基本概念
1.2.1基本概念
1.数据
•数据(Data)是数据库中存储的基本对象。
•可以将其定义为:
描述事物的符号记录。
描述事物的符号很多,可以是数字、文字,也可以是图形、声音等信息,它们都可以经过数字化后存入计算机。
2.数据库
•数据库(DataBase,DB)是长期储存在计算机内的、有组织的、可共享的数据集合。
•数据库中的数据按一定的数据模型组织、描述和储存,并且可被各种用户共享。
3.数据库管理系统
•数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
它主要包括四个方面的功能:
(1)数据定义功能。
(2)数据操纵功能。
(3)数据库的运行管理。
(4)数据库的建立和维护功能。
4.数据库系统
•数据库系统(DataBaseSystem,DBS)是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统、支持数据库运行的硬件、应用系统、数据库管理员(DBA,DataBaseAdministrator)和用户构成。
•数据库各个组成部分及其相互关系如图1.1所示。
1.2.2数据库系统应用实例
1.学校学生管理信息系统
•最典型的数据内容有:
Ø学生基本信息:
学号、姓名、性别、年龄、系别等;
Ø学生人事记录:
家庭出身、籍贯、政治面貌等;
Ø学生学籍记录:
日期、地点、学历等;
Ø学生选课记录:
课程号、学号、学分等。
2.银行业务系统
•信用卡管理系统中,需要管理的典型数据包括:
Ø客户基本信息:
身份证号码、姓名、通讯地址、邮编、电话等;
Ø信用卡基本信息:
卡号、账号、账户余额、交易种类、交易金额、交易日期等;
Ø客户和卡的关联:
身份证号、账号等。
3.旅游管理系统
•数据库系统在旅游管理系统中的应用,包括的典型数据有:
Ø地域信息:
地域编号、地域名称、地域类型;
Ø旅游线路信息:
线路编号、线路名称、所在地域编号、行程天数、报价、日期、景点信息、
Ø购物信息、适合人群等;
Ø旅客预订信息:
预订编号、路线编号、出发日期、人数、报名人姓名、单位、通信地址、
Ø邮编、电话、身份证号等。
4.网上论坛
•数据库系统在网上论坛的应用中,包括的典型数据有:
Ø用户信息:
用户ID号、用户名、密码、用户姓名、电子邮箱等;
Ø论坛留言信息:
留言ID号、留言标题、留言内容、留言人用户名、创建回复的日期和时间、
Ø点击数等。
•数据库在这些应用系统中的作用主要包括:
(1)定义数据库架构。
(2)对各种数据进行管理。
(3)执行数据库的操纵功能。
(4)控制多用户的访问。
1.3数据库系统结构
1.3.1数据库系统的外部体系结构
•1.单用户结构
•2.主从式结构
•3.分布式结构
•4.客户机/服务器结构
•5.浏览器/服务器结构
1.单用户结构
•单用户结构的数据库系统通常称为桌面型数据库管理系统,基本上实现了DBMS应该具备的功能。
•其特点是整个数据库系统包括操作系统、DBMS、应用程序和数据库等都安装在一台计算机上,由一个用户独占,不同机器间不能共享数据,容易造成数据大量冗余,主要适合于个人计算机用户,其体系结构如图1.5所示。
2.主从式结构
•主从式结构的数据库系统是一种采用大型主机和终端结合的系统,这种结构是将操作系统、应用程序和数据库系统等数据和资源放在主机上,事务由主机完成,终端只是作为一种输入/输出设备,可以共享主机的数据。
•优点是简单,数据易于管理和维护,缺点是可靠性不够高。
3.分布式结构
•分布式结构的数据库系统是指数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同结点上。
分布式数据库系统由多台计算机组成,每台计算机都配有各自的本地数据库。
•优点是体系结构灵活,经济性能好。
其缺点是数据的分散存放给数据的处理、管理与维护带来困难;经常访问远程数据时,系统效率会明显地受到网络传输的制约。
•分布式结构数据库体系结构如图1.7所示。
4.客户机/服务器结构
•客户机/服务器(Client/Server,C/S)结构是网络中某个(些)结点上的计算机专门用于执行DBMS功能,称为服务器。
其他结点上的计算机安装DBMS的外围应用开发工具以及用户的应用系统,称为客户机。
客户机提出请求,服务器对客户机的请求做出回应。
•优点是不需要将大量数据在网络上传输,减少了网络的数据传输量,提高了系统的性能、吞吐量和负载能力。
数据库更加开放,可移植性高。
•缺点如系统安装复杂,工作量大;应用维护困难,难于保密,造成安全性差。
•客户机/服务器结构也可分为集中的和分布的。
集中的服务器结构只有一台数据库服务器,多台客户机,其体系结构如图1.8所示。
分布的服务器结构在网络中有多台数据库服务器,它是客户机/服务器与分布式数据库的结合,其体系结构如图1.9所示。
5.浏览器/服务器结构
•浏览器/服务器(Browser/Server,B/S)结构统一用浏览器作为客户端,实现用户的输入/输出。
应用程序的业务逻辑和数据处理都在服务器端安装和运行。
•特点是界面统一,容易为用户所掌握。
减少了系统开发和维护的代价,能够支持数万甚至更多的用户。
这种结构已成为目前最流行的数据库体系结构。
•浏览器/服务器体系结构如图1.10所示。
1.3.2数据库系统的内部体系结构
1.数据库的三级模式结构
•
(1)外模式
•
(2)模式
•(3)内模式
(1)外模式
•外模式又称子模式或用户模式,它是模式的子集,是数据的局部逻辑结构,也是数据库用户看到的数据视图。
•,一个数据库可以有多个外模式,DBMS提供子模式语言(SubschemaDataDescriptionLanguage)来严格定义子模式。
(2)模式
•模式又称逻辑模式或概念模式,它是数据库中全体数据的全局逻辑结构和特征的描述,也是所有用户的公共数据视图。
•一个数据库只有一个模式。
DBMS提供模式描述语言(DataDescriptionLanguage)来严格定义模式。
(3)内模式
•内模式又称存储模式,它是数据在数据库中的内部表示,即数据的物理结构和存储方式的描述。
•一个数据库只有一个内模式。
DBMS提供内模式描述语言(InternalSchemaDataDescriptionLanguage)来严格定义内模式。
•图1.12所示为三级模式结构的一个具体实例。
2.数据库的二级映像功能
•
(1)外模式/模式映像
•
(2)模式/内模式映像
(1)外模式/模式映像
•对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系。
•当模式改变时,由数据库管理员对各个外模式/模式映像作相应的改变,可以使外模式保持不变。
应用程序是依据数据的外模式编写的,从而应用程序可以不必修改,保证了数据与程序的逻辑独立性。
(2)模式/内模式映像
•模式/内模式映像是唯一的,它定义了数据库的全局逻辑结构与存储结构之间的对应关系。
•当数据库的存储结构改变时,如数据存储位置或存储组织方式发生改变时,由数据库管理员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必修改。
保证了数据与程序的物理独立性。
•数据库三级模式结构是数据管理的结构框架,依照这种框架组织的数据是数据库的具体内容。
•在进行数据库的设计时,应该首先确定数据库的模式,即全局逻辑结构。
•内模式依赖于它的全局逻辑结构,但独立于外模式,在设计时应考虑到实现较好的时间与空间效率。
•外模式是面向具体应用程序的,它定义在模式之上,但独立于内模式和存储设备。
在设计外模式时,应充分考虑应用需求,注意应用的可扩充性。
•数据库的二级映像功能保证了数据库外模式的稳定性,从而从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则一般不需要进行修改。
1.4数据库技术发展新趋势
•主要集中在以下几个领域:
(1)关系数据库的理论与技术。
(2)分布式数据库的研究。
(3)知识库与演绎数据库的研究。
(4)数据库设计及应用。
作业:
1、2、3、6、7、8
1.2数据描述
Ø在数据处理过程中数据描述涉及到以下三个方面:
v概念设计中的数据描述
v逻辑设计中的数据描述
v物理介质的数据描述
1.2.1概念设计中的数据描述
Ø数据库的概念设计是根据用户的需求设计数据库的概念结构,一般有以下几个部分需要考虑:
v实体:
现实世界中客观存在的事物。
v实体集:
具有相同属性的实体的集合。
v属性:
实体的特征。
v实体标识符:
能够唯一的确定一个实体的属性。
1.2.2逻辑设计中的数据描述
❑逻辑设计是根据概念设计得到的概念结构来进行数据库的逻辑结构设计。
▪字段:
用于表示实体的属性,每一个属性可以对应一个字段。
▪记录:
字段的集合称为记录。
每一个记录代表一个实体。
▪文件:
同一类记录的集合组成一个文件。
文件用于描述实体集。
▪关键码:
能够唯一标识文件中每一条记录的字段或字段集。
对应于实体标识符。
1.2.3物理介质中的数据描述
Ø物理介质中的数据描述指的是数据在计算机中的存储形式,包括以下一些信息:
▪位(Bit)
▪字节(Byte)
▪字(Word)
▪块(Block)
▪桶(Bucket)
▪卷(Volume)
1.2.4数据联系的描述
现实世界中的事物存在着联系,数据库中在存储信息时必须反映这种联系,也就是说由现实事物抽象出来的实体不是单独存在的,而是存在者必然的联系。
联系的定义:
联系是实体之间的相互关系,与一个联系有关的实体集个数,称为联系的元数。
二元联系的三种类型
▪1∶1联系——实体集E1中的每一个实体至多和E2中的一个实体有联系,反之亦然。
▪1∶N联系——实体集E1中的每一个实体与E2中任意个实体有联系,而E2中每个实体至多和E1中的一个实体有联系。
▪M∶N联系——实体集E1中的每一个实体与E2中任意个实体有联系,反之亦然。
1.3数据模型
1.3.1数据模型的定义
数据模型是能够表示实体模型和实体之间联系的模型。
数据模型包括两种:
一种是独立于计算机系统的数据模型;另一种是直接面向数据库逻辑结构的数据模型。
前者最著名的有实体联系模型;后者有层次模型、网状模型、关系模型。
以及目前正在研究的面向对象的数据模型。
本节介绍第一种中的实体联系模型和第二种中的关系模型。
1.3.2数据模型的三要素
v数据结构
数据结构是指对实体类型和实体之间联系的表达和实现。
v数据操作
数据操作是指对数据库的查询、修改、删除和插入等操作。
v数据完整性约束
数据完整性约束定义了数据及其联系应该具有的制约和依赖规则。
1.3.3概念数据模型:
实体联系模型
实体联系模型简称为E-R模型,该模型直接从现实世界中抽象出实体类型和实体之间的联系,然后用实体联系图(E-R图)表示数据模型。
E-R图由以下一些部分组成:
▪矩形框:
表示实体类型。
▪菱形框:
表示联系类型。
▪椭圆形框:
表示实体类型和联系类型的属性。
▪连线:
实体与属性之间,联系与属性之间用直线连接;联系类型与其涉及的实体类型用直线连接,并标注联系的类型。
1.3.4结构数据模型:
关系模型
关系模型的主要特点是以二维表的形式来表达实体集。
它是由若干个关系模式组成的集合。
二维表格简单易懂,用户只需要使用简单的查询语句就可以对数据库进行操作,并不涉及存储结构、访问技术等细节。
对关系的理论和实验研究集中于20世纪70年代,80年代初形成产品,并很快得到了广泛的应用和普及,并最终取代基于层次模型、网状模型的数据库而成为商用数据库系统的主流。
关系数据库是本课程介绍的主要内容。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第1章 数据库技术及应用 数据库技术 应用