教案1SQL Server 数据库原理及应用微课视频版胡艳菊清华大学出版社.docx
- 文档编号:8278315
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:22
- 大小:34.89KB
教案1SQL Server 数据库原理及应用微课视频版胡艳菊清华大学出版社.docx
《教案1SQL Server 数据库原理及应用微课视频版胡艳菊清华大学出版社.docx》由会员分享,可在线阅读,更多相关《教案1SQL Server 数据库原理及应用微课视频版胡艳菊清华大学出版社.docx(22页珍藏版)》请在冰豆网上搜索。
教案1SQLServer数据库原理及应用微课视频版胡艳菊清华大学出版社
《数据库原理与应用》教案
第一章复杂数据库设计与数据库管理软件的实现
授课教师:
胡艳菊
课时:
5小时
●本章主要目的
⏹了解数据库技术的发展
⏹理解数据模型概念
⏹掌握数据库系统结构
⏹了解数据库系统的功能和工作过程
●本章重点
⏹概念模型理论
⏹数据模型理论
⏹数据库系统结构和功能
●本章难点
⏹概念模型理论
⏹数据模型理论
⏹数据库系统结构和功能
1.整体思路
[思路梗概]
引出[数据库]这个名词——让学生举例生活中哪些地方使用数据库(体现为什么要学习这门课程)——介绍本门课程教授的主要内容(关系型数据库和SQL语言两部分),并体现重点章节。
[思路详述]
通过C语言的学习,我们已经建立了编程思想。
要想让我们编写的程序能够处理数据,用什么来实现?
——变量。
但变量有个缺点,是什么呢?
数据都放到内存中,当程序退出就不存在了。
所以在C大作业中,用文件来存储。
但对于文件中的数据,如果只让一个人看其中的一部分,另一个人看另一部分,没办法做到,让多个人同时向同一文件中输入数据并保存,也实现不了。
随着需求的不断提高,需要一门新技术来解决问题——数据库。
至于这个名词大家可能都听过,尽管不太了解到底什么。
现在哪位同学能举出生活中使用到数据库的地方。
(银行、售票、超市、Internet等等)可以说生活中离不开数据库,所以我们现在开始学习S1的第三门课程《关系型数据库及SQL语言》。
从名字上可以看出这门课程讲授两方面内容——关系型数据库和SQL语言。
共分六章讲解,每章题目在幻灯片上列出。
关系型数据库讲ACCESS本地库,SQLSERVER网络库;用三章(四到六章)讲SQL语言。
我们在学这门课过程中都是在数据库管理系统的环境下直接操作数据库的,有些同学觉得简单,觉得学它没什么用。
那时因为你知道了,所以简单。
虽然有很多软件都使用数据库,当我们去银行存取款时,有哪个操作员是打开数据库直接操作的?
我们现在学主要是从一个程序员在做项目开发角度来学的,在开发项目时有时会动态建库建表,就需要我们将要学习的SQL语言。
而用户只需直接操作界面,不用管数据库的表结构等细节问题。
数据库通常与可视化编程工具联合使用,如VB。
S1毕设做一个与SQLServer数据库连接的软件。
2.课程知识点讲解:
信息、数据与数据处理
引言:
数据库是计算机技术发展的产物
数据库是计算机应用的基础
SQLServer
信息:
信息是关于现实世界事物的存在方式或运动状态的反映的综合,具体说是一种被加工为特定形式的数据,但这种数据形式对接收者来说是有意义的,而且对当前和将来的决策具有明显的或实际的价值。
如“2000年硕士研究生将扩招30%”,对接受者有意义,使接受者据此作出决策。
信息的特征:
●信息源于物质和能量,它不可能脱离物质而存在,信息的传递需要物质载体,信息的获取和传递要消耗能量。
●如信息可以通过报纸、电台、电视、计算机网络进行传递。
●信息是可以感知的,人类对客观事物的感知,可以通过感觉器官,也可以通过各种仪器仪表和传感器等,不同的信息源有不同的感知形式。
●如报纸上刊登的信息通过视觉器官感知,电台中广播的信息通过听觉器官感知。
●信息是可存储、加工、传递和再生的。
动物用大脑存储信息,叫做记忆。
计算机存储器、录音、录像等技术的发展,进一步扩大了信息存储的范围。
借助计算机,还可对收集到的信息进行取舍整理。
数据:
●数据是用来记录信息的可识别的符号,是信息的具体表现形式。
数据的表现形式:
●可用多种不同的数据形式表示同一信息,而信息不随数据形式的不同而改变。
●如“2000年硕士研究生将扩招30%”,其中的数据可改为汉字形式“两千年”、“百分之三十”。
●数据的概念在数据处理领域中已大大地拓宽了,其表现形式不仅包括数字和文字,还包括图形、图象、声音等。
这些数据可以记录在纸上,也可记录在各种存储器中。
信息与数据:
●信息与数据的联系
数据是信息的符号表示或载体,信息则是数据的内涵,是对数据的语义解释。
●如上例中的数据2000、30%被赋予了特定的语义,它们就具有了传递信息的功能。
●如:
一幅图像
●数据——彩色位图点阵
●信息——微软产品
数据处理:
●数据处理是将数据转换成信息的过程,包括对数据的收集、存储、加工、检索、传输等一系列活动。
其目的是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据。
●数据是原料,是输入,而信息是产出,是输出结果。
“信息处理”的真正含义应该是为了产生信息而处理数据。
数据处理的四个阶段:
●人工处理阶段(50年代中期以前)
●文件系统阶段(50年代后期---60年代中期)
●数据库系统阶段(60年代后期---70年代中期)
●高级数据库阶段(70年代中期以来)
人工处理阶段:
●背景:
●计算机主要用于科学计算(数据量小、结构简单,如高阶方程、曲线拟和等)。
●外存只有磁带、卡片、纸带等,没有磁盘等直接存取设备。
●没有操作系统,没有数据管理软件,软件只有汇编(用户也用机器指令编码)。
●数据处理的方式基本上是批处理
●特点:
●数据不保存
●应用程序管理数据
●数据面向程序,数据不能共享
●数据不具有独立性
数据的逻辑结构
数据的物理结构
(存储结构
存取方法)
应用逻辑(处理)
应用程序
数据集
应用程序1
应用程序2
应用程序n
数据1
数据2
数据n
…
…
数据和程序是一一对应的,即一组数据只能用于一个程序。
文件系统阶段:
●背景:
●计算机不但用于科学计算,还大量用于管理。
●硬件有了磁盘、磁鼓等直接存取设备。
●在软件方面,出现了高级语言和操作系统
●操作系统中有了专门管理数据的软件,一般称为文件系统。
●特点:
●数据以文件形式长期保存。
按名访问,按纪录存取;
●文件形式多样化(索引文件、链接文件、直接存取文件、倒排文件等);
●一个数据文件对应一个或几个用户程序,还是面向应用的,具有一定的共享性;
●通过文件系统提供存取方法,支持对文件的基本操作(增、删、改、查等),用户程序不必考虑物理细节。
数据的存取基本上以记录为单位;
●数据与程序有一定的独立性,因为数据的逻辑结构与存储结构由文件系统进行转换,数据在存储上的改变不一定反映在程序上。
数据的逻辑结构
应用逻辑(处理)
应用程序1
数据的物理结构
(存储结构
存取方法)
文件系统
文件1
文件2
文件n
数据的逻辑结构
应用逻辑(处理)
应用程序n
文件系统
应用程序1
应用程序2
应用程序n
数据1
数据2
数据n
通过文件系统,程序和数据文件之间可以组合,即一个程序可以使用多个数据文件,多个程序也可以共享同一个数据文件。
文件系统阶段的缺点:
●数据冗余
●不一致性
●数据孤立
●数据独立性差
●并发访问异常
数据库系统阶段:
●背景:
●60年代后期,计算机应用于管理的规模更加庞大,数据量急剧增加;
●硬件方面出现了大容量磁盘,使计算机联机存取大量数据成为可能;
●软件价格上升,硬件价格下降,开发和维护成本增加,其中维护的成本更高。
●文件系统的数据管理方法已无法适应开发应用系统的的需要。
●为解决多用户、多个应用程序共享数据的需求,出现了统一管理数据的专门软件系统(数据库管理系统)。
●数据库观点:
数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象。
应用逻辑(处理)
应用程序1
数据的逻辑结构
数据的物理结构
(存储结构
存取方法)
数据库
管理系统
应用逻辑(处理)
应用程序n
数据库管理系统(DBMS)操纵数据库中的数据,对数据库进行统一控制
高级数据库阶段:
20世纪70年代中期以来,随着计算机技术和应用的不断发展,数据处理的规模也迅速扩大,在常规数据库系统技术应用的基础上,又出现了一些新的数据处理方式—高级数据库技术。
主要有:
并行数据库系统、分布式数据库系统、面向对象数据库系统、数据仓库、多媒体数据库、智能型知识数据库等。
数据抽象:
●信息世界:
●数据库系统是面向计算机的,而应用是面向现实世界的,两个世界存在着很大差异,要直接将现实世界中的语义映射到计算机世界是十分困难的,因此引入一个信息世界作为现实世界通向计算机实现的桥梁。
●一方面,信息世界是对现实世界的抽象,从纷繁的现实世界中抽取出能反映现实本质的概念和基本关系;另一方面,信息世界中的概念和关系,要以一定的方式映射到计算机世界中去,在计算机系统上最终实现。
信息世界起到了承上启下的作用。
现实世界
信息世界概念模型
机器世界
DBMS支持的数据模型
概念化
形式化
数据模型:
●模型是现实世界特征的模拟和抽象。
数据模型则是现实世界数据特征的抽象,是数据库技术的核心。
●数据模型应满足三个方面的要求:
●能比较真实地模拟现实世界;
●容易为人理解;
●便于在计算机上实现。
数据模型的组成要素:
●数据模型是实现数据抽象的主要工具。
它的三个组成要素是:
●数据结构
●描述系统的静态特性,即实体对象存储在数据库中的记录型的集合。
包括:
●数据本身:
类型、内容、性质。
如网状模型中的数据项、记录,关系模型中的域、属性,关系等。
●数据之间的联系:
例如网状模型中的系型(SetType)
●在数据库系统中一般按数据结构的类型来命名数据模型。
(层次、网状、关系)
●数据操作
●是对系统动态特性的描述,用于描述施加于数据之上的各种操作,即对数据库中各种对象(型)的实例允许执行的操作的集合,包括操作及操作规则。
主要有检索、更新(插入、删除、修改)两大类操作。
数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。
●数据的约束条件
●数据的约束条件是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。
有“通用的完整性约束条件”和“特定的语义约束条件”之分。
数据模型的分类:
●概念数据模型
●按用户的观点来对数据和信息建模。
用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。
这类模型强调其语义表达能力,概念简单、清晰,易于用户理解。
它是现实世界到信息世界的抽象,是用户与数据库设计人员之间进行交流的语言。
如E-R模型。
●逻辑数据模型
●从计算机实现的观点来对数据建模。
是信息世界中的概念和联系在计算机世界中的表示方法。
一般有严格的形式化定义,以便于在计算机上实现。
如层次模型、网状模型、关系模型、面向对象模型。
●物理数据模型
●从计算机的物理存储角度对数据建模。
是数据在物理设备上的存放方法和表现形式的描述,以实现数据的高效存取。
如索引,HASH文件等等。
实体概念:
●概念模型的几个术语
●实体(Entity)指客观存在并相互区分的事物;
●属性(Attribute)实体所具有的特性;
●键(Key)能唯一标识一个实体的属性及属性值;
●实体型(EntityType)用实体名及其属性名集合来抽象和刻画同类实体;如学生(学号,…)
●实体集(EntitySet)具有相同属性(或特性)的实体的集合;
●联系(Relationship)实体(型)内部或实体(型)之间的联系
●实体联系的两种形式:
●实体内部(属性)间的联系;
●实体间的联系。
一般指不同实体集之间的联系
●两实体型之间的联系有
●一对一1:
1如:
班级,班长
●一对多1:
M如:
班级,学生
●多对多M:
N如:
学生,教师
●同一实体集内的各实体间也存在一对一、一对多和多对多的联系。
●实体联系模型(ER模型及EER模型)
●ER(Entity-RelationshipModel)
●EER(ExtendEntity-RelationshipModel)
用简单的图形方式描述现实世界中的数据。
其中信息由实体、实体属性和实体联系来表示:
●实体概念模型的对象,用“矩形”表示;
●实体属性说明实体,用“椭圆”表示;
●实体联系实体类型间有名称的关联,用“菱形”表示。
例:
学生ER模型图和学生选修课程的ER模型图见下面的实例幻灯片。
●特点:
●ER/EER模型能反映实体类型之间的联系;
●ER/EER模型不能直接说明详细的数据结构;
●要设计并实现数据库,必须将ER/EER模型按照某种具体的DBMS的数据模型进行转换。
学生
学号
姓名
性别
出生年月
入学时间
系
学生
课程
选修
学号
姓名
系别
课程名
先修课
成绩
实体
联系
属性
m
n
层次模型:
●用树结构表示实体之间联系的模型叫层次模型。
●树由节点和连线组成,节点代表实体型,连线表示两实体型间的一对多联系。
●树有以下特性:
●每棵树有且仅有一个节点无父节点,此节点称为树的根(Root)。
●树中的其它节点都有且仅有一个父节点。
层次模型的数据操纵与数据完整性约束
●层次模型的数据操纵主要有查询、插入、删除和修改,
●进行插入、删除和修改操作时要满足层次模型的完整性约束条件。
●进行插入操作时,如果没有相应的双亲结点值就不能插入子女结点值;
●进行删除操作时,如果删除双亲结点值,则相应的子女结点值也被同时删除;
●修改操作时,应修改所有相应的记录,以保证数据的一致性。
●优点:
(1)比较简单,只需很少几条命令就能操纵数据库,比较容易使用。
(2)结构清晰,结点间联系简单,只要知道每个结点的双亲结点,就可知道整个模型结构。
现实世界中许多实体间的联系本来就呈现出一种很自然的层次关系,
●如表示行政层次,家族关系很方便。
(3)它提供了良好的数据完整性支持。
●缺点:
(1)不能直接表示两个以上的实体型间的复杂的联系和实体型间的多对多联系,只能通过引入冗余数据或创建虚拟结点的方法来解决,易产生不一致性。
(2)对数据的插入和删除的操作限制太多。
(3)查询子女结点必须通过双亲结点。
●代表产品:
●IBM的IMS数据库,1969年研制成功。
网状模型:
●是一个满足下列条件的有向图:
●可以有一个以上的节点无父节点。
●至少有一个节点有多于一个的父节点(排除树结构)。
科室
医生
病房
病人
●特点:
●表达的联系种类丰富。
●结构复杂。
●DBTG报告:
●1969年,由美国CODASYC(ConferenceOnDataSystemLanguage,数据系统语言协商会)下属的DBTG(DataBaseTaskGroup)组提出,确立了网状数据库系统的概念、方法、技术。
●网状模型的数据操纵与完整性约束:
●网状模型的数据操纵主要包括查询、插入、删除和修改数据。
●插入数据时,允许插入尚未确定双亲结点值的子女结点值,如可增加一名尚未分配到某个教研室的新教师,也可增加一些刚来报到,还未分配宿舍的学生。
●删除数据时,允许只删除双亲结点值,如可删除一个教研室,而该教研室所有教师的信息仍保留在数据库中。
●修改数据时,可直接表示非树形结构,而无需像层次模型那样增加冗余结点,因此,修改操作时只需更新指定记录即可。
●它没有像层次数据库那样有严格的完整性约束条件,只提供一定的完整性约束。
网状模型的优缺点
●网状模型的优点主要有:
(1)能更为直接地描述客观世界,可表示实体间的多种复杂联系。
(2)具有良好的性能和存储效率
●网状模型的缺点主要有
(1)结构复杂,其DDL语言极其复杂。
(2)数据独立性差,由于实体间的联系本质上是通过存取路径表示的,因此应用程序在访问数据时要指定存取路径。
关系模型:
●
用二维表来表示实体及其相互联系
每张二维表称为一个关系(Relation),
其中存放了两种类型的数据:
•实体本身的数据
•实体间的联系是通过不同关系中具有相同的属性名来实现的。
(1)关系(Relation)
●一个关系对应一张二维表,如图1.12的五张表对应五个关系。
(2)元组(Tuple)
●表格中的一行,如S表中的一个学生记录即为一个元组。
(3)属性(Attribute)
●表格中的一列,相当于记录中的一个字段,如S表中有五个属性(学号,姓名,性别,年龄,系别)。
(4)关键字(Key)
●可唯一标识元组的属性或属性集,也称为关系键或主码,如S表中学号可以唯一确定一个学生,为学生关系的主码。
(5)域(Domain)
●属性的取值范围,如年龄的域是(14~40),性别的域是(男,女)。
(6)分量
●每一行对应的列的属性值,即元组中的一个属性值,如学号、姓名、年龄等均是一个分量。
(7)关系模式
●对关系的描述,一般表示为:
关系名(属性1,属性2,……属性n),如:
学生(学号,姓名,性别,年龄,系别)。
●在关系模型中,实体是用关系来表示的,如:
●学生(学号,姓名,性别,年龄,系别)
●课程(课程号,课程名,课时)
●实体间的关系也是用关系来表示的,如:
●学生和课程之间的关系
●选课关系(学号,课程号,成绩)
●数据操纵主要包括查询、插入、删除和修改数据,这些操作必须满足关系的完整性约束条件,即实体完整性、参照完整性和用户定义的完整性。
有关完整性的具体含义将在下一章介绍。
●在非关系模型中,操作对象是单个记录,而关系模型中的数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合;
●用户只要指出“干什么”,而不必详细说明“怎么干”,从而大大地提高了数据的独立性,提高了用户的生产率。
●特征:
●结构单一化
●坚实的数学理论基础
●
关系模型的逻辑结构实际上是二维表,基于关系模型的关系数据库的逻辑结构也是二维表,而这个二维表即是关系。
每个关系(或表)由一组元组组成,每个元组又由若干属性和域构成。
只有两个属性的关系称为二元关系,以此类推,有n个属性的关系称为n元关系。
●优点(与其它模型数据库比较):
●简单,表的概念直观,处理数据效率高。
●描述的一致性,不仅用关系描述实体本身,也用关系描述实体之间的联系。
●数据独立性高,有较好的一致性和良好的保密性。
●可以动态地导出和维护视图。
●数据结构简单,便于了解和维护。
●可以配备多种高级接口。
●关系模型的缺点主要有:
●由于存取路径对用户透明,查询效率往往不如非关系模型,因此,为了提高性能,必须对用户的查询表示进行优化,增加了开发数据库管理系统的负担。
数据库系统(DBS):
●数据库系统(DatabBaseSystem)是指一个计算机存储记录的系统。
即,它是一个计算机系统,该系统的目标是存储信息并支持用户检索和更新所需要的信息。
这里所讨论的信息可以是个人或企业所关心的任何信息,换句话说,它是指任何对个人或组织经营企业的一般处理过程有帮助的数据。
●数据库管理系统(DataBaseManagementSystem)是一个通用的软件系统,由一组计算机程序构成。
它能够对数据库进行有效的管理,并为用户提供了一个软件环境,方便用户使用数据库中的信息。
●数据定义功能
●数据操纵功能
●数据库的运行管理功能
●数据库的建立和维护功能
●所谓数据库(DataBase)是长期储存在计算机内的、有组织的、可共享的数据集合。
数据库中的数据按一定的数据模型组织、存储和描述,由DBMS统一管理,多用户共享。
数据库系统的特点:
●数据结构化。
●文件系统管理中,不同文件的记录型之间没有联系,它仅关心数据项之间的联系;数据库系统则不仅考虑数据项之间的联系,还要考虑记录形之间的联系。
相互间联系是通过存取路径来实现的,这是数据库系统与文件系统的根本区别。
●数据集成与共享,可控冗余度
●数据面向整个系统,而不是面向某一应用,数据集中管理,并可以被多个用户和多个应用程序所共享。
●数据共享可以减少数据冗余,节省存储空间,减少存取时间,并避免数据之间的不相容性和不一致性。
●每个应用选用数据库的一个子集,只要重新选取不同子集或者加上一小部分数据,就可以满足新的应用要求,这就是易扩充性。
●根据应用的需要,可以控制数据的冗余度。
●数据独立性好
●三级结构体系:
用户数据的逻辑结构、整体数据的逻辑结构和数据的物理结构。
●数据与程序相对独立,把数据库的定义和描述从应用程序中分离出去。
描述又是分级的(全局逻辑、局部逻辑、存储),数据的存取由系统管理,用户不必考虑存取路径等细节,从而简化了应用程序。
●数据独立性:
当数据的结构发生变化时,通过系统提供的映象(转换)功能,使应用程序不必改变。
它包括数据的物理独立性和逻辑独立性。
●方便的外部接口
●利用数据库系统提供的查询语言和交互式命令操纵数据库;
●利用高级语言(C,Cobol等)编写程序操纵数据库。
●统一的控制机制。
(并发共享)
●数据的安全性控制(Security)
●保护数据以防止不合法的使用所造成的数据泄露和破坏。
●措施:
用户标识与鉴定,存取控制。
●数据的完整性控制(Integrity)
●数据的正确性、有效性、相容性。
●措施:
完整性约束条件定义和检查。
●并发控制(Concurrency)
●对多用户的并发操作加以控制、协调,防止其互相干扰而得到错误的结果并使数据库完整性遭到破坏。
●措施:
封锁。
●数据库恢复(Recovery)
●将数据库从错误状态恢复到某一已知的正确状态,防止数据丢失和损害,保证数据的正确性。
数据库系统的模式:
●型与值
●型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。
●模式:
●是数据库的框架,是对数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。
模式的一个具体值称为模式的一个实例。
同一个模式可以有很多实例。
模式是相对稳定的,而实例是相对变动的,因为数据库的数据是在不断更新的。
模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
●数据字典
●模式的分级:
●为了提高数据的物理独立性和逻辑独立性,使数据库的用户观点,即用户看到的数据库,与数据库的物理方面,即实际存储的数据库区分开来,数据库系统的模式是分级的。
●数据库系统三级模式结构:
●CODASYL(ConferenceOnDataSystemLanguage,美国数据系统语言协商会)提出模式、外模式、存储模式三级模式的概念。
三级模式之间有两级映象。
数据库
内模式
模式
外模式2
外模式1
外模式3
应用A
应用B
应用C
应用D
应用E
外模式/模式映象
模式/内模式映象
●外模式(Sub-Schema)又称子模式:
●用户的数据视图。
是数据的局部逻辑结构,模式的子集。
●模式(Schema):
●所有用户的公共数据视图。
是数据库中全体数据的全局逻辑结构和特性的描述。
●内模式(StorageSchema)又称存储模式:
●又称存储模式。
数据的物理结构及存储方式。
●外模式/模式映象:
●定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。
当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。
●模式/内模式映象:
●定义数据逻辑结构与存储结构之间的对应关系。
存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。
●数据库系统(DBS)通常由四部分组成:
●数据库DataBase
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教案1SQL Server 数据库原理及应用微课视频版胡艳菊清华大学出版社 教案 SQL 数据库 原理 应用 视频 版胡艳菊 清华大学出版社