多媒体课件.docx
- 文档编号:10866577
- 上传时间:2023-02-23
- 格式:DOCX
- 页数:40
- 大小:39.77KB
多媒体课件.docx
《多媒体课件.docx》由会员分享,可在线阅读,更多相关《多媒体课件.docx(40页珍藏版)》请在冰豆网上搜索。
多媒体课件
第6章
数据库技术与Access2003
本章内容
6.1数据库技术基础
6.2数据库设计
6.3数据库管理系统
6.4数据库管理系统Access2003
6.1数据库技术基础
6.1.1数据库的基本概念
6.1.2数据库管理技术的发展
6.1.3数据库系统的组成
6.1.4数据模型
6.1.5关系数据库
返回
6.1.1数据库的基本概念
1.数据
数据是指存储在某一种媒体上能够识别的物理符号。
数据的概念包括两个方面:
其一是描述事物特性的数据内容;其二是存储在某一种媒体上的数据形式。
2.数据处理
数据处理是指对各种形式的数据进行收集、存储、加工和传播的一系列活动的总和。
3.数据库
数据库是长期存放在计算机内的、有组织的、可以表现为多种形式的可共享的数据集合。
6.1.1数据库的基本概念
4.数据库管理系统
数据库管理系统(DBMS)是对数据库进行管理的系统软件,它的职能是有效地组织和存储数据,获取和管理数据,接受和完成用户提出的访问数据的各种请求。
5.数据库系统
数据库系统是指拥有数据库技术支持的计算机系统,它可以实现有组织地、动态地存储大量相关数据,提供数据处理和信息资源共享服务。
6.1.2数据库管理技术的发展
数据管理技术的发展大致经历了人工管理、文件系统和数据库系统三个阶段。
目前,数据仓库技术和XML数据库的发展也十分迅速。
1.人工管理阶段
2.文件系统阶段
3.数据库系统阶段
4.数据仓库系统
5.XML数据库
6.1.2数据库管理技术的发展
-----人工管理阶段
20世纪50年代中期以前,计算机主要用于科学计算。
那时的计算机硬件方面,外存只有卡片、纸带及磁带,没有磁盘等直接存取的存储设备;软件方面,只有汇编语言,没有操作系统和高级语言,更没有管理数据的软件;数据处理的方式是批处理。
这些决定了当时的数据管理只能依赖人工来进行。
人工管理阶段的主要特点如下:
(1)数据不进行保存;
(2)没有专门的数据管理软件;
(3)数据面向应用;
(4)只有程序的概念。
人工管理阶段
返回
6.1.2数据库管理技术的发展
-----文件系统阶段
20世纪60年代,随着科学技术的发展,计算机技术有了很大提高,计算机的应用范围也不断扩大,不仅用于科学计算,还大量用于管理。
这时的计算机硬件已经有了磁盘、磁鼓等直接存取的外存设备;软件则有了操作系统、高级语言,操作系统中的文件系统是专门用于数据管理的软件;处理方式不仅有批处理,还增加了联机实时处理。
文件系统阶段
文件系统阶段的主要特点如下:
(1)数据可以长期保存在磁盘上;
(2)文件系统提供了数据与程序之间的存取方法;
(3)数据冗余量大;
(4)文件之间缺乏联系,相对孤立,仍然不能反映客观世界各个事物之间错综复杂的联系。
返回
6.1.2数据库管理技术的发展
-----数据库系统阶段
20世纪60年代末以来,计算机的应用更为广泛,用于数据管理的规模也更为庞大,由此带来数据量的急剧膨胀。
计算机磁盘技术有了很大发展,出现了大容量的磁盘。
在处理方式上,联机实时处理的要求更多。
这种变化促使了数据管理手段的进步,数据库技术应运而生。
数据库系统阶段
数据库系统阶段的主要特点如下:
(1)数据的结构化;
(2)数据共享性好;
(3)数据独立性好;
(4)数据存储粒度小;
(5)为用户提供了友好的接口。
返回
数据管理三个阶段的比较
䦋㌌㏒㧀낈ᖺ琰茞ᓀ㵂Ü
䦋㌌㏒㧀낈ᖺ琰茞ᓀ㵂Ü
人工管理阶段
文件系统阶段
数据库系统阶段
背
景
应用背景
科学计算
科学计算、管理
大规模管理
硬件背景
无直接存取存储设备
磁盘、磁鼓
大容量磁盘
软件背景
无操作系统
有文件系统
有数据库管理系统
处理方式
批处理
联机实时处理、批处理
联机实时处理、分布处理、批处理
特
点
数据的管理者
用户(程序员)
文件系统
数据库管理系统
数据面向的对象
某一应用程序
某一应用
现实世界
数据的共享程度
无共享,冗余度大
共享性差,冗余度大
共享性高,冗余度小
数据的独立性
不独立,完全依赖于程序
独立性差
具有高度的物理独立性和一定的逻辑独立性
数据的结构化
无结构
记录内有结构,整体无结构
整体结构化,用数据模型描述
数据控制能力
应用程序自己控制
应用程序自己控制
由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力
6.1.2数据库管理技术的发展
-----数据仓库系统
数据仓库技术是目前数据处理中发展十分迅速的一个分支。
所谓数据仓库,是对长期数据的存储,这些数据来自于多个异种数据源。
通过数据仓库提供的联机分析处理(OLAP)工具,实现多维数据分析,以便向管理决策层提供支持。
数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对海量信息处理进行支持。
目前数据仓库已经日渐成为数据分析和联机分析处理的重要平台。
数据仓库系统
数据仓库的主要特征如下:
(1)面向主题特性:
围绕某一主题建模和分析;
(2)集成特性:
将多个异种数据源以及事务记录集成在一起;
(3)时变特性:
数据存储从历史的角度提供信息;
(4)非易失特性:
总是物理地独立存放数据。
返回
数据库系统和数据仓库系统的区别
(1)面向的用户不同。
数据库系统面向使用单位的低层人员,用于日常数据的分析和处理;数据仓库系统面向的是使用单位的决策人员,提供决策支持。
(2)数据内容不同。
数据库系统存储和管理的是当前的数据;数据仓库系统存储的是长期积累的历史数据。
(3)数据来源不同。
数据库的数据一般来源于同种数据源,而数据仓库的数据可以来源于多个异种数据源。
(4)数据的操作不同。
数据库系统提供了联机事务处理(OLTP,On-LineTransactionProcessing)系统,而数据仓库系统主要提供了联机分析处理(OLAP,On-LineAnalyticalProcessing)和决策支持系统,实现数据挖掘和知识发现。
返回
6.1.2数据库管理技术的发展
-----XML数据库
XML数据库是一种支持对XML格式文档进行存储和查询等操作的数据管理系统。
在系统中,开发人员可以对数据库中的XML文档进行查询、导出和指定格式的序列化。
XML(ExtensibleMarkupLanguage)即可扩展标记语言,它与HTML一样,都是SGML(StandardGeneralizedMarkupLanguage,标准通用标记语言)。
XML作为一种简单的数据存储语言,仅仅使用一系列简单的标记来描述数据。
虽然XML比二进制数据要占用更多的空间,但XML极其简单,易于掌握和使用,尤其具有跨平台的特性。
6.1.3数据库系统的组成
数据库系统由四部分组成,即硬件系统、系统软件(包括操作系统和数据库管理系统)、数据库应用系统和各类人员。
1.硬件系统
由于一般数据库系统的数据量很大,加之DBMS丰富的强有力的功能使得自身的体积很大,因此,整个数据库系统对硬件资源提出了较高的要求。
2.系统软件
系统软件主要包括操作系统、数据库管理系统、与数据库接口的高级语言及其编译系统,以及以DBMS为核心的应用程序开发工具。
3.数据库应用系统
数据库应用系统是为特定应用开发的数据库应用软件。
4.各类人员
参与分析、设计、管理、维护和使用数据库的人员均是数据库系统的组成部分。
这些人员包括数据库管理员、系统分析员、应用程序员和最终用户。
6.1.4数据模型
数据库是企业或组织所涉及的数据的提取和综合,它不仅反映数据本身,而且反映数据之间的联系。
数据库用数据模型对现实世界进行抽象,现有的数据库系统均是基于某种数据模型的。
数据库中最常见的数据模型有三种,即层次模型、网状模型和关系模型。
6.1.4数据模型
------层次模型
若用图来表示,层次模型是一棵倒立的树。
在数据库中,满足以下两个条件的数据模型称为层次模型:
(1)有且仅有一个结点无父结点,这个结点称为根结点;
(2)其他结点有且仅有一个父结点。
在层次模型中,结点层次从根开始定义,根为第一层,根的子结点为第二层,根为其子结点的父结点,同一父结点的子结点称为兄弟结点,没有子结点的结点称为叶结点。
层次模型
下图是一个抽象层次模型,R1为根结点;R2和R3为兄弟结点,并且是R1的子结点;R4和R5为兄弟结点,并且是R2的子结点;R3、R4和R5为叶结点。
6.1.4数据模型
------网状模型
若用图来表示,网状模型是一个网络。
在数据库中,满足以下两个条件之一的数据模型称为网状模型。
(1)允许一个以上的结点无父结点;
(2)允许结点可以有多于一个的父结点。
由于在网状模型中子结点与父结点的联系不是唯一的,所以要为每个联系命名,并指出与该联系有关的父结点和子结点。
网状模型允许一个以上的结点无父结点或某一个结点有一个以上的父结点,从而构成了比层次结构复杂的网状结构。
网状模型
下图是一个抽象网状模型,R1与R2之间的联系被命名为L1,R1与R4之间的联系被命名为L2,R3与R4之间的联系被命名为L3,R4与R5之间的联系被命名为L4,R2与R5之间的联系被命名为L5。
R1为R2和R4的父结点,R3也是R4的父结点。
R1和R3没有父结点。
6.1.4数据模型
------关系模型
关系模型把世界看作是由实体(Entity)和联系(Relationship)构成的。
所谓联系就是指实体之间的关系,即实体之间的对应关系。
联系可以分为三种:
(1)一对一的联系。
如:
一个班级只有一个班长,一个班长只属于一个班级,班长和班级之间为一对一的联系。
(2)一对多的联系。
如:
相同性别的人有许多个,一个人只有一种性别,性别与人之间为一对多的联系。
(3)多对多的联系。
如:
一个人可以选多门课,一门课可以被很多人选,人与课程之间是多对多的联系。
通过联系就可以用一个实体的信息来查找另一个实体的信息。
关系模型把所有的数据都组织到表中。
表是由行和列组成的,反映了现实世界中的事实和值。
关系模型
满足下列条件的二维表,在关系模型中,称为关系。
(1)每一列中的分量是类型相同的数据;
(2)列的顺序可以是任意的;
(3)行的顺序可以是任意的;
(4)表中的分量是不可再分割的最小数据项,即表中不允许有子表;
(5)表中的任意两行不能完全相同。
关系模型
如下面给出的“学生基本情况表”便是一个关系:
学号
姓名
性别
出生日期
入学成绩
0802011001
张莉
女
1989-10-01
540
0802011002
董源
男
1988-01-25
576
0802011003
雷晓亮
男
1990-10-06
601
0802011004
刘萌
女
1987-08-26
556
0802011005
李彬
男
1991-06-14
612
关系模型
层次数据库是数据库系统的先驱,而网状数据库则为数据库在概念、方法、技术上的发展奠定了基础,它们是数据库技术研究最早的两种数据库,而且也曾得到广泛的应用。
但是,这两种数据库管理系统存在着结构比较复杂、用户不易掌握、数据存取操作必须按照模型结构中已定义好的存取路径进行、操作比较复杂等缺点,这就限制了这两种数据库管理系统的发展。
关系数据库以其数学理论基础完善、使用简单灵活、数据独立性强等特点,而被公认为是最有前途的一种数据库管理系统。
6.1.5关系数据库
1.关系数据库的基本概念
(1)关系:
一个关系就是一张二维表,每个关系有一个关系名。
在计算机中,关系的数据存储在文件中,在Access中,一个关系就是数据库文件中的一个表对象。
(2)属性:
二维表中垂直方向的列称为属性,有时也叫做一个字段。
(3)域:
一个属性的取值范围叫做一个域。
(4)元组:
二维表中水平方向的行称为元组,有时也叫做一条记录。
(5)码:
又称为关键字。
二维表中的某个属性或属性组,若它的值唯一地标识了一个元组,则称该属性或属性组为候选码。
若一个关系有多个候选码,则选定其中一个为主码,也称之为主键。
(6)分量:
元组中的一个属性值叫做元组的一个分量。
(7)关系模式:
是对关系的描述,它包括关系名、组成该关系的属性名、属性到域的映象。
通常简记为:
关系名(属性名1,属性名2,…,属性名n)。
关系数据库
2.关系运算
对关系数据库进行查询时,若要找到用户关心的数据,就需要对关系进行一定的关系运算。
关系运算有两种:
一种是传统的集合运算(并、差、交、广义笛卡儿积等);另一种是专门的关系运算(选择、投影、连接)。
传统的集合运算不仅涉及关系的水平方向(即二维表的行),而且涉及关系的垂直方向(即二维表的列)。
关系运算的操作对象是关系,运算的结果仍为关系。
专门的关系运算包括:
(1)选择:
选择运算即在关系中选择满足指定条件的元组。
(2)投影:
投影运算是在关系中选择某些属性(列)。
(3)连接:
连接运算是从两个关系的笛卡儿积中选取属性间满足一定条件的元组。
6.2数据库设计
6.2.1数据库设计概述
6.2.2需求分析
6.2.3概念设计
6.2.4逻辑设计
6.2.5物理设计
返回
6.2.1数据库设计概述
1.数据库设计任务
数据库设计是指根据用户需求研制数据库结构的过程,具体地说,是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能有效地存储数据,满足用户的各种信息处理要求。
具体地说,数据库设计是把现实世界中的数据,根据各种应用处理的要求,加以合理的组织,满足硬件和操作系统的特性,利用已有的DBMS来建立能够实现系统目标的数据库。
返回
数据库设计概述
2.数据库设计的阶段
一般来说,数据库的设计过程大致可分为五个阶段:
(1)需求分析:
调查和分析用户的业务活动和数据的使用情况,弄清所用数据的种类、范围、数量以及它们在业务活动中交流的情况,确定用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约。
(2)概念设计:
针对用户要求描述的现实世界(可能是一个工厂、一个商场或者一个学校等),通过对其中数据的分类、聚集和概括,建立抽象的概念数据模型。
(3)逻辑设计:
将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。
与此同时,可能还需要为各种数据处理应用领域产生相应的逻辑子模式。
这一步设计的结果就是所谓的“逻辑数据库”。
数据库设计的阶段
(4)物理设计;根据特定数据库管理系统所提供的多种存储结构和存取方法等依赖于具体计算机结构的各项物理设计措施,对具体的应用任务选定最合适的物理存储结构(包括文件类型、索引结构和数据的存放次序、存取方法和存取路径等)。
这一步设计的结果就是所谓的“物理数据库”。
(5)验证设计:
在上述设计的基础上收集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。
一般来说,一个大型数据库的设计过程往往需要经过多次循环反复。
当设计的某步发现问题时,可能就需要返回到前面去进行修改,因此,在做上述数据库设计时就应考虑到今后修改设计的可能性和方便性。
6.2.2需求分析
需求分析是数据库设计的第一步,是设计的基石。
需求分析是否能全面、准确地表达用户要求,将直接影响到后续各阶段的设计,影响到整个数据库设计的可用性和合理性。
1.需求分析的内容和方法
需求分析的目的是获取用户的信息要求、处理要求、安全性要求和完整性要求。
需求分析阶段的任务一般分以下步骤:
(1)现行系统调研;
(2)业务及需求分析;
(3)综合、调整;
(4)编写需求分析报告,以作为下一阶段设计的依据。
需求分析
2.用户要求的描述和分析
1)数据流图
数据流图(DFD,DataFlowDiagram)是结构化分析方法(SA,StructuredAnalysis)的工具之一,它描述数据处理过程,以图形化方式刻画数据流从输入到输出的变换过程。
任何一个系统都可以抽象为如下图所示的情况。
返回
需求分析
2)数据字典
数据字典(DD,DataDictionary)是对系统中数据的详尽描述,是各类数据属性的清单。
对数据库设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结果。
数据字典是各类数据描述的集合,通常包括以下几个部分:
(1)数据项:
是数据的最小单位。
(2)数据结构:
是若干数据项有意义的集合。
(3)数据流:
可以是数据项,也可以是数据结构。
(4)数据存储:
处理过程中存取的数据。
6.2.3概念设计
概念设计是对数据的抽象和分析,它以对信息要求和处理要求的初步分析为基础,以数据流图和数据字典提供的信息作为输入,运用信息模型工具,发挥开发设计人员的综合抽象能力建立概念模型。
概念模型独立于数据逻辑结构,也独立于DBMS和计算机系统,是对现实世界有效而自然的模拟。
其主要特点如下:
(1)能充分地反映现实世界;
(2)易于理解;
(3)易于更动;
(4)易于向关系、网状或层次等数据模型转换。
概念设计
1.概念设计的方法
概念设计可采用两种方法,即自顶而下和自底而上,分别如图1和2所示
概念设计
2.数据抽象与局部视图设计
1)E-R模型
E-R方法是实体-联系方法(Entity-RelationshipApproach)的简称,是描述现实世界概念结构模型的有效方法。
用E-R方法建立的概念结构模型称为E-R模型,或称为E-R图,如图3所示。
现实世界的复杂性导致实体联系的复杂性。
表现在E-R图上可以归结为以下几种基本形式:
(1)两个实体集之间的联系,如图a所示
(2)两个以上实体集间的联系,如图b所示。
(3)同一实体集内部各实体之间的联系,如图c所示。
概念设计
2)数据抽象
E-R模型是对现实世界的一种抽象。
所谓抽象是对实际的人、物、事和概念进行人为处理,抽取人们关心的本质特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。
抽象一般有三种,分别是分类、聚集和概括。
返回
概念设计
3)局部视图设计
概念结构设计的第一步就是利用上面介绍的抽象机制对需求分析阶段收集到的数据进行分类、组织(聚集),形成实体、实体的属性,标识实体的码,确定实体之间的联系类型(1∶1,1∶n,n∶m),设计局部视图(也称局部E-R图)。
具体做法是:
(1)选择局部应用;
(2)逐一设计局部E-R图。
返回
概念设计
3.视图集成
设计好各子系统的局部视图后,还需要通过视图集成的方法,将各子系统有机融合起来,综合成一个系统的总视图,如图4所示。
这样由局部到整体设计出的数据库,最终是从系统整体的角度看待和描述数据的,因此数据不再面向某个应用而是面向整个系统。
经过视图集成,使得数据库能被全系统的多个应用共享使用。
概念设计
1)合并
局部E-R图中语法和语义都相同的概念称为对应,局部E-R图之间的不一致称为冲突。
合并局部E-R图就是尽量合并对应的部分,保留特殊的部分,着重解决冲突的部分。
各局部E-R图面向不同的局部应用,而通常由不同开发设计人员进行局部E-R图设计,因此,各个局部E-R图间的冲突是难免的。
一般来讲,冲突分为命名冲突、属性冲突和结构冲突。
2)消除冗余
冗余包括冗余数据和实体间冗余的联系。
冗余数据指可由其他数据导出的数据;冗余联系是指可由其他联系导出的联系。
冗余数据和冗余联系会破坏数据库的完整性,增加数据库管理的困难,应该消除。
注意:
但并非所有的冗余都应去掉,对于访问频率高的冗余数据应适当保留,同时加强数据完整性约束,如设计触发器等。
消除冗余后得到基本E-R图。
6.2.4逻辑设计
逻辑设计是在数据库概念设计的基础上,将概念结构设计阶段得到的独立于DBMS和计算机系统的概念模型转换成特定DBMS所支持的数据模型。
E-R图向关系模型的转换:
E-R图由实体、联系和属性组成,E-R图向关系模型的转换就是将实体、联系、属性转换为关系模式。
转换原则如下:
1)实体转换为关系模型
用关系模型表示实体是很直接的,实体的名称就是关系的名称,实体的属性就是关系的属性,实体的主键就是关系的主键。
2)联系转换为关系模型
(1)一对一联系的转换:
若实体间的联系是1∶1,则选择两个实体类型转换成的关系模式中的任意一个关系模式,在其属性中加入另一个关系模式的键和联系类型的属性。
(2)一对多联系的转换:
若实体间的联系是1∶n,则可以在“n”端实体类型转换成的关系模式中,加入“1”端实体类型的键和联系类型的属性。
(3)多对多联系的转换:
若实体间的联系是m∶n,则可以把联系类型也转换成关系模式。
6.2.5物理设计
物理设计是以逻辑设计结果作为输入,结合DBMS特征与存储设备特性设计出适合应用环境的物理结构。
数据库物理结构是数据库在物理设备上的存储结构和存取方法。
数据库物理设计的目的是提高系统处理效率,充分利用计算机的存储空间。
一般来讲,数据库物理设计分为两步,即数据库物理设计和性能评价。
物理设计
1.数据库物理设计
数据库物理设计主要是确定文件组织、分块技术、缓冲区大小及管理方式、数据在存储器上的分布等。
1)数据簇集设计
数据簇集就是把有关的元组集中在一个物理块内或物理上相邻的区域,以提高访问某些数据的速度。
数据簇集建立以后,簇集键相同的元组存放在一起,因而簇集键不必在每个元组中重复存储,只需在一组中存储一次即可,因此可以节约一些存储空间。
簇集键可以是单属性的,也可以是复合的。
簇集对于某些特定的应用可以明显地提高性能。
一般来说,用户应用满足以下条件时考虑创建簇集。
(1)通过簇集键进行访问或连接是该关系的主要应用,与簇集无关的其他访问很少或是次要的。
(2)对应每个簇集键值的平均元组既不太少,也不太多。
(3)簇集键的值相对稳定(更新、插入、删除操作少),以减少修改簇集键值所引起的维护开销。
(4)对查询某一范围的值,最好在相关属性上建立簇集索引。
2)索引的选择
索引是为了加速对表中数据进行检索而创建的一种分散存储结构。
索引是表的关键字,它提供了指向表中记录行的指针。
合理建立索引可以提高数据检索速度,加速关系连接,强制操作的唯一性。
一般来说,建立索引需考虑以下原则:
(1)考虑建立索引的属性:
①主关键字。
②连接中频繁使用的属性。
(2)不考虑建立索引的属性:
①很少或从来不在查询中出现的属性。
②属性值很少的属性。
③小表(记录很少的表)。
④经常更新的属性或表。
⑤属性值分布不均,在几个值上很集中。
⑥过长的属性。
物理设计
2.评价物理结构
数据库物理设计可能有多个方案,衡量一个物理设计的优劣,可以从存储空间、响应时间、维护代价等方面综合评定。
存储空间利用率、存取时间和维护代价等常常
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 课件