大数据管理系统技术.docx
- 文档编号:12713123
- 上传时间:2023-04-21
- 格式:DOCX
- 页数:22
- 大小:349.62KB
大数据管理系统技术.docx
《大数据管理系统技术.docx》由会员分享,可在线阅读,更多相关《大数据管理系统技术.docx(22页珍藏版)》请在冰豆网上搜索。
大数据管理系统技术
信息技术(选修4)数据管理技术复习提纲
概要:
信息技术学科模块4——《数据管理技术》,全书以应用数据管理技术解决问题为主线,按照“分析问题——设计数据库——建立数据库——使用数据库——管理数据库”这一线索呈现学习容。
全书分五章,下面介绍第一章至第五章的主要容:
第一章认识数据管理技术
一、数据管理基本知识
1、数据管理技术的基本概念
数据:
是人类社会的一种重要信息资源,是对现实世界中客观事物的符号。
计算机中的数据分为数值型数据与非数值型数据。
例题:
如商品价格、销售数量等数据是()
A、数值数据B、非数值数据
说明:
数据是信息的符号表示或称为载体。
即为了表达信息(抽象概念),必须使用某种符号,这些符号就叫数据,如字符、图表、图形、图像、声音、视频等都可以称为数据。
信息依赖数据来表达,是数据的涵,是对数据语义的解释。
数据管理:
是指对数据的收集、分类、组织、编码、存储、查询和维护等活动。
数据管理技术:
指与数据管理活动有关的技术。
数据库(DB):
是指按照某种模型组织起来的,可以被用户或应用程序共享的数据的集合。
数据库系统(DBS):
是指采用的数据库技术的完整的计算机系统。
数据库管理系统(DBMS):
是能够建立数据库、维护数据库及管理数据库的一个开发平台。
数据库应用系统:
是应用了数据库的信息系统。
说明:
数据库系统的核心为数据库管理系统,数据库管理系统的核心为数据库(或数据)
例题:
下列软件中,不属于数据库应用系统的是()
A、学籍管理系统B、中考成绩查询系统
C、Linux操作系统D、网络售票系统
例题:
数据库管理系统英文简写是()
A、DBB、DBSC、DBMSD、Access
2、数据管理技术的变迁
数据管理技术经历了人工管理阶段→文件系统阶段→数据库系统阶段。
文件系统阶段与数据库系统阶段的比较如下表:
阶段
独立性
冗余度
共享性
安全性与完整性
文件系统阶段
差
高
差
差
数据库系统阶段
高
低
高
高
说明:
文件系统阶段与数据库系统阶段根本区别在数据的结构化程度高低;
数据库技术的应用领域——主要应用于数据密集型应用的领域。
3、数据管理技术的应用
①利用Windows操作系统管理文件;
②利用常用工具软件管理数据;
③利用数据库应用系统管理数据
说明:
使用数据库应用系统的优势:
①能够存储大量数据;
②管理操作方便、快捷,数据维护简单、安全;
③信息检索准确、迅速、高效;
④数据独立性、共享性、安全性均较高,冗余度低。
二、数据库、数据表、记录、字段、关键字的概念
关系:
二维表在关系数据库中称作关系;
字段:
二维表中的列称为字段;
域:
是属性所有可能取值的集合
值:
是二维表中的一个具体数据项,是数据库中最小的数据单位
关键字(键):
也称作键,是指能标识唯一一条记录的字段。
记录:
二维表中行称为记录,可以用关键字来标识(从第二行开始)。
书号
书名
作者
价格
出版日期
是否借出
20061001
计算机图形学
朱铨
¥10.00
2007-3-22
□
20061002
操作系统
朱铨
¥7.00
2007-3-23
□
20061003
ASP网络编程
朱铨
¥14.00
2007-3-24
□
20061004
现代数学方法选讲
季坚
¥10.00
2007-3-25
□
相关规定:
在同一二维表中不允许有同名字段;
在一二维表中,不应有容完全相同的记录;
关键字字段必须满足①值不能重复;②值不能为空值。
常见的关系数据库管理系统:
Access、Foxpro、DB2、SQLServer、Oracle等。
例题:
某学校“会考信息管理系统”使用了利用Office2000建立的数据库hkinfor.mdb该数据库应用系统的名称是()
A、Access2000B、hkinfor.mdbC、hkinforD、会考信息管理系统
例题:
以下哪一项全不属于数据库管理系统()
①FoxPro②DB2③Access④Excel⑤Oracle⑥Photoshop
A、④⑥B、①②⑥C、①④⑤⑥D、②④⑤⑥
例题:
关系数据库中的“关系”指的就是()
A、联系B、一维表C、二维表D、三维表
第二章数据的分析与建模
一、数据分析与建模
建立数据库的过程:
①数据的收集与分类→②建立实体-联系模型(E-R图)→③将E-R图转化为关系数据模型→④创建数据库(建立空数据库→建立表结构→输入记录数据)
1、数据的收集与分类
数据收集:
对现实系统进行实地调查与分析,收集各种原始凭证,并弄清数据的来龙去脉。
数据的分类:
对收集到的原始数据的基本特征进行分类整理,提取有用的信息
例题:
为开发“会考信息管理系统”而收集到如下所列的数据,其中()是不必要的
①学生②学生照片③班主任④会考科目⑤考试成绩⑥监考人员
A、③④⑤B、③⑥C、④⑤⑥D、②③⑥
2、建立实体-联系模型(E-R图)
三个世界的术语及相关联系
现实世界信息世界(概念模型)机器世界(数据模型)
第一次第二次
抽象抽象
三个世界的术语对照:
现实世界
信息世界
机器世界
对象
实体
记录
特征
属性
字段
(对象)总体
实体集
二维表
关键特征
键
关键字
事物及其联系
概念模型
数据模型
信息世界:
是现实世界在人们头脑中的反映,人的思维将现实世界的数据抽象化和概念化,并用文字符号表示,就形成了信息世界;
概念模型:
是现实世界的具体事物经过人的认识、整理、分类之后在信息世界的表现形式。
机器世界:
又称数据世界,信息世界中的信息经过抽象和组织,以数据形式存储在计算机中,就称为机器世界。
数据模型:
是对现实世界数据特征的抽象表示,通常有严格的定义。
E-R模型:
1976年P.P.S.Chen提出的实体——联系模型,是最著名、最常用的概念模型。
E-R图基本图素:
用矩形框表示实体用菱形框表示实体之间的联系用椭圆形框表示属性
联系:
现实世界中事物之间的联系,到信息世界中反映为部联系(实体集属性之间的联系)与外部联系(实体集与实体集之间的联系)
实体集之间的联系有三种:
一对一联系、一对多联系、多对多联系
建立实体——联系模型的步骤:
①确定实体;→②确定实体的属性→③确定实体之间的联系→④设计出E-R图
例题:
在设计旅游信息数据库的过程中,用E-R图描述的是旅游信息的()
A、关系数据模型B、概念模型C、面向对象模型D、逻辑数据模型
例题:
在机票预定系统中,所出售的机票与实际的座位之间的联系是()
A、一对一联系B、一对多联系C、多对一联系D、多对多联系
例题:
现实世界中的某一对象及其特征抽象到信息世界中分别称为()
A、数据表名字段B、记录字段C、实体属性D、实体集属性
例题:
在E-R图中,利用菱形框表示()
A、实体B、实体集C、属性D、联系
3、将E-R图转换为关系数据模型
概念:
关系数据模型是采用二维表的方式表示实体及实体之间的联系。
常用的数据模型有:
关系模型(二维表)、层次模型(树型结构)、网状模型(网状结构)
将E-R模型转换成关系数据模型按下列步骤完成:
①将每个实体集转换成一个二维表;
②将实体集之间的联系转换成二维表;
③将一对一联系、一对多联系合并到多的一端实体表中,多对多联系表则不合并。
例题:
现有关系:
学生(学号,,选修课程,成绩),为消除数据冗余,至少要分解为()
A、1个表B、2个表C、3个表D、4个表
分析:
该关系包含学生实体、课程实体及所在的联系,因此可分解成下面的三数据表:
学生(学号,);课程(课程号,课程);成绩(学号,课程号,成绩)
例题:
设计数据库时有一关系:
学生(学号,,班级,班主任),为消除数据冗余,至少要分解成()
A、1个表B、2个表C、3个表D、4个表
分析:
该关系包含学生、班主任(班级)实体及所在的联系,分解成下面的三数据表:
学生(学号,);班主任(班级编号,班级,班主任);所在(学号,班级号)
由于学生与班级之间是一对多联系,因此将联系表合并到学生表中:
学生(学号,,班级号);班级(班级编号,班级,班主任)
二、在Access关系数据库管理系统中创建与维护数据库
注意:
在Access数据库管理系统许多操作都要在前一操作的基础上进行的,例如:
未建立数据库则无法建立数据表,建立不符合要求的数据表则可能导致无法建立数据表之间的关系,关系没建立又可能影响查询及统计的结果,因此在学习Access软件的具体操作时切忌求快!
而应按层层递进、稳扎稳打的方式学习!
(一)创建数据库
创建数据库的步骤主要有三步:
创建空数据库→建立数据表结构→输入记录数据
1、创建空数据库的方法P30
①使用“向导”方式创建数据库
②进入ACCESS系统后,利用“文件”菜单下的“新建”
③单击数据库工具栏“新建”按钮
例题:
在E盘下“综合操作题
(一)”文件夹建立“图书管理.mdb”数据库。
说明:
建立空数据库时,就要指定数据库的存储路径及数据库文件名(扩展名为:
.mdb);
2、创建数据表
Ø创建数据表的方法:
①使用设计器创建数据表
②使用向导创建表
③通过输入数据创建表
Ø创建数据表的操作步骤
①定义数据表结构
■确定数据表中的各字段名
■设置各字段属性(字段类型、
字段说明等)
说明:
数据类型参考教材P32
字段属性设置参考教材P33
■确定数据表主键
②输入记录数据
Ø相关规定:
①字段名
■字段名是字段的标识,字段名必须是唯一的,同一数据表中不允许有重复的字段名;
■表中每一个字段必须是简单的数据项,而不是组合的数据项;
■字段名不能以空格开头,中间可包括空格,字段名不为空;
■字段名最多可达64个字符长度,可包括字母、数字、汉字及部分符号等。
②数据类型
■数据类型是指该字段中存放数据的类型,而不是字段名本身的类型。
■ACCESS中提供10种数据类型,默认的数据类型是文本型。
参考教材P32
要求:
掌握文本、数字、日期/时间、货币、自动编号、是/否型数据的具体应用。
■数据表中每一列的数据类型必须是一致的。
③主键:
能唯一标识表中每一条记录的字段或字段组合称为关键字或键。
④设置字段属性:
参考教材P33
例题:
在“图书管理.mdb”数据库中,建立如下所示的“图书”数据表。
书号
书名
作者
价格
出版日期
封面
是否借出
20061001
信息技术
朱铨
电子工业
¥10.00
2007-5-1
位图图像
□
参考设置
字段名
数据类型
字段大小
其他说明
书号
文本
8
设置为主键
书名
文本
12
作者
文本
4
文本
15
价格
货币
长整型
小数位数为2位
出版日期
日期时间型
固定值
封面
OLE对象
固定值
是否借出
是/否
固定值
(二)维护数据库
注意:
在维护数据库时,要灵活运用两种视图(数据表视图、设计视图)完成规定操作。
Ø通常在设计视图下完成的操作有:
添加、重命名、删除字段;修改字段数据类型、字段大小;设置主键及其他设置(查阅方式、有效性规则、默认值)等;
共同点:
有关修改数据表结构的操作。
例题:
在“图书”数据表中,设置“价格”字段的有效性规则为大于等于0且小于等于200。
参考设置:
①选定“图书”表②进入“设计视图”③选定“价格字段”④在“字段属性”中的“有效性规则”按右图设置并保存。
例题:
将“图书”数据表中“”字段设置为自行输入的查阅方式,可选的值有:
电子工业、教育、教育。
参考设置:
①选定“图书”表
②进入“设计视图”
③选定“”字段
④在“字段属性”中的“查阅”方式后,依次按上图设置,并保存表结构。
最终效果:
如右图所示
注意:
在Access中,要掌握不同数据类型的表示:
①数字:
直接书写,例如200
②文本:
在文本数据前后加英文的双引号,例如”电子工业”
③日期:
在日期数据前后加井字号,例如#2007-5-1#
例题:
将“图书”数据表中的“书号”字段数据类型更改为“数字”,其余按默认设置。
参考设置:
①选定“图书”数据表
②进入“设计视图”
③选定“书号”字段
④在“字段属性”中的数据类型
设置为“数字”并保存。
注意:
若是修改字段的数据类型或字段大小时,可能会引起数据表中的数据丢失。
Ø通常在数据表视图下完成的操作有:
浏览数据表;追加、删除、修改记录数据;查找与替换记录数据;排序及筛选等。
共同点:
有关记录数据的操作。
除此之外,还可以添加、删除字段;修改字段名。
例题:
在“图书”数据表中追加如下所示的一条记录:
书号:
20061010,书名:
信息技术,作者:
朱铨,:
电子工业,价格:
¥10.00,出版日期:
2007-5-1,是否借出:
□
参考设置:
在“数据表视图”下打开“图书”表,按要求追加记录数据。
总记录数(或显示筛选后的记录数)
编辑状态
记录定位器:
指示当前记录
注意:
一旦退出编辑状态则会自动保存数据,而且在很多情况下无法撤消操作,因此在浏览或者追加记录操作时,不可随意修改原有记录数据。
若在编辑状态下出现误操作,可以按ESC键取消操作(在选定状态下,则可能无法撤消)。
例题:
删除“图书”表中第6条记录
参考设置:
在“数据表视图”下打开“图书”表,利用记录定位器定位到第6条记录,单击“编辑”菜单下的“删除”命令(或者直接右击指定记录→删除记录)。
选定状态
注意:
删除记录后无法使用撤消命令恢复。
例题:
将“图书”数据表中“”字段中所有的“教盲”更改为“教育”
参考设置:
打开“图书”表,单击“编辑”菜单下“替换”命令,按下图设置并全部替换。
注意:
在使用“替换”命令前应先选定需要被替换的字段,选定的结果能使“替换”对话框中的“查找围”出现指定字段;“匹配”中三个选项的含义如下:
⏹字段任何部分:
只要字段中包含“查找容”的容均可被查找到或替换掉。
如按图中设置,“教盲”、“教盲”中的“教盲”均会被替换;
⏹字段开头:
字段中包含“查找容”且必须以“查找容”开头会被查找到或替换掉;如图,匹配改为“字段开头”,则没有容被替换;以“教盲”开头的才可被替换;
⏹整个字段:
字段中的值必须与“查找容”完全一致才能被查找到或替换掉;
如图,匹配改为“整个字段”,则没有容被替换;是“教盲”的才可被替换;
例题:
将“图书”表的“书号”字段与“借阅”表的“书号”字段建立联系
参考设置:
单击“工具”菜单下的“关系”命令。
注意:
建立表联系必须满足以下条件:
关闭所有需要建立联系的数据表;
建立联系的字段数据类型必须一致,字段名可以不同;
设置“实施参照完整性”后,建立联系的字段至少要有一个为主键。
实施参照完整性是用来保证数据的完整性,即不允许出现相关联数据不一致的现象。
若不选择该项,则建立的是不确定的联系。
附:
不同视图下常用工具按钮注解
第三章使用数据库
三、在Access关系数据库管理系统中使用数据库
(一)排序
定义:
是根据数据表中的某个或多个字段的值对表中所有记录按升序或降序进行重新排列。
1、单字段排序
操作方法:
选定排序字段→①单击工具栏上的排序命令;
②右击,选择相应的排序命令;
③单击“记录”菜单下的“排序”
注意:
各类型数据的大小比较原则:
数字比较:
根据数字值的大小进行比较;
字符串文本比较:
根据字符串首字符的ASCII码值(空格<数字<大写字母<小写字母)进行比较,首字符相同时依次逐位比较其他字符直到得出结果;
汉字文本比较:
根据汉字机码的大小进行排序,可简单认为根据汉语拼音顺序排序。
如:
”信息技术”<”语文”、”中华民族”<”中华人民”、”二等奖”<”三等奖”
日期/时间比较:
根据日期/时间先后顺序比较,越后的日期或时间越大。
如:
#2006-5-1#<#2006-5-7#、#12:
30:
00#<#18:
00:
00#
2、多字段排序方法
例题:
将“图书”表中的记录按“价格”降序排序,价格相同时根据“”降序排序
操作方法:
①先移动需要排序的字段到相邻的位置(先排序的在最左端);
②再同时选定多个排序字段→使用“排序”命令。
正确的排列字段:
↓错误的排列字段:
↓
注意:
对多字段排序时,这些排序字段必须紧挨着,排序的原则是按从左到右的顺序进行;即先按最左端字段排序,当该排序字段中的容相同时才根据第二字段进行排序,依此类推。
排序后可重新安排列的位置,不影响排序结果。
(二)筛选
定义:
是指在数据表中查找出满足一定条件的记录。
(使用筛选命令前要先打开数据表)
1、按选定容筛选
例题:
筛选出“图书”表中,由“教育”的图书记录
操作方法:
①打开“图书”数据表视图
②定位光标到“教育”字样
③单击“按选定容筛选”按钮
参考P59,局限性:
仅能筛选出固定值的记录
①定位光标到筛选内容
2、高级筛选
说明:
要筛选出满足的条件为某一围,则需要使用高级筛选
例题:
筛选出“图书”表中价格小于40元且书名包含“计算机”
的记录。
操作方法:
①单击“记录”菜单下的“筛选”→“高级筛选”命令
②根据题意,合理输入筛选条件后单击“应用筛选”按钮
注意:
筛选条件的书写原则:
①数据类型一致性原则,即文本型数据加引号,日期时间型数据前后加“#”号,数字型数据直接书写;
②关系运算符的使用:
>、<、=、>=(大于等于)、<=(小于等于)、<>(不等于)
如:
>=60、<>”一等奖”、>#2007-4-30#、>=#2007-5-1#
③逻辑运算符的使用:
not(非)、and(与)、or(或)
Not:
相当于“<>”,如:
不是“一等奖”可表示为:
not”一等奖”(<>”一等奖”)
And:
表示“与”的关系,即同时满足多个条件;
如:
60~69分数段可表示为:
>=60And<=69或者Between60And80
07年5月份可表示为:
>=#2007-5-1#and<=#2007-5-31#
Or:
表示“或”的关系,即满足多个条件中的任意一个;
如:
一等奖或二等奖可表示为:
”一等奖”or“二等奖”
④通配符的使用:
只能在文本字段中使用,用于代表不确定的文本,符号有:
*、?
*:
可表示任意多个字符;?
:
可表示任意一个字符。
如:
姓“王”可表示为:
Like“王*”
第5、6位为“31”可表示为:
Like“?
?
?
?
31*”
(三)查询(只介绍选择查询)
定义:
是指在数据库中查找满足条件的记录项。
查询与筛选的区别:
①查找围不同;查询能在整个数据库中查找,而筛选仅能在当前数据表中查找;
②显示的字段不同:
查询能显示指定字段,而筛选则显示当前数据表中的所有字段;
查询与数据表的区别与联系:
①数据表是用于存储数据,而查询是符合查询所设置的条件的记录集合,因此,查询结果会随数据表中数据的变化而动态显示查询结果;
②在同一数据库中,查询对象与数据表对象不能同名。
例题:
查找2007年4月28日所借出的图书书名、及借阅者。
创建查询的方法:
①分析任务,将分析结果填入下表:
关键字眼
2007年4月28日
图书书名
借阅者
需要的字段
借出日期
书名
确定字段所在的数据表
借阅表
图书
图书
借书证
设置约束条件
#2007-4-28#
②根据分析的结果,利用“设计器”创建查询对象,如右图所示:
③运行查询,检验结果;
④按要求保存查询对象。
注意:
在多表查询时,要先建立好数据表之间的联系,否则在显示结果时将会出现数据的冗余显示的现象。
(四)统计
要对数据库里的数据实现统计功能,可以使用Access提供“合计”功能来实现,常见的合计功能有:
P71
分组(GroupBy):
按某一字段将记录进行分组;
求和(Sum)
计算字段中值的总和
平均(Avg)
计算平均值
最小值(Min)
搜索该字段的最小数值
最大值(Max)
搜索该字段的最小数值
条数(Count)
计算记录条数
条件(Where)
设置计算条件
例题:
统计不同出版的《数据管理技术》在07年4月份的出借次数。
建立统计的方法与过程:
①分析任务,将分析结果填入下表:
关键字眼
不同
《数据管理技术》
07年4月份
出借次数
合计类型
GroupBy
Where
Where
Count
需要的字段
书名
借出日期
书号
确定字段所在的数据表
图书
图书
借阅
图书
②根据分析结果,利用“设计器”建立“查询”对象后单击“视图”下的“合计”命令;
③运行查询,并检验结果;
④按要求保存“查询”对象。
注意:
①当“合计”类型为Where时,则自动不能设置为“显示”;
②合计类型为“Count”、“Sum”、“Avg”时,通常要设置标题行,格式如下:
列标题:
字段名
(五)数据的导入、与导出
Access获取外部数据的方法:
导入(是将外部数据转换并复制到当前数据库中);
(仅是引用外部数据到当前数据库中)
因此,导入的数据被更改后不影响外部数据表;而表被更改后直接修改外部数据。
Access导出数据的方法:
导出(将数据输出到其他数据库或其他应用程序当中)
例题:
将E盘中的“管理员.xls”文件中的数据导入到“管理员”数据表中;
操作步骤:
①单击“文件”菜单下的“获取外部数据”→“导入”命令;
注意:
①选择好导入、或导出的数据文件类型,可被Access利用的文件类型有:
mdb、dbf、db、xls、txt;
②采用方式导入的数据,源文件的路径及文件名不可以更改,否则会出错。
第四章、第五章梗概
1、数据库应用系统的开发流程是一项软件工程:
具体步骤如下:
需求分析→系统设计(数据库设计、功能模块设计、界面设计)→系统实现(采用“自底向上”的原则利用“窗体”实现各功能模块)→系统测试(测试步骤:
单元测试、集成测试、验收测试;测试方法:
黑盒测试、白盒测试)及维护
2、促使数据库技术的不断发展的根本原因:
社会需求的多样化要求。
分析型处理:
主要用于管理人员的决策分析——数据仓库技术(简称DW)
数据挖掘(简称DM):
从数据库中发现知识及有价值的技术。
操作型处理:
强调对记录进行增、删、改等的日常操作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据管理 系统 技术