空间数据库复习重点答案完整.docx
- 文档编号:4217323
- 上传时间:2022-11-28
- 格式:DOCX
- 页数:32
- 大小:440.45KB
空间数据库复习重点答案完整.docx
《空间数据库复习重点答案完整.docx》由会员分享,可在线阅读,更多相关《空间数据库复习重点答案完整.docx(32页珍藏版)》请在冰豆网上搜索。
空间数据库复习重点答案完整
1、举例说明什么是空间数据、非空间数据?
如何理解空间查询和非空间查询的区别?
常用的空间数据库管理方式有哪几种及其各自特点。
数据:
是指客观事务的属性、数量、位置及其相互关系等的符号描述。
空间数据:
是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。
河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据
空间查询是对空间数据的查询或命令
人工管理阶段
文件管理阶段缺点:
1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。
2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。
不能达到真正的共享,即数据项、记录项的共享。
常用:
文件与数据库系统混合管理阶段优点:
由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。
缺点:
1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。
2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。
3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多
全关系型空间数据库管理系统
◆属性数据、几何数据同时采用关系式数据库进行管理
◆空间数据和属性数据不必进行烦琐的连接,数据存取较快
◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作
◆GIS软件:
System9,SmallWorld、GeoView等
本质:
GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。
对象关系数据库管理系统
优点:
在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。
缺点:
用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。
面向对象的数据库系统。
采用面向对象方法建立的数据库系统;
对问题领域进行自然的分割,以更接近人类通常思维的方式建立问题领域的模型。
目前面向对象数据库管理系统还不够成熟,价格昂贵,在空间数据管理领域还不太适用;
基于对象关系的空间数据库管理系统可能成为空间数据管理的主流
2、什么是GIS,什么是SDBMS?
请阐述二者的区别和联系。
GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。
它的主要功能有:
搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集
改:
地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。
简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。
2、SDBMS是一个软件模块。
它可以①、利用一个底层的数据库管理系统②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则3、区别与联系:
①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。
改:
联系:
GIS可作为SDBMS的前端工具,一个高效的空间数据库系统是实现GIS高效查询和分析的前提条件。
区别:
GIS和SDBMS的主要不同侧重点:
GIS是一个侧重于空间数据可视化和分析的软件,GIS常用分析功能:
GIS使用SDBMS存储、检索、查询、共享大型空间数据集
SDBMS重点关注:
高效存储、查询和共享大型空间数据集
提供尽量简单的查询方法
通过空间索引和查询优化方法加快大型空间数据集的查询反应时间
SDBMS有可能用于非GIS领域的其它方面:
如天文、气象、生物等
3、用传统数据库系统管理空间数据,存在哪些局限?
只支持简单的数据类型,如:
数字、字符串、日期。
实现上述的多段线表达非常复杂
答:
(1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。
(2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。
(3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。
(4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。
或者:
总结标准DBMS存储空间数据的局限性
空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定;
在存储和维护空间数据拓扑关系方面存在着严重缺陷;
一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作;
不能支持复杂的图形功能;
单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持;
难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。
4、什么是SDBMS?
SDBMS的三层体系结构是什么?
一个SDBMS(空间数据库管理系统)是一个软件模块,它利用一个底层数据库管理系统(如ORDBMS、OODBMS);
SDBMS支持多种空间数据类型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言
SDBMS支持空间索引、高效的空间操作算法以及
用于查询优化的特定领域规则
SDBMS包括:
空间数据模型、查询语言、文件组织、查询优化等。
下图表示了基于对象关系模型上的一个空间数据库应用的三层体系结构。
SDBMS三层体系结构
顶层为空间应用,如GIS、MMIS(多媒体信息系统),或者CAD。
该层不直接与OR-DBMS打交道,需要一个中间层与OR-DBMS交互。
中间层:
空间数据库(SDB),中间层是封装大多数空间领域知识的地方,不“插”入到OR-DBMS中。
又称空间数据刀片、空间数据暗盒、空间数据引擎。
最后一层;DBMS
5、数据库模式有哪些?
物理模式(物理层设计)内模式、逻辑模式(通常简称为“模式”)子模式(外模式)通常,数据库管理系统支持一个物理模式、一个逻辑模式和多个子模式。
6、什么是数据模型?
概念模型有哪些?
逻辑模型有哪些?
每一种模式的原理是什么?
数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。
每一个具体的数据库都由一个相应的数据模型来定义。
(数据库的概念描述,是数据库系统中用于提供信息表示和操作手段的形式构架。
)
概念模型:
按用户的观点从现实应用中抽象出事物以及事物之间的联系
结构数据模型:
从计算机实现的观点来对数据建模
概念模型:
实体-联系模型(ER)
⏹现实世界被划分为若干实体(entity),由属性(attribute)来描述性质,通过联系(relationship)互相关联
面向对象模型
逻辑数据模型:
层次模型
⏹用树结构表示实体之间联系的模型叫层次模型
⏹树由节点和连线组成
⏹节点代表实体型
⏹连线表示两实体型间的一对多联系
网状模型
网状数据模型是一个满足下列条件的有向图:
1、可以有一个以上的节点无父节点。
2、至少有一个节点有多于一个的父节点(排除树结构)。
关系模型
⏹用二维表来表示实体及其相互联系
面向对象模型
为了有效地描述复杂的事物或现象,需要在更高层次上综合利用和管理多种数据结构和数据模型,并用面向对象的方法进行统一的抽象。
7、数据库设计的三个步骤有哪些?
每一步有些什么内容?
答、首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息;
然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关
最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。
改:
概念模型
⏹按用户的观点从现实应用中抽象出事物以及事物之间的联系
逻辑建模
⏹建立概念和联系的逻辑结构
逻辑结构设计的步骤:
1)将概念结构转化为一般的关系、网状、层次模型、面向对象模型
2)对数据模型进行优化
3)设计用户子模式
物理设计建模
⏹对逻辑结构进行具体实现方面的安排和考虑
⏹存储组织、索引、内存管理……
8、ER模型的作用,ER图包括哪些要素,如何表达多值属性?
答:
ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。
ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。
实体用属性来刻画性质,实体之间通过练习相互作用和关联。
属性可以是单值或多值。
ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。
码属性加下划线,多值属性用双椭圆。
9、对于空间数据,ER模型方法的不足之处?
为表达空间概念,扩展ER模型主要增加了哪些要素?
举例说明用象形符号扩展ER图,对于空间数据建模有何好处?
.ER图在空间建模中的不足:
场模型无法用ER模型进行自然映射——因为:
ER模型的最初设计隐含了基于对象模型的假设。
传统ER模型中,实体之间的关系由应用来导出;而空间建模中,空间对象之间总会有内在联系。
建模空间对象所使用的实体类型与“地图”比例尺有关。
有时是点、线,有时是多边形。
扩展E-R模型:
1)、实体象形图:
象形图:
象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置。
形状:
形状是象形图中的基本图形元素,它代表着空间数据模型中的元素。
一个模型元素可以是基本形状、复合形状、导出形状或备选形状。
基本形状
复合形状:
为了处理那些不能用某个基本形状表示的对象,我们定义了一组聚合的形状,并用基数来量化这些复合形状
导出形状:
如果一个对象的形状是由其他对象的形状导出的,那么就用斜体形式来表示这个象形图。
备选形状:
备选形状可以用于表示某种条件下的同一个对象。
例如,根据比例尺,一条河流可以表示成一个多边形或一条线。
任意形状:
对于形状的组合,我们用通配符(*)表示,它表示各种形状。
例如,一个灌溉网是由泵站(点)、水渠(线)以及水库(多边形)所组成的。
用户自定义形状
2)、联系象形图。
联系象形图用来构建实体间联系的模型。
例如,part-of用于构建道路与路网之间联系的模型,或是用于把森林划分成林分的建模。
好处:
用象形符号扩展ER图,以便专门处理空间数据类型。
这将减少ER图以及所产生的关系模式的复杂度,同时改进空间建模的质量。
空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。
关系模式中的表达多值空间属性的关系和M:
N空间联系也就不需要了
10、举例说明如何将ER图映射成关系模型?
1.实体映射成单独关系
2.对于基数为1∶1的联系转换为一个独立的关系模式,也可与任一端对应的关系模式合并。
将任一实体的码属性作为其他关系的一个外码。
如Manager-Forest
3.对于基数为M∶1的联系,可以转换为一个独立的关系模式,也可以与M端对应的关系模式合并。
将“1”侧关系的主码作为“M”侧关系的外码,转换来的关系的主码为M侧的码。
如Forest-FireStation
4.对于基数M:
N的联系,则每一个M:
N的联系被映射成一个新关系,其主码由参与的实体对主码组成,联系的属性映射成关系的属性,如Facility-River
5.对于多值属性,创建一个具有两列的新关系,一列对应多值属性,另一列对应实体的码。
多值属性和实体码一起构成新的关系的主码。
如Forest-stand的几何属性polygonid,新表为Fstand-Geom。
6.多值属性Elevation也需要一个新表,表中由ForestName、Elevation和Pointid共同构成主码。
7.具有相同码的关系模式可合并
11、常用的空间信息模型有哪些?
它们分别由哪些内容组成?
采用什么样的数据结构?
基于每种空间信息模型有哪些操作?
两种常用空间信息模型:
场模型(Fieldbasemodel),采用栅格模型
对象模型(Objectbasedmodel),采用矢量结构
场模型用于表示具有连续的空间变化的情况,形状不定的现象。
对象模型用于表示具有固定形状的空间实体/概念描述空间上离散的空间对象。
场模型的3个组成部分:
空间框架、场函数、场操作。
场操作分类:
(1)局部操作
对于局部操作,空间框架内一给定位置的新场取值只依赖于同一位置场的输入值。
(2)聚焦操作
指定位置的结果场的值依赖于同一位置的一个假定领域上的场的值
设E(x,y)是state-park的高程场,E给出了空间框架F在位置(x,y)的高程值,计算高程场的梯度▽E(x,y),就是一个聚焦操作,梯度值依赖于(x,y)的邻域场(x1,y1)的高程。
(3)区域操作
与聚集运算符或积分运算有关。
如在森林的例子中求某种树种的平均高度。
对象模型的组成部分:
对象类型、对象属性和操作、对象关系。
空间对象的操作:
面向集合的、拓扑的方位的、度量空间的、欧氏空间的
12、什么是范式理论?
理解并简述函数依赖、部分函数依赖、部分函数依赖、传递函数依赖的涵义。
范式是符合某一种级别的关系模式的集合。
设R(U)是一个属性集U上的关系模式,X和Y是U的子集。
若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。
X称为这个函数依赖的决定属性集(Determinant)。
Y=f(x)
函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。
在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’Y,则称Y完全函数依赖于X,记作XfY。
若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作XPY。
在关系模式R(U)中,如果X→Y,Y→Z,且Y⊆X,Y→X,则称Z传递函数依赖于X。
注:
如果Y→X,即X←→Y,则Z直接依赖于X。
13、结合实例,简述1~4NF的涵义,并能判别属于第几范式,及如何转换成更高级别的范式。
各种范式之间存在联系:
某一关系模式R为第n范式,可简记为R∈nNF。
1NF的定义:
如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。
第一范式是对关系模式的最起码的要求。
不满足第一范式的数据库模式不能称为关系数据库。
但是满足第一范式的关系模式并不一定是一个好的关系模式。
2NF的定义:
定义5.6若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。
(所有非主属性完全依赖每个候选关键字。
)
例:
SLC(Sno,Sdept,Sloc,Cno,Grade)∈1NF
SLC(Sno,Sdept,Sloc,Cno,Grade)∈2NFSC(Sno,Cno,Grade)∈2NF
SL(Sno,Sdept,Sloc)∈2NF
(sloc为学生住处,sdept为选课)
订单号商品号商品名商品描述单价供应商号供应商名供应商电话
000001200 A ........2.00234560 XXXXXX ..........
000001201 B ........1.00234560 XXXXXX ..........
000001202 C ........10.00234560 XXXXXX ..........
000001203 D ........20.00234560 XXXXXX ..........
000001204 E ........5.00234560 XXXXXX ..........
-------------------------------------------------------------------------------
000002200 A ........2.00234561 YYYYYY ..........
000002201 B ........1.00234561 YYYYYY ..........
000002202 C ........10.00234561 YYYYYY ..........
000002204 E ........5.00234561 YYYYYY ..........
-------------------------------------------------------------------------------
000003202 C ........10.00234560 XXXXXX ..........
000003203 D ........20.00234560 XXXXXX ..........
000003204 E ........5.00234560 XXXXXX ..........
(订单号商品号商品名商品描述单价供应商号供应商名供应商电话)
其中:
主码(订单号,商品号)
商品号◊(商品名,商品描述,单价)
因为“商品号”在表中是主键的一部分,所以“商品名商品描述单价”对于“商品号”存在部分函数依赖.
将存在部分依赖关系的列拿出来新生成一个新的表Product,
而原来的Order表中去掉了一些列,形成一个新的Order表,
Order表:
订单号商品号供应商号供应商名供应商电话...
Product表:
商品号商品名商品描述单价...
采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。
SL(Sno,Sdept,Sloc)∈2NF
例:
2NF关系模式SL(Sno,Sdept,Sloc)中
函数依赖:
Sno→Sdept
Sdept→Sloc
Sno→Sloc
Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。
⏹解决方法
采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖:
SD(Sno,Sdept)
DL(Sdept,Sloc)
SD的码为Sno,DL的码为Sdept。
定义3FN:
关系模式R中若不存在这样的码X、属性组Y及非主属性Z(Z⊆Y),使得X→Y,Y→X,Y→Z,成立,则称R∈3NF。
(所有非主属性都不传递函数依赖每个候选关键字或一个或多个属性(列)依赖于非主键的属性(列).)
例,SL(Sno,Sdept,Sloc)∈2NF
SL(Sno,Sdept,Sloc)∈3NF
SD(Sno,Sdept)∈3NF
DL(Sdept,Sloc)∈3NF
若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。
如果R∈3NF,则R也是2NF。
采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。
学生关系表Student(学号,姓名,年龄,所在学院,学院地点,学院电话),
关键字:
“学号”,
(学号)→(姓名,年龄,所在学院,学院地点,学院电话)
(学号)→(所在学院)→(学院地点,学院电话):
即存在非关键字段“学院地点”、“学院电话”对关键字段“学号”的传递函数依赖。
这个关系是符合2NF的,但是不符合3NF,
它也会存在数据冗余、更新异常、插入异常和删除异常的情况,
把学生关系表分为如下两个表:
学生:
(学号,姓名,年龄,所在学院);
学院:
(学院,地点,电话)。
这样的关系是符合3NF
假设仓库管理关系表为StorehouseManage(仓库ID,存储物品ID,管理员ID,数量),且一个管理员只在一个仓库工作;一个仓库可以存储多种物品。
判断该关系模式所属范式
这个数据库表中存在如下决定关系:
(仓库ID,存储物品ID)→(管理员ID,数量)
(管理员ID,存储物品ID)→(仓库ID,数量)
所以,(仓库ID,存储物品ID)和(管理员ID,存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。
范式的判断:
1、确定候选键,找出主属性和非主属性
2、确定非主属性和候选键之间是否存在函数依赖,若存在部分函数依赖,则关系模式属于1NF,若存在传递函数依赖,则关系模式属于2NF, 若消除了部分函数依赖和传递函数依赖,则关系模式属于3NF
候选键的确定:
1、可以按照候选键的定义求解,即关系模式R(U,F)中的一个或一组属性X,若属性集U完全依赖于X,则X为关系模式R的候选键。
也就是说根据语义分析得到的F,如果X可以确定每一个属性,那么X就是候选键。
4NF定义:
关系模式R(U,F)∈1NF,如果对于R的每个非平凡多值依赖X◊◊Y(Y不包含于X),X都含有候选码,则R∈4NF。
4NF限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖。
如果一个关系模式是4NF,则必为BCNF
课程C
教师T
参考书B
数学
邓海
高数
数学
邓海
数学分析
数学
邓海
微分方程
数学
陈红
高数
数学
陈红
数学分析
数学
陈红
微分方程
物理
李东
普通物理
物理
李东
光学
…
…
…
关系模式:
TEACH(C,T,B),C表示课程,T表示教师,B表示参考书。
假设某一门课由多个教师讲授,一门课使用相同的一套参考书。
关系模式存在以下依赖:
数学◊[邓海,陈红]◊[高数,数学分析,微分方程]
物理◊[李东,张强,刘明]◊[普通物理学,光学]
该关系模式码为(C,T,B),为全码。
满足BCNF,但仍存在四种异常。
为什么呢?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 复习 重点 答案 完整