空间数据库复习提纲.docx
- 文档编号:3321533
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:15
- 大小:344.55KB
空间数据库复习提纲.docx
《空间数据库复习提纲.docx》由会员分享,可在线阅读,更多相关《空间数据库复习提纲.docx(15页珍藏版)》请在冰豆网上搜索。
空间数据库复习提纲
第一章了解空间数据模型
1.空间数据库(SDBMS)定义:
是一个软件模块,它利用一个底层数据库管理系统(如OR-DBMS、OODBMS);支持多种空间数据模型,相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言;支持空间索引,搞笑的空间操作算法以及用于查询优化的特定领域规则。
2.Geodatabase数据模型体系结构
空间数据库体系结构书P11
这是一个三层体系结构,顶层为空间应用,如GIS、MMS(多媒体信息系统),或者CAD(计算机辅助设计)。
该应用层并不直接与OR-DBMS打交道,而需要经过一个中间层与OR-DBMS交互,我们将这个中间层称为空间数据库(SDB)。
中间层是封装大多数空间领域知识的地方,并被“插入”到OR-DBMS中。
由此对于称为空间数据刀片、空间数据暗盒以及空间数据引擎的商业OR-DBMS产品也就不足为奇了。
3.SDBMS使用过滤-精炼策略来处理范围查询。
这是一个两阶段的处理过程。
第一步将被查询的对象用它们的最小外包矩形来表示。
得到的结果包含了满足原始查询条件的候选者。
第二阶段是对过滤结果使用精确地几何条件进行处理。
这是一个计算大家很大的过程,但在过滤阶段的帮助下,本阶段的输入集合只剩下很少的候选者。
场模型(连续分布)和对象模型(离散分布)定义和区别(一定情况可相互转换)
对象模型SDE和Oracle实例(插入数据,更新元数据表,创建和索引,创建表,空间查询)和区别。
B树索引:
结构是关系DBMS中用的最广泛的索引,其索引结果是关系数据库技术广为采用的主要原因。
B树的实现主要依赖于索引域中排序的存在,是R树的基础。
B树的每个节点对应磁盘的一个页面,每个节点的条目数取决于索引域的特征和磁盘页面的大小。
由于多维空间不存在自然排序,B树也就无法直接用于创建空间对象的索引,为了避免空间对象在自然排序方面的不足,通常把空间排序与B树结合起来。
特点:
B树是一种平衡的多分树,通常我们说m阶的B树,它必须满足如下条件:
--每个结点至多有m个子结点;除根结点和叶结点外,其它每个结点至少有m/2个子结点;若根结点不是叶子结点,则至少有两个子结点;所有的叶结点在同一层;
4.空间数据库与非空间数据库之间的区别:
空间数据库一般是ACCESS的数据库,数据库和网站文件共用一个空间,更直观,没有冗余的表,可支持空间和非空间数据,有自定义数据类型;非空间数据库一般是MSSQL和Mysql数据库,数据库文件和网站文件是各自独立的
5.如何利用对象关系数据库来实现一个SDBMS?
答:
目前,在关系数据库上管理空间数据可以通过在关系数据库上加一层中间件,中间件实现了从空间对象模型到数据库存储的影射,其主要任务是分析并执行控件对象访问命令,为GIS应用提供一个一致且稳定的接口。
6.数据模型的三个基本要素是:
数据结构:
描述数据库的对象和对象之间的联系,是对数据的静态描述。
数据操作:
数据库中各种对象允许的操作和操作规则,使对系统的动态描述。
完整性约束:
一组完整性规则,用以限定符合数据模型的数据库状态和状态的变化,保证数据的正确、有效和相容。
7.空间数据库应用的例子:
电话公司使用数据库存储客户基本信息、客户的每次通话信息以及雇员基本信息、雇员业绩信息等。
典型的数据处理包括电话收费、生成客户长途电话话单、计算雇员工资等图书馆使用数据库存储图书资料信息、读者基本信息、图书借阅信息等。
典型的数据处理包括新书登记、处理读者借还图书等税务局使用数据库存储纳税人(个人或公司)信息、纳税人缴纳税款信息等。
典型的数据处理包括纳税、退税处理、统计各类纳税人纳税情况等。
银行使用数据库存储客户基本信息、客户存贷款信息等。
典型的数据处理包括处理客户存取款等。
超市使用数据库存储商品的基本信息、会员客户基本信息、客户每次购物的详细清单。
典型的数据处理包括收银台记录客户每次购物的清单并计算应交货款。
8.空间数据库、CAD数据库和图像数据库之间的异同:
答:
cad是对制图信息进行采集、综合、识别、存储、不同比例尺和不同投影之间的转换、编辑、输出的计算机处理系统。
输出满足规范要求的图形为其最终目的。
cad图形中的图形元素种类很多如点、线、多义线、圆、矩形、注记等等。
cad中的图形数据是矢量形式的它不仅包含了由一组或多组的x、y、z坐标确定图形的几何位置和几何形状的可见的几何信息,还包含由数值或字符串表示线型的属性的不可见的非几何信息。
cad图是以符号来存储修改麻烦。
图像数据库是遥感图像的数据集合。
遥感图像包含多谱段组成的图像数据,数据量庞大。
图像数据是图像像元灰度值的记录,以行列数据矩阵表示。
图像数据库由两个层次数据集合构成。
第一层次为图像数据词典。
数据内容包括对图像总体特征的描述,如波段、行数、列数、精度、记录格式、最大值、最小值、成像日期等;第二层次为图像基础数据,根据第一层次数据内容所提供的有关信息,可直接进入基础数据集合,进行检索、处理操作。
空间数据库。
。
。
9.ArcSDE是什么?
SDE全拼(SpatialDatabaseEngine空间数据引擎)和作用?
答:
是操作系统下的一个服务:
提供空间数据服务;嵌入RDBMS中实现空间数据的关系化存储和管理;允许用户将空间数据和其它业务数据统一存放在关系数据库管理系统(RDBMS)中,进行集成管理的一个通路(或网关)。
ArcSDE是一个基于关系型数据库基础上的地理数据库服务器是对关系型数据库的一个扩展,可以运行于Oracle、SQLServer、DB2、Informix等大型数据库之上,与数据库间形成了一种Client/Server三重体系结构。
采用ArcSDE管理地理信息数据ArcGIS的共享安全和维护和数据处理能力方面大大超过老一代地理信息系统。
作用:
在RDBMS中融入空间数据后,ArcSDE可以提供对空间非空间数据进行高效率操作的数据库服务。
由于ArcSDE采用的是客户/服务器(Client/Server)体系结构,大量用户可同时并发地对同一数据进行操作。
ArcSDE提供了应用程序接口API,开发人员可将空间数据检索和分析功能集成到他们的应用中去。
它是一个地理数据事物处理系统,一个高效的地理数据服务器,一个安全的地理数据库,还可以管理海量的无缝地理数据。
10.ArcSDE体系结构是什么?
答:
Giomgr进程:
ArcSDE应用服务器以giomgr进程维护ArcSDE并监测和数据库的连接,同时在端口处(默认为5151/TCP)监听客户端的连接。
当启动ArcSDE时,giomgr连接到RDBMS并锁定该实例,防止在相同的数据库实例中有其他ArcSDE实例启动。
Giomgr的目的就是去监听客户端发出的连接请求。
Gsrvr进程:
当一个客户端应用程序发出一个连接请求,giomgr进程检测其权限后激发一个专用服务(gsrvr进程)来提供一个数据库和应用程序的专用连接。
此连接是建立在用户名和密码的基础上的。
对数据的存取依赖于ArcSDE或数据库管理员给用户分配权限的大小。
Gsrvr保持与数据库的连接直到客户端关闭应用程序来释放连接。
Giomgr继续监听连接请求直到ArcSDE关闭。
第二章掌握空间数据库的设计方法
1.Er模型(实体关系模型--直接从现实世界中抽象出实体类型和实体间联系,然后用实体联系图(E-R图)表示数据模型,是描述概念世界,建立概念模型的实用工具。
)
基本要素:
实体型(矩形表示,若为弱实体,双矩形框);属性(椭圆表示,若为派生属性,用虚线椭圆表示);联系(菱形框表示,一对一,一对多,多对多)
2.场模型和对象模型的区别和联系?
答:
场模型(用于描述用连续变量分布表达空间现象);对象模型(用离散类别分布表达空间现象);联系:
空间域上对象几何的某些属性可以形成数据场,对场模型数据按照区间值分割或划分可形成空间对象。
场模型适合表达对于形状不定的现象,如火灾,洪水,海拔,温度,土壤变化和危险物泄露,当然采用边界不固定的场模型进行建模。
对象模型更多的用于运输网络,如道路,地块的征税和合法所有权应用等方面的建模。
3.空间数据库设计的三个步骤P41
答:
采用高层次的概念数据模型来组织所有与应用有关的可用信息→逻辑建模,与概念数据模型在商用DBMS上的具体实现有关→物理设计的建模,解决数据库应用在计算机中具体实现时方方面面的细节。
4.将er模型映射到关系模型六个基本步骤P46
将每个实体映射成一个单独的关系;对于基数为1:
1的联系将任一实体的码属性作为其他关系的一个外码;如果联系的基数是m:
1,就把1侧的关系主码作为其他关系的一个外码;;如果基数为m:
n,每个m:
n联系被映射成一个新的关系。
关系的名称就是联系的名称,关系的主码由参与实体的主码对组成;对于多值属性,创建一个具有两个列的新关系,一列对应该多值属性,另一列对应拥有该多值属性的实体码;elevation这个属性需要用一种截然不容的方式处理。
5.两个空间对象的拓扑关系
操作举例:
州立公园例子:
书P47
由上图:
一个管理员可管理1片森林,一个管理员可管理m片林分,m个消防站可监控一片森林,1个设施可属于一片森林,河流和森林之间的空间关系是m:
n,同一片森林中各林分之间的关系是独立的。
Ppt作业4:
四叉树索引:
Spatial组件采用线性四叉树Morton编码的索引方法,对坐标空间(层中所有几何对象分布的空间范围)使用一种称之为“Tessellation”的分解操作,将坐标空间中所有的几何体以分解完整且互不重叠的分块面片覆盖。
其基本思想是将坐标空间的范围视为一矩形,四叉树分解的第一步是将矩形沿坐标轴方向平均分割生成四个相同大小的分块,对每一个与几何体相交的面片继续以相同形式分割,直至满足一定的原则,如面片达到一定大小或覆盖几何体的面片达到一定数目,则分解停止。
R索引:
基本思想--用最小外接矩形的层次集合来组织空间对象;是B树在多维上的扩展
R树:
叶结点(数据)矩形可能重叠,中间结点(目录)矩形允许重叠(overlap)
R+树:
中间结点的目录矩形不允许重叠;
查找操作的实现--搜索根结点、确定相关的子结点;递归地搜索子结点;由于中间结点可以重叠,查找路径可能有多条
优点:
很强的灵活性,高维索引,插入和删除操作相对容易;较少的存储空间
缺点:
查询效率有时很低(索引空间经常重叠,可能要对多条路径进行搜查后才能得到最后的结果);频繁的数据更新影响查询效率(空间对象插入顺序的不同会形成不同结构的R树)
空间索引【四叉树索引,R索引】比较:
第三章学会使用空间查询语言
关系代数(构成了SQL的核心)是与关系模型相关联的形式化查询语言。
两个运算:
选择(选择运算检索关系表中行的子集)和投影(投影运算抽取列的子集)
连接运算:
在笛卡尔积的基础上进行选择运算。
自然连接:
是条件连接的一个重要特例,在自然连接中,两个关系的公共属性只用到相等性选择条件,而结果中只有一列来表示公共的等值连接属性(具体步骤:
重新命名country关系为C→构造笛卡尔积CxR→在属性C.Name和R.Origin上对这两个关系作连接,这两个属性是属于同一个域的,即C⋈C.name=R.originR→在自然连接中,选择条件是十分明确地,因而无需在连接公式中显示的写成下标→在属性Name和Pop上作投影运算,得到最终结果:
πname.Pop(CxR))
Ddl与dml分别有哪些功能?
:
ddl用于创建、删除和修改数据库中表的定义,而dml用于查询、插入、删除、修改ddl中定义好的表中数据。
创建表city:
CREATETABLECITY{
NameVARCHAR(35)
CountryVARCHAR(35)
PopINT,
CapitalCHAR
(1),
ShapeCHAR(13),
PRIMARYKEYName}
书P71到P88各种代码
写出对象关系数据库的定义;Oracle9i是Oracle公司开发的对象-关系数据库管理系统(OR-DBMS);
OR-DBMS实现了SQL3标准的一部分,ADT在这种系统中称作“对象类型”(ObjectType)
对象-关系数据库系统就是将关系数据库系统与面向对象数据库系统两方面的特征相结合。
对象-关系数据库系统除了具有原来关系数据库的各种特点外,还应该提供以下特点:
(1)扩充数据类型,例如可以定义数组、向量、矩阵、集合等数据类型以及这些数据类型上的操作。
(2)支持复杂对象,即由多种基本数据类型或用户自定义的数据类型构成的对象。
(3)支持继承的概念。
(4)提供通用的规则系统,大大增强对象-关系数据库的功能,使之具有主动数据库和知识库的特性。
ADT定义:
用CREATETYPE语句来定义ADT
CREATETYPEPoint(xNUMBERyNUMBERFUNCTIONDistance(:
uPoint,:
vPoint)RETURNSNUMBER);
第三章作业见笔记
第四章掌握空间索引的基本原理和方法
空间聚类:
储存磁盘从逻辑上需要一个从高维空间向一维空间的映射,该映射是距离不变的,这样空间上临近的元素映射为直线上接近的点,而且一一对应,即空间上不会有两个点映射到直线的同一个点上,最突出的方法包括Z序列、格雷码和Hilbert曲线;Z曲线:
1.读入x和y坐标的二进制表示2.隔行扫描二进制数字的比特到一个字符串3.计算出结果二进制字符串的十进制值;H曲线1.读入x和y坐标的二进制表示2.隔行扫描二进制数字的比特到一个字符串3.将字符串自左至右分成2比特长的串Si,其中i=1,...,n。
4.规定每个2比特长的串的十进制值di,例如“00”等于0,“01”等于1;“10”等于3;“11”等于2。
(5.对于数组中每个数字j,如果:
j=0,把后面数组中出现的所有1变成3,并把所有出现的3变成1.如果j=3把后面数组中出现的所有0变成2,并把所有出现的2变成0。
(6。
将数组中每个值按步骤五转换成二进制表示(2比特长的串),自左至右连接所有的串,并计算其十进制值;空间索引:
为便于空间目标的定位及各种空间数据操作,按要素或目标的位置和形状或空间对象之间的某种空间关系来组织和存储数据的结构。
网格文件:
聚类文件组织(z曲线、对正方形区域进行编码,z曲线与Hilbert曲线的区别:
h比z好,无斜线)
查询与优化:
查的标准是执询处理由数据库系统实现,用于度量查询策略或查询计划行查询所需要的时间;
传统数据库查询所需要的时间主要取决于I/O代价;空间数据库包含了复杂数据类型和CPU密集型函数,优化策略选择比传统数据库复杂。
查询优化器(QueryOptimizer)是数据库中的一个软件,用于产生不同的计算计划并确定适当的执行策略。
第一章空间查询对空间数据库的查询或者命令;空间数据库的三类用户科学家、管理人员、商务专家;空间数据库是某一区域内一定地理要素特征的相关空间数据集合;是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以特定结构的文件的形式组织在存储介质上的。
对象关系数据库管理系统(OR-DBMS)集成了ADT和其他面向对象设计原则的关系数据库;SDBMS的定义1)一个SDBMS软件模块,他利用一个底层数据库管理系统(如OR-DBMS、OODBMS),2)SDBMS支持多种空间数据模型、相应的空间抽象数据类型ADT以及一种能够调用这些ADT的查询语言,3)SDBMS支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则;空间分类学涉及了多种可用来组织空间的描述方法,其中包括拓扑的、网状的、方位的以及欧式几何的;查询分类单遍扫描查询和多边扫描查询;SDBMS查询过程使用过滤-精炼策略,1)将被查询的对象用它们的最小外包矩形来表示,2)对过滤的结果使用精确的几何条件进行处理;抽象数据类型(AbstractDataType)一个数学模型以及定义在该模型上的一组操作,ADT包括数据数据元素,数据关系以及相关的操作;空间数据库与非空间数据库的区别空间数据库更直观,没有冗余的表;可支持空间和非空间数据,有自定义数据类型;空间数据引擎通过空间数据引擎可以用传统的关系数据库对空间地理数据加以管理和处理,提供必要的空间关系运算和空间分析功能,
实现空间数据库的核心技术是空间数据引擎(SDE);B树索引结构是关系DBMS中用得最广泛的索引,索引结果是关系数据库广为采用的主要原因,B树主要依赖于索引中排序的存在,是R树的基础;
第二章SDBMS将空间数据建模整合到系统中的意义1)与传统商务数据相比,空间数据更为复杂,而旧式数据库结构不足以处理空间数据,2)数据库设计和实现的问题通常是由计算机科学家来解决的,空间数据的处理则落入地理学家、环境学家以及其他物理学家的研究范畴。
模型对现实世界中的实体或对象的抽象或简化,是对实体或现象中的重要构成及其相互关系的表达,能反映事物固有的特征或运动变化规律;基于场的模型用于描述空间中连续分布的现象;场模型的组成1)空间框架,2)场函数,3)场操作;场操作分类1)局部操作,2)聚焦操作,3)区域操作;场模型适合表达的空间现象物理参数(温度、气压、湿度、电磁场、流体);环境参数(化学污染分布、地表化学元素分布);基于对象的模型把空间信息抽象成明确的、可识别的和相关的事物或实体;对象模型适合表达的空间现象人工建筑物(城市基础设施,道路、房屋、公园),自然对象(河流、湖泊、热带气旋、危险区域),其他类别变量;场模型与对象模型的关系空间域上对象集合的某些属性可以形成数据场;对场模型数据按照区间值分割或划分可以形成空间对象;平面上二元拓扑关系A的内部A°,边界əA以及外部Aˉ;B的内部B,边界əB以及外部Bˉ;九交矩阵
其余见后图;数据库设计的三个步骤1)采用高层次的概念数据模型,2)逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关,3)物理设计模型,他解决数据库应用在计算机中具体实现时方方面面细节;ER模型1)实体和属性:
微型世界被划分为一个个实体,由属性来描述实体性质,并通过联系相互关联,实体时物理或概念上独立存在的事物,2)联系:
一对一,多对一,多对多,3)ER图:
实体用矩形,属性用椭圆,联系用菱形:
将ER模型映射到关系模型的步骤1)将每个实体映射成一个单独的关系,实体的属性映射成关系的属性,实体的码映射成关系的主码,2)对于基数为1:
1的联系,将任意实体的码属性作为其他关系的一个外码;3)如果联系的基数是M:
1,就把1侧关系的主码作为M侧关系的外码,4)对基数M:
N的联系,处理方法不同,每个M:
N联系被映射成一个新的关系,关系的名称就是联系的名称,关系的主码由参与实体的主码组成,5)对于多值属性,创建一个具有两个列的新关系:
一列对应该多值属性,另一列对应实体的码,多值属性和对应实体的码构成新关系的主码,6)Elevation是多值属性,需要不同的处理方式;UML用于面向对象软件设计的概念层建模的新兴标准之一;
ER与UML的比较
ER
UML
实体(Entity)
关系(Relationship)
属性(Attributes)
码属性
角色(Roles)
综合与特化(Generalization&
Specialization)
类(Class)
关联(Association)
属性(Attributes)
方法
角色(Roles)
综合与分类(Generalization&
Classification)
第3章查询语言是数据库管理系统的一个核心要素;关系代数是与关系模型相关联的形式化查询语言;关系代数的运算对象和六种基本运算1)表,2)选择,投影,并,笛卡尔积,差,交;关系运算选择和投影用来操纵单个关系中的数据,选择运算检索关系表中行的子集,而投影运算抽取列的子集;连接运算可以理解成在笛卡尔积的基础上进行选择运算,常见的连接运算是条件连接,而条件连接中一个重要和特殊的情况是自然连接,在自然连接中,两个关系的公共属性中只用到相等性选择条件,而结果中,只有一列来表示公共的等值连接属性;SQL最初是由IBM开发出来的一种商业查询语言,从那时起他就成为关系数据库管理系统的标准查询语言,是一种声明性语言,只描述结果即可;SQL组成部分1)数据定义语言DDL,2)数据操纵语言DML;DDL用于创建、删除和修改数据库定义,通常是数据库管理系统的一部分,用于定义数据库的所有特性和属性,尤其是行布局、列定义、键列(有时是选键方法)、文件位置和存储策略;DML用于查询、插入、删除、修改DDL中定义好的表中数据,命令使用户能够查询数据库以及操作已有数据库中的数据的计算机语言。
具体是指是SELECT查询、UPDATE更新、INSERT插入、DELETE删除;ADT由一组属性和访问这些属性值的成员函数组成,成员函数可以隐含的修改数据类型中的属性值,因而也就能改变数据库的状态,可作为关系模式中的某一列类型;
a)找出GDP大于5000亿而小玉100万亿的国家
SELECTC.name
FROMCountry.C
WHEREGDP>500andGDP<100000
b)列出有河流发源地的个国家的居民平均寿命
SELECTC.name
FROMCountry.C,River.R
WHEREC.name=R.origin
c)找到位于南美洲或者人口小于200万的城市
SELECTCi.name
FROMCountry.Co,City.Ci
WHERECo.name=Ci.countryAND
(Co.cont=’NAM’orCi.pop<200)
d)列出不位于南美洲的城市
SELECTCi.name
FROMCo.name,Ci.country
WHERECo.cont<>’SAM’AND
Co.name=Ci.country
9.用SQL语句写出下面查询,请使用OGIS扩展的数据类型和函数
a)列出City表中距离华盛顿特区5000英里以内的城市、
SELECTCi.name
FROMCity.C1,City.C2
WHEREdistant(C2.shape,C1.shape)<5000ANDC1.name=‘Washington.DC’
b)位于阿根廷和巴西的RioParanas河的长度是多少
SELECTLength(Intersection(R.shape,Co1.shape)AsLength
SELECTLength(Intersection(R.shape,Co2.shape)AsLength
FROMRiver.R,Country.Co1,Country.Co2
WHERECo1.Name=’Argentina’,Co2.Name=’Brazil’
R.name=’Rioparonas’
andcross=(R.shape,Co1.shape)=1
andcross=(R.shape,Co2.shape)=1
c)阿根廷和巴西接壤吗?
SELECTtouch(Co1.shape,Co2.shape)
FROMCountryCo1,Country.Co2
WHERECo1.name=’Argentina’,Co2.name=’Brazil’
d)列出完全在赤道以南的国家
SELECTCo.Name
FROMCountr
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 复习 提纲