空间数据库资料Word文档下载推荐.docx
- 文档编号:20744592
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:26
- 大小:1,005.23KB
空间数据库资料Word文档下载推荐.docx
《空间数据库资料Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《空间数据库资料Word文档下载推荐.docx(26页珍藏版)》请在冰豆网上搜索。
●根据销售额,列出2001年前10位客户的名字
●空间查询:
●列出明尼阿波利斯市10英里范围内的所有书店的名字
●列出田纳西州以及与其相邻接的州内所有客户的名字
幻灯片5
SDBMS的价值–空间数据举例
●非空间数据举例
●人的姓名,电话号码,电子邮箱地址
●空间数据举例
●人口普查资料
●NASA卫星影像–每天产生TB(1024GB)量级的数据
●天气和气候数据
●河流、农场、生态影响
●医疗图像
幻灯片6
●许多重要的应用领域需要进行空间数据查询,举例如下:
●军队指挥官:
从昨晚至今敌军是否有重大行动?
●保险业的风险管理经理:
密西西比河的下次洪水泛滥最可能影响到哪些住户?
●医生:
根据病人核磁共振影像,我们是否遇到过类似的病例?
●分子生物学家:
基因组中的氨基酸合成基因是否能在数据库中的其他特征序列图中找到?
●天文学家:
在两个弧分和类星体中找到蓝星系。
●气象学家,药剂研究者,运动员,公司供货经理,运输专家,城市规划专家,滑雪胜地拥有者,农场主,高尔夫场开发商,应急服务
幻灯片7
1.3对比SDBMS与GIS
●GIS是一个用空间分析功能对空间数据进行可视化和分析的软件,其功能有
●搜索专题搜索,按区域搜索,(再)分类
●位置分析缓冲区,影响区域,叠置
●地形分析坡度/坡向,集水区,排水网络
●流向分析连通分析,最短路径
●分布特征变化监测,临近分析,最小邻域
●空间分析/统计模式,向心性,自相关,相似度指数,拓扑
●测量距离,周长,形状,邻接,方向
●GIS使用SDBMS
●存储,搜索,查询,共享大型空间数据集
幻灯片8
●SDBMS专注于
●存储,查询,共享大型空间数据集的效率
●基于查询操作提供更简单的数据集
●操作举例:
根据区域查询,叠置,最小邻域,距离,邻接,周长等
●运用空间索引和查询优化来加速针对大型空间数据集的查询。
●SDBMS可能用在GIS以外的应用中
●天文学,基因组学,多媒体信息系统,...
●运用GIS或SDBM能回答以下问题吗?
●美国与多少个国家相邻?
●哪个国家的邻国最多?
幻灯片9
1.4用户分类---1
在市场上出现了专门的空间产品,用来提高通用DBMS的空间处理能力。
例如,Oracle、lnformix和IBM就分别推出了空间附件,并冠以暗盒(cartridge)、数据刀片(datablade)这类隐喻性的名称,或者采用空间选项(spatialoption)之类的温和叫法。
●1)从主要数据库厂商的观点来看,管理空间数据需要专门的产品,但空间数据显然不是商务中使用的唯一数据类型。
其实,空间数据并非仅有的特殊数据类型。
比如,除了空间附件外,数据库厂商还发布了用于时序的(tempora1)、可视的(visual)以及其他多媒体形式数据的附件。
幻灯片10
1.4用户分类---2
●2)GIS厂商所定位的客户群体是那些只关注于空间数据分析的用户。
这块特定的市场相对较小,其中包括科学界和政府部门的专家。
与其他信息技术的用户相比,GIS用户更多是在封闭的环境中工作,使用特别为他们设计的专用数据库。
为了管理数量不断增长的空间(和非空间)数据,并且链接到商业数据库中,GIS厂商推出了诸如ESRI的SpatialDataEngine这种中间件产品。
幻灯片11
1.4用户分类3--“GIS”的演化
●地理信息系统(1980s)
●地理信息科学(1990s)
●地理信息服务(2000s)
Fig1.1
幻灯片12
GIS的三层含义
●地理信息系统
●针对专业用户的软件,例如,制图工程师
●例如:
ESRIArc/Infosoftware
●地理信息科学
●形成使用和开发地理信息系统和服务的概念、框架和理论
●例如:
为查询设计空间数据类型和操作
●地理信息服务
●为普通用户提供的网站和服务中心,例如,游客
谷歌地图提供的路径规划服务
幻灯片13
1.4用户分类---3
●3)随着Internet时代的到来,出现了另一批使用空间数据的用户群,他们更喜欢在一个非常高级的、用户界面非常友好的层次上使用空间数据。
比如,Internet上一种很受欢迎的站点是为访问者提供导向地图。
另一类站点提供了和空间数据相关的搜索引擎,这种引擎能够回答像“找出明尼阿波利斯市所有墨西哥餐馆”这样的查询。
空间技术另一个有前景的用途是移动电话定位。
幻灯片14
1.5SDBMS示例
明尼苏达州Ramsey郡
●空间数据集:
●县界(白色虚线)
●人口普查分区-名称,面积,人口数,边界(黑线)
●水体(黑色多边形)
●卫星影像(灰度像素)
●存储在SDBMS表格中:
●createtablecensus_blocks(
●namestring,
●areafloat,
●populationnumber,
●boundarypolygon);
Fig1.2
幻灯片15
在传统DBMS中的空间数据建模
●census_blocks表中的一行(Figure1.3)
●问题:
DBMS支持Polyline数据类型吗?
Figure1.3
幻灯片16
将“census_table”表映射到关系数据库中
Fig1.4
幻灯片17
空间数据类型和传统数据库
●传统关系DBMS
●支持简单数据类型,例如,number,strings,date
●空间数据类型建模冗繁
Figure1.4显示了使用数字进行多边形建模
●三个新表:
polygon,edge,points
●注意:
多边形是起点和终点相同的多义线(polyline)
●一个简单的正方形需通过3个表共计16行来表示
●简单的空间操作,例如,area(),要求连接表
●冗繁并且计算效率低
●问题:
给帮助空间数据类型(如,polygon)建模的后关系型数据库管理系统命名.
幻灯片18
DBMS技术的演化
Fig1.5
幻灯片19
空间数据类型与后关系型数据库
●后关系DBMS
●支持用户定义的抽象数据类型
●可添加空间数据类型(e.g.polygon)
●后关系DBMS的可选类型
●面向对象型的(OO)DBMS
●对象关系型的(OR)DBMS
幻灯片20
OODBMS
(1)
●面向对象的软件方法基于用户定义数据类型的原理,它具有继承性和多态性。
C++、Java和VisualBasic这些语言的广泛使用,表明软件业中已经牢固树立了面向对象的概念。
●地块问题看起来似乎是面向对象设计的一个自然应用:
声明一个polyline类和另一个land_parcel类。
land_parcel类含有两个属性:
字符串类型的address属性和polyline类型的boundary属性。
我们甚至不需要area(面积)属性,因为可以在polyline类中定义一个area方法,在需要的时候计算任何地块的面积。
●但这还不够。
幻灯片21
OODBMS
(2)
●抽象数据类型(abstractdatatype,ADT)的引入增加了DBMS的灵活性,但是,在ADT能完全集成到,DBMS之前,首先要解决两个对数据库的特殊制约:
●尽管OODBMS产品已经面世多年,然而市场对此类产品的接受能力却很限。
●这就减少了调整OODBMS产品性能所需的经济和工程耗费。
其结果是,许多GIS用户将使用其他的系统而不是OODBMS来管理空间数据。
●SQL是数据库世界的“国际通用语言”,它与关系数据库模型紧密地联系在一起。
SQL是一种声明性语言,即用户只需要描述所希望得到的结果,而不用关心产生结果的方法。
幻灯片22
SQL空间查询
例如,查询“找出所有与MY_HOUSE相邻的地块”用SQL可以表达为:
SELECTM.address
FROM1and_parcelL,M
WHEREAdjacent(L,M)AND
L.address=‘MYHOUSE’
DBMS的任务就是实现查询语句中指定的操作。
特别是,函数Adjacent(L,M)应该可以在SQL内调用。
通常采用的SQL-92标准支持用户定义的函数,而下一个修订版本SQL-3/SQL1999支持ADT和更多的数据结构,如列表、集合、数组和包。
集成了ADT和其他面向对象设计原则的关系数据库称为对象关系数据库管理系统(ORDBMS)。
幻灯片23
SDBMS是什么?
●SDBMS是一个软件模块
●能够与底层的DBMS协同工作
●支持空间数据模型,空间抽象数据类型(ADTs)和能调用ADTs的查询语言
●支持空间检索,处理空间操作的有效算法,以及针对领域的查询优化规则
OracleSpatialdatacartridge(暗盒),ESRISDE
●能够与Oracle8iDBMS协同工作
●具有空间数据类型(e.g.polygon),操作(e.g.叠置),可调用的SQL3查询语言
●具有空间索引,e.g.R-trees
●空间数据库是空间数据类型、操作、索引、处理策略等的集合,能够与许多后关系数据库管理系统、程序语言(如JAVA,VISUALBASIC等)协同工作。
幻灯片24
三层结构
Fig1.6
空间数据刀片
(SpatialDataBlade)
空间数据暗盒
(SpatialDataCartridge)
空间数据引擎
(SpatialDataEngine、ESRI)
幻灯片25
1.6空间数据库的内容:
SDBMS的组成
学习SDBMS的组成
●结构选择
●SDBMS的组成:
●数据模型,查询语言,
●查询处理与优化
●文件管理与索引
●数据挖掘
幻灯片26
●重温一下:
SDBMS是一个软件模块
●支持空间数据模型、空间抽象数据类型(ADTs)和能调用ADTs的查询语言
●支持空间检索、处理空间操作的有效算法、以及针对领域的查询优化规则
●组成部分包括
●空间数据模型,查询语言,查询处理,文件组织与索引,查询优化等.
●Figure1.6显示了这些组成部分
幻灯片27
1.6.1空间分类,数据模型
●空间分类法:
●组织空间的方式有多种描述
●对结构相同的关系进行拓扑建模,e.g.叠置
●在平面中对距离和方向进行欧几里得空间建模
●对连通性和最短路径进行图形建模
空间分类法:
涉及了多种可用来组织空间的描述方法,其中包括拓扑的、网状的、方位的以及欧氏几何的。
要根据我们对空间建模感兴趣的原因,来选择合适的空间描述。
幻灯片28
●空间数据模型
●识别可辨认的事物以及空间属性的规则
●实物模型(Objectmodel)帮助管理可辨认的事物,例如,山脉,城市,宗地等。
●场模型(Fieldmodel)帮助管理连续且无形的现象,e.g.湿地,卫星影像,降雪等
●更多的细节将在第2章中涉及.
幻灯片29
1.6.2空间查询语言
●空间查询语言
●空间数据类型,e.g.点,线,面,…
●空间操作,e.g.叠置,距离,最小邻域,…
●可从位于底层的DBMS中的查询语言(e.g.SQL3)中调用
●SELECTS.name
●FROMSenatorS
●WHERES.district.Area()>
300
●标准
●SQL3(a.k.a.SQL1999)是一种查询语言标准
●OGIS是一种空间数据类型和操作算子标准
●两种标准在行业中均被广泛支持
●更多的细节将在第2、3章中涉及
幻灯片30
1.6.3查询处理:
单扫描、多扫描查询举例
●应答空间查询的有效算法
●非空间连接的例子
●SELECTS.nameFROMSenatorS,BusinessB
●WHERES.soc-sec=B.soc-secANDS.gender=‘Female’
●空间连接的例子
●SELECTS.nameFROMSenatorS,BusinessB
●WHERES.district.Area()>
300ANDWithin(B.location,S.district)
S.soc-sec:
社会保障号
B.soc-sec:
拥有者的社会保障号
Fig1.7
幻灯片31
空间连接运算例子二
西双版纳县界
西双版纳森林覆盖
幻灯片32
相交
幻灯片33
1.6.3查询处理
●应答空间查询的有效算法
●一般策略-过滤-精炼
●过滤步骤:
查询区域与B,C和D的MBR(最小外包矩形)叠置
●精炼步骤:
查询区域与B与C叠置
最小外包矩形(minimumboundingrectangle,MBR)
Fig1.8
幻灯片34
连接查询的查询处理
●平面扫描(scansweep)技术
●例如–找出相交的矩形对
●(a):
R和S两个系列的矩形
●(b):
每个矩形标记两个对角:
左下角(T.xl,T.yl),和右上角(T.xu,T.yu)
●(c):
矩形按X坐标值的大小排序
Fig1.9
幻灯片35
平面扫描(planesweep)技术
(2)
●Step1:
从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。
这就是具有最小T.xl值的矩形T,例子为矩形R4。
●Step2:
搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xl>
T.xu。
显然,对于所有1≤j<
f,关系[T.xl,T.xu]∩[Sj.xl,Sj.xu]存在(非空),在本例中Sf就是S1。
注意f是以图1-9c的数组索引为序,即S1=S2、S2=S1、S3=S3。
这样S2就是一个可能与R4交叠的候选矩形。
●平面扫描过滤器从12个矩形中识别出5对相交的矩形,下一步进行精炼
幻灯片36
平面扫描(planesweep)技术(3)
Step3:
如果对任意l≤j≤f,关系[T.yl,T.yu]∩[Sj.yl,Sj.yu]存在,则Sj与T相交。
因此,这一步就确定了R4与S2的确是交叠的,并且<
R4,S2>
是连接结果的一部分。
记录所有这样的信息,然后将矩形T(R4)从集合R∪S中去掉,它不再需要参与结果集中的其他相交对。
Step4:
继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中是S2。
这时进行步骤2和3。
Step5:
当时,处理结束;
幻灯片37
1.6.4文件组织与索引
●GIS与SDBMS之间的不同
●GIS算法:
数据集被加载在主存中(Fig.1.10(a))
●SDBMS:
数据集在二级存储设备上e.g磁盘(Fig.1.10(b))
Fig1.10
a)程序员的观点b)DBMS设计者的观点
幻灯片38
用空间填充曲线组织空间数据
SDBMS使用空间填充曲线和空间索引来有效地搜索磁盘上的大型空间数据集
●空间填充曲线
●在多维空间中根据位置进行排序
行序(Fig.1.11(a),z坐标序(Fig1.11(b))
●允许在空间数据上使用传统的检索方法
N型
存在问题:
许多搜索方法均基于对数据集的排序上;
排序并不是空间数据本身具有的。
即会丢失空间的相邻性(proximity)
Z型
Fig1.11
幻灯片39
空间索引:
进行搜索时采用的数据结构
●空间索引的可选类型:
●B-tree是主键集合的线性层级,e.g.数字
●B-tree索引被用来做传统数据搜索
●B-tree与空间填充曲线一起时,可用在空间数据上
●R-tree能提供更好的搜索性能
●R-tree是矩形的层级集合
●更多的细节将在第四章涉及
Fig1.12:
B-tree
Fig.1.13:
R-tree
幻灯片40
1.6.5查询优化
●查询优化
●空间操作能用不同的策略进行处理
●每种策略的计算成本依赖于许多参数
●查询优化是对以下内容的处理
●在查询中对操作排序
●为每个操作选择有效的策略
●基于给定数据集的细节
●查询例子:
●(拥有公司的女性议员)
●优化的例子
●处理(S.gender=‘Female’)在(S.soc-sec=B.soc-sec)之前
幻灯片41
1.6.6数据挖掘
●空间数据分析有多种类型
●推理查询,e.g.搜索,排序,叠加
●归纳挖掘,e.g.统计,相关,聚类,分类,…
●数据挖掘是指在大型空间数据库中对感兴趣的非平凡模式进行系统的、半自动的搜索。
●应用例子包括
●从卫星影像上推断土地利用分类
●用高相关性识别癌症发作集群以及地理因素
●识别犯罪热点以便安排警力和社工
幻灯片42
DB中数据挖掘的前沿方向
到目前为止,对数据挖掘的研究工作大多都集中在算法设计和算法分析上面。
数据库专家可以将他们的专门知识用于两个前沿方向:
1)设计适用于更大数据集的算法,或者设计可与数据挖掘算法一起使用的通用化工具。
2)扩展SQL的“挖掘”功能,以便能够在SQL内调用挖掘工具。
将近80%的数字形式的数据实际上是空间数据,这就驱使研究人员全力创造适用于空间数据本质的挖掘技术。
(空间统计技术)
幻灯片43
1.7总结
●SDBMS对许多重要应用来说都是很有价值的
●三大类用户
●SDBMS的组成包括
●空间数据模型,空间数据类型和操作算子
●空间查询语言,处理和优化
●空间数据挖掘
●SDBMS为GIS及其他应用提供存储,查询,共享的空间数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 资料