第五章 GIS的数据表达与数据结构Word文档格式.docx
- 文档编号:18236692
- 上传时间:2022-12-14
- 格式:DOCX
- 页数:24
- 大小:120.38KB
第五章 GIS的数据表达与数据结构Word文档格式.docx
《第五章 GIS的数据表达与数据结构Word文档格式.docx》由会员分享,可在线阅读,更多相关《第五章 GIS的数据表达与数据结构Word文档格式.docx(24页珍藏版)》请在冰豆网上搜索。
地理目标在地图上是以地图符号的形式来表示的。
4、地理实体的类型
以相同的方式表示和存储的一组类似的地理实体,可以作为地理实体的一种类型。
地理数据库设计的第一步就是选择和定义所需要的实体类型。
地理实体通常分为点状实体、线状实体、面状实体和体状实体,复杂的地理实体由这些类型的实体构成。
1°
、点状实体
点状实体是指只有特定的位置,而没有长度的实体。
如:
·
实体点——用于代表一个实体;
注记点——用于定位注记;
内点——用于负载相应多边形的属性;
结点——表示线的终点和起点;
节点——线或弧段的内部点。
2°
、线状实体
线状实体是指有长度的实体,如线段、边界、链、网络等,并且有如下特性:
长度——从起点到终点的总长;
曲率——用于表示线状实体的弯曲程度,如道路拐弯处;
方向——如水流的方向等。
3°
、面状实体
面状实体也称多边形、区域等,是对湖泊、岛屿、地块等一类现象的描述,通常有如下空间特征:
面积——面状实体所占有的范围的大小;
周长——面状实体所占有区域的周长;
独立或相邻——是独立存在,还是与其它面状实体相邻;
岛或洞——面状实体中是否有岛或洞;
重叠——面状实体之间是否有重叠。
4°
、体状实体
体状实体用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性,通常有如下空间特征:
体积
岛或洞
表面积
二、GIS的数据表达
1、空间实体对象(地理目标的类型)的定义
零维空间对象:
实体点、标号点、多边形中心点、结点、角点等。
一维空间对象:
线段、弦列(互相连接无分支的线段)、弧(曲线点轨迹)、拓扑连线(拓扑连接仅表明拓扑方向或顺序)、链(有方向的线段或弧)、环(闭合链或弦列)。
二维空间对象:
内面(不含边界)、多边形。
三维空间对象:
体元、三维组合空间目标、体空间聚合空间对象:
图象、层、栅格、图形
例:
p74
2、地理实体的描述
通常需要从如下方面对地理实体进行描述:
编码——用于区别不同的实体,有时同一个实体在不同的时间具有不同的编码,如上行和下行的火车。
编码通常包括分类码和识别码。
分类码标识实体所属的类别,识别码对每个实体进行标识,是唯一的,用于区别不同的实体。
位置——通常用坐标值的形式(或其它方式)给出实体的空间位置。
类型——指明该地理实体属于哪一种实体类型,或由哪些实体类型组成。
行为——指明该地理实体可以具有哪些行为和功能。
属性——指明该地理实体所对应的非空间信息,如道路的宽度、路面质量、车流量、交通规则等。
说明——用于说明实体数据的来源、质量等相关的信息。
关系——与其它实体的关系信息。
3、地理实体时间维的描述
如果只是地理实体的属性数据在变化,那么,可以把不同时间的属性数据均记录下来,作为该地理实体的属性数据。
例如在处理统计区域的人口数时,区域的空间位置不变,只要把新的人口数及对应的时间加入到属性数据表中即可。
当地理实体的空间位置随时间变化时,如政区界线的变化、地块的合并与重新划分等,这时必须把地理实体的空间特征的变化也记录下来,如记录实体的增加、删除、改变、移动、合并等,同时对实体进行时间标记。
4、地理目标的分层
地理目标可按某种属性特征形成一个数据层,通常称为图层。
图层是描述某一地理区域的某一(有时也可以是多个)属性特征的数据集。
因此,某一区域的地理目标可以看成是若干图层的集合。
原则上讲图层的数量是无限制的,但实际上要受GIS数据结构、计算机存储空间等的限制。
通常按以下方法对地理目标进行分层:
(1)、按专题分层
每个图层对应一个专题,包含某一种或某一类数据。
如地貌层、水系层、道路层、居民地层等。
对于不同的研究目的,地理目标可以根据不同的专题分成不同的数据层。
(2)、按时间序列分层
即把不同时间或不同时期的数据分别构成各个数据层。
地理目标分层的目的主要是为了便于空间数据的管理、查询、显示、分析等。
当地理目标分为若干数据层后,对所有地理目标的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,数据量也相对较小,管理起来就相对简单;
而对分层的地理目标数据进行查询时,不需要对所有数据进行查询,只需要对某一层数据进行查询即可,因而可加快查询速度;
分层后的数据由于任意选择需要显示的图层,因而增加了图形显示的灵活性;
对不同数据层进行叠加,可进行各种目的的空间分析。
(3)、按实体几何类型分层
因数据文件存储和属性管理的需要,因点、线、面实体在数据结构上的差别,GIS软件一般都按点、线、面类型分别存储文件。
如ARCINFO的PAT、AAT、PAT就分别是对应于点、线、面类型的数据文件。
(4)、按实体属性结构分层
即便是同一类型或统一专题的数据,因属性取值类型或属性项的不同,也需将他们分在不同的图层。
二、空间数据结构的概念
数据模型与数据结构的关系,数据模型是数据结构的逻辑描述,是定义数据结构的依据和基础,数据结构是数据模型的物理实现。
空间数据结构——是指适合于计算机存贮、管理、处理的几何数据的逻辑结构。
换句话说,是指几何数据以什么形式在计算机中存贮和处理。
空间数据结构分为矢量数据结构和栅格数据结构两大类型。
三、矢量空间数据结构
1、矢量数据的表示内容
在GIS中,矢量数据表示时应考虑以下内容:
矢量数据自身的存贮和处理(几何数据和属性数据)。
与属性数据的联系。
矢量数据之间的空间关系(拓扑关系)。
拓扑学(Topology)一词源于希腊文,意为“形状的研究”(StudyofForm)。
拓扑结构就是指在数据结构上借助拓扑几何学的概念来定义空间实体的相互关系。
拓扑学也称橡皮板几何学,注重研究图形元素之间的关系,而非几何属性的几何学。
拓扑关系是一种对空间结构关系进行明确定义的数学方法。
具有拓扑关系的矢量数据结构就是拓扑数据结构,拓扑数据结构是GIS的分析和应用功能所必需的。
拓扑数据结构的表示方式没有固定的格式,还没有形成标准,但基本原理是相同的。
(1)、拓扑元素
矢量数据可抽象为点(结点)、线(链、弧段、边)、面(多边形)三种要素,即称为拓扑元素。
点(结点)——孤立点、线的端点、面的首尾点、链的连接点等。
线(链、弧段、边)——两结点间的有序弧段。
面(多边形)——若干条链构成的闭合多边形。
(2)、最基本的拓扑关系
最基本的拓扑关系是关联和邻接。
关联——不同拓扑元素之间的关系。
如结点与链,链与多边形等。
邻接——相同拓扑元素之间的关系。
如结点与结点,链与链,面与面等。
邻接关系是借助于不同类型的拓扑元素描述的,如面通过链而邻接。
在GIS的分析和应用功能中,还可能用到其它拓扑关系,如:
包含关系——面与其它拓扑元素之间的关系。
如果点、线、面在该面内,则称为被该面包含。
如某省包含的湖泊、河流等。
几何关系——拓扑元素之间的距离关系。
如拓扑元素之间距离不超过某一半径的关系。
层次关系——相同拓扑元素之间的等级关系。
如国家由省(自治区、直辖市)组成,省(自治区、直辖市)由县组成等。
(3)、拓扑关系的表示
拓扑数据结构的关键是拓扑关系的表示,而几何数据的表示可参照矢量数据的简单数据结构。
在目前的GIS中,主要表示基本的拓扑关系,而且表示方法不尽相同。
2、GIS的代码
GIS中的代码可以分为两种,一种是分类码,另一种是标识码。
分类码——是根据地理信息分类体系设计出的各专业信息的分类代码,用以标识不同类别的数据,根据它可以从数据中查询出所需类别的全部数据。
通常把与实体有关的基本属性(如等级、类型、大小等)作为属性码分类的根据。
属性码可以有一个和多个。
标识码(亦称识别码)——是在分类码的基础上,对每类数据设计出其全部或主要实体的识别代码,用以对某一类数据中的某个实体,如一个居民地、一条河流、一条道路等进行个体查询检索,从而弥补分类码不能进行个体分离的缺陷。
标识码是联系实体的几何信息和属性信息的关键字。
标识码按一定的原则编码,简单情况下可顺序编号。
标识码具有唯一性,是联系矢量数据和与其对应的属性数据的关键字。
属性数据单独存放在数据库中。
在点的矢量数据结构中也可包含属性码。
3、矢量数据结构定义
矢量数据结构——通过坐标值来精确地表示点、线、面等地理实体的方法。
点——由一对x,y坐标表示。
线——由一串有序的x,y坐标对表示。
面——由一串有序的、且首尾坐标相同的x,y坐标对表示。
矢量数据结构可以表示现实世界中各种复杂的实体,当问题可描述成线和边界时,特别有效。
矢量数据冗余度低,结构紧凑,并具有空间实体的拓扑信息,便于深层次分析。
矢量数据的输出质量好、精度高。
点结构:
线结构:
面结构:
.矢量数据模型主要有无拓扑关系矢量数据模型和具有拓扑关系的矢量数据模型。
(1)无拓扑关系模型(面条数据模型)。
只记录空间坐标的位置和属性信息,不记录它的拓扑关系。
有两种表达方式:
A每个实体的坐标都独立存储,毫不顾及相邻多边形、线、点等要素。
又称为多边形环路法。
B建立公共边点位字典,消除独立编码的局限性,实体要素由点序组成。
按多边形环路法存储上述图形:
对于点状目标:
对于线状目标:
对于面状目标:
按点位字典法存储:
对于点状目标与环路法相同。
对于多边形或线状目标,则有两个文件存储。
点位字典文件
点号
坐标
1
x1,y1
2
x2,y2
…….
多边形文件
多边形ID
属性ID
点号串
P1
T302
5,6,7,8,9,10,11
P2
T303
1,2,3,9,8,7
……
多边形环路法的不足:
除了多边形轮廓外,其它公共边均获取和存储了两次。
会产生数据冗余,易产生裂缝和重叠。
点位字典法虽然消除了环路法的缺陷,但仍然没有建立多边形之间的拓扑关系。
(2)拓扑矢量数据模型
目前GIS软件所记录的拓扑关系只是关联关系(点、线、面),也是使用最广的一种拓扑关系,其它关系如邻接关系、连通关系等可由此关系导出。
拓扑关系主要用于空间分析,提高空间分析的计算效率。
拓扑关系的存储分为全显式表达和半隐含表达。
A、全显式表达。
又可分为从上到下表达(面—弧段—点)和从下到上表达(点—弧段—面)。
面——弧段的拓扑关系
弧段列表
-a5,-a6,-a8,-a9,a11,a12,-a13
-a1,a2,-a7,a9,a13,a10
….
弧段——结点的拓扑关系
弧段
始结点
终结点
a1
A2
3
结点——弧段的拓扑关系
结点
a7,a1
9
a12,a13,a10
弧段——面的拓扑关系
左多边形
右多边形
p2
a9
弧段—结点—面的拓扑关系
…..
B、半隐含式表达
只表达从上到下或从下到上的关系。
甚至只取其中一部分。
例如,ARC/INFO只取了
的表达。
在拓扑关系中①、④具有普遍性,但①出现了变长记录,使数据结构复杂化,须用指针解决。
②、
对网络分析很重要。
拓扑关系很好地顾及了数据的共享问题,提高了空间分析查找所花费的时间。
但要动态维护这些关系也是相当麻烦的。
尤其是海量数据的处理,为数据编辑带来了一定的工作量。
也带了数据的冗余。
4、属性数据的定义和表达
属性数据是描述实体数据的属性特征的数据。
例如,道路可以数字化为栅格表示的一组连续的象元或矢量表示的线,而道路的属性数据是指道路的宽度、等级、表面类型、建筑方法、建筑日期、特殊的交通规则、车流量等等。
这些数据可以存储在数据库中,通过唯一的标识码与相应的几何数据联系起来。
空间目标的属性特征分为两种:
A、类别特征,定义目标是什么类型的目标信息。
由分类码定义。
B、说明信息,定义目标的不同特征。
如道路的宽度、等级、路面质量等。
当属性数据的数据量较大时,通常与几何数据分开输入。
首先将属性数据输入到一个文件,经编辑、检查无误后存入数据库。
在属性数据中,有一部分是与几何数据的表示密切有关的,例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。
在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。
编码的过程是将信息转换成数据的过程,前提是首先要对需表示的信息进行分类分级。
对于不同的软件,类别码的放置位置不同。
在arcinfo中,是作为一个属性项,与说明信息一起存储在属性表中。
有的软件是将分类码集中设计为一个属性表,存储在图形数据文件中,以利于对地物进行符号化或分层显示。
如geostar软件。
例1:
ARCINFO的属性表:
PAT,AAT,PAT(多边形)
例2:
p90.(geostar)
1)、属性数据的分类分级
(1)分类的基本原则
分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。
分类是人类思维所固有的一种活动,是认识事物的一种方法。
分类的基本原则是:
、科学性:
选择事物或现象最稳定的属性和特征作为分类的依据。
、系统性:
应形成一个分类体系,低级的类应能归并到高级的类中。
、可扩性:
应能容纳新增加的事物和现象,而不致于打乱已建立的分类系统。
、实用性:
应考虑对信息分类所依据的属性或特征的获取方式和获取能力。
5°
、兼容性:
应与有关的标准协调一致。
(2)分类的基本方法
、线分类法
线分类法又称层级分类法。
它是将初始的分类对象按所选定的若干个属性或特征依次分成若干个层级目录,并编排成一个有层次的、逐级展开的分类体系。
其中同层级类目之间存在并列关系,不同层级类目之间存在隶属关系,同层类目互不重复、互不交叉。
线分类法的优点是容量较大,层次性好,使用方便;
缺点是分类结构一经确定,不易改动,当分类层次较多时,代码位数较长。
、面分类法
面分类法是将给定的分类对象按选定的若干个属性或特征分成彼此互不依赖、互不相干的若干方面(简称面),每个面中又可分成许多彼此独立的若干个类目。
使用时,可根据需要将这些面中的类目组合在一起,形成复合类目。
面分类法的优点是具有较大的弹性,一个面内类目的改变,不会影响其它面,且适应性强,易于添加和修改类目;
缺点是不能充分利用容量。
(3)分级的基本原则
分级是对事物或现象的数量或特征进行等级的划分,主要包括确定分级数和分级界线。
、确定分级数的基本原则
分级数应符合数值估计精度的要求。
分级数多,数值估计的精度就高。
分级数应顾及可视化的效果。
等级的划分在GIS中要以图形的方式表示出来,根据人对符号等级的感受,分级数应在4~7级。
分级数应符合数据的分布特征。
对于呈明显聚群分布的数据,应以数据的聚群数作为分级数。
在满足精度的前提下,应尽可能选择较少的分级数。
、确定分级界线的基本原则
保持数据的分布特征。
使级内差异尽可能小,各级代表值之间的差异应尽可能大。
在任何一个等级内都必须有数据,任何数据都必须落在某一个等级内。
尽可能采用有规则变化的分级界线。
分级界线应当凑整。
(4)分级的基本方法
在分级时大多采用数学方法,如数列分级、最优分割分级等。
对于有统一的标准的分级方法时,应采用标准的分级方法,如按人口数把城市分为特大城市、大城市、中等城市、小城市等。
也可以定性地分级,如国家、省、市、县、镇等。
2)、属性数据的编码
地理实体数据的编码指的是地理实体中属性数据的编码。
属性数据的编码是指确定属性数据的代码的方法和过程。
代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。
编码的直接产物就是代码,而分类分级则是编码的基础。
(1)代码的功能
、鉴别——代码代表对象的名称,是鉴别对象的唯一标识。
、分类——当按对象的属性分类,并分别赋予不同的类别代码时,代码又可作为区分分类对象类别的标识。
、排序——当按对象产生的时间、所占的空间或其它方面的顺序关系排列,并分别赋予不同的代码时,代码又可作为区别对象排序的标识。
(2)编码的基本原则
、唯一性——一个代码只唯一地表示一类对象。
、合理性——代码结构要与分类体系相适应。
、可扩性——必须留有足够的备用代码,以适应扩充的需要。
、简单性——结构应尽量简单,长度应尽量短。
、适用性——代码应尽可能反映对象的特点,以助记忆。
6°
、规范性——代码的结构、类型、编写格式必须统一。
(3)代码的类型
代码的类型是指代码符号的表示形式,有数字型、字母型、数字和字母混合型三类。
数字型代码——用一个或若干个阿拉伯数字表示对象的代码。
特点是结构简单、使用方便、易于排序,但对对象的特征描述不直观。
字母型代码——用一个或若干个字母表示对象的代码。
特点是比同样位数的数字型代码容量大,还可提供便于识别的信息,易于记忆,但比同样位数的数字型代码占用更多的计算机空间。
数字、字母混合型代码——是由数字、字母、专用符组成的代码。
兼有数字型和字母型的优点,结构严密,直观性好,但组成形式复杂,处理麻烦。
(4)编码方法举例
、行政区划代码(GB—2260—91)
这是一种识别码,用6位数字代码按层次分别表示省(自治区、直辖市)、地区(市、州、盟)、县(区、市、旗)的名称。
其第一、二位表示省(自治区、直辖市);
第三、四位表示省直辖市(地区、州、盟),其中01~20,51~70表示省直辖市,21~50表示地区、州、盟;
第五、六位表示县(市辖市、地辖市、县级市、旗),其中01~18表示市辖区或地辖市,21~80表示县、旗,81~99表示县级市。
例如、郑州市的代码为410100
、加拿大数字地形要素分类编码系统
这是一种分类码,且是一种数字字母混合型代码。
采用树型结构将地形要素分为四级,其代码结构为:
×
×
│││└───四级代码,三位数字
││└───三级代码,三位数字
│└───二级代码,两位数字
└───一级代码,一位数字
四、栅格数据模型
栅格数据结构——以规则的象元阵列来表示空间地物或现象的分布的数据结构,其阵列中的每个数据表示地物或现象的属性特征。
换句话说,栅格数据结构就是象元阵列,用每个象元的行列号确定位置,用每个象元的值表示实体的类型、等级等的属性编码。
主要用于表示场模型。
存储原则:
最优存储、最短处理时间。
分层组织,栅格取值唯一。
栅格数据表示的是二维表面上的地理数据的离散化数值。
在栅格数据中,地表被分割为相互邻接、规则排列的矩形方块(有时也可以是三角形、六边形等),每个地块与一个象元相对应。
因此,栅格数据的比例尺就是栅格(象元)的大小与地表相应单元的大小之比,当象元所表示的面积较大时,对长度、面积等的量测有较大影响。
每个象元的属性是地表相应区域内地理数据的近似值,因而有可能产生属性方面的偏差。
如LandsatMSS卫星影像的单个象元对应着地表79×
79m的矩形区域,影像记录的光谱数据是每个像元所对应的地表区域内所有地物光谱辐射的总和。
栅格数据记录的是属性数据本身,而位置数据可以由属性数据对应的行列号转换为相应的坐标。
栅格数据的阵列方式很容易为计算机存贮和操作,不仅很直观,而且易于维护和修改。
由于栅格数据的数据结构简单,定位存取性能好,因而在GIS中可与影像数据和DEM数据进行联合空间分析。
栅格数据的获取方式通常有:
(1)来自于遥感数据
通过遥感手段获得的数字图像就是一种栅格数据。
它是遥感传感器在某个特定的时间、对一个区域地面景象的辐射和反射能量的扫描抽样,并按不同的光谱段分光并量化后,以数字形式记录下来的象素值序列。
(2)来自于对图片的扫描
通过扫描仪对地图或其它图件的扫描,可把资料转换为栅格形式的数据。
(3)由矢量数据转换而来
通过运用矢量数据栅格化技术,把矢量数据转换成栅格数据。
这种情况通常是为了有利于GIS中的某些操作,如叠加分析等,或者是为了有利于输出。
(4)由手工方法获取
在专题图上均匀划分网格,逐个网格地确定其属性代码的值,最后形成栅格数据文件。
为了保证数据的质量,在确定栅格数据中某一象元点的代码时,通常采用的方法有:
·
中心归属法——每个栅格单元的值由该栅格的中心点所在的面域的属性来确定。
长度占优法——每个栅格单元的值由该栅格中线段最长的实体的属性来确定。
面积占优法——每个栅格单元的值由该栅格中单元面积最大的实体的属性来确定。
重要性法——根据栅格内不同地物的重要性,选取最重要的地物的类型作为栅格单元的属性值。
这种方法适用于具有特殊意义而面积较小的实体要素。
1、栅格数据分层的概念
栅格数据假设地理空间可以用平面直角坐标表示,则每个直角坐标平面中的像元只能具有一个属性值,同一像元要表示多种地理属性值值时,则需要多个直角平面,每个平面表示一种地理属性或同一属性的不同特征。
2、组织方法(存储结构)
假设层的数据文件已建立,数据文件如何组织才能达到最优数据存储、最少的空间、最短的处理过程?
(1)栅格单元独立存储结构
有三种方式:
A、以像元为记录的序列,不同层上同一个像元位置上的各属性值表示为一个数组。
B、以层为基础,每层又以像元为序记录坐标和属性值,一层记录完后再记录第二层。
C、以层为基础,每层以多边形为序记录多边形的属性值和充满多边形的各像元坐标。
上述属性值为地物属性编码值。
不是属性说明信息。
特点:
多层数据存储于一个数据文件,像元位置显示存储,可存储不规则图形。
(2)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 GIS的数据表达与数据结构 第五 GIS 数据 表达 数据结构