GIS原理 总复习 总结 试题文档格式.docx
- 文档编号:16392922
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:86
- 大小:3.13MB
GIS原理 总复习 总结 试题文档格式.docx
《GIS原理 总复习 总结 试题文档格式.docx》由会员分享,可在线阅读,更多相关《GIS原理 总复习 总结 试题文档格式.docx(86页珍藏版)》请在冰豆网上搜索。
栅格系统的起始坐标应与国家基本比例尺地形图公里网的交点相一致,并分别采用公里网的纵横坐标轴作为栅格系统的坐标轴。
8栅格单元的尺寸
原则:
应能有效地逼近空间对象的分布特征,又减少数据的冗余度
方法:
用保证最小多边形的精度标准来确定尺寸经验公式:
h为栅格单元边长
Ai为区域所有多边形的面积。
9.栅格单元值的选取(一个栅格中有两个地物)
●中心点法
中心点法用处于栅格中心处的地物类型或现象特性决定栅格代码。
中心点法常用于具有连续分布特性的地理要素,如降雨量分布、人口密度等
●面积占优法
面积占优法以占栅格最大的地物类型或现象特征决定栅格单元的代码。
面积最优法最适合分类较细、地物类别斑块较小的情况
●重要性法
重要性法根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码。
这种方法对于特别重要的空间实体,其所在区域尽管面积很小或不在中心,也采取保留的原则,如稀有金属矿产区域等。
●百分比法
根据矩形区域内各要素所占面积的百分比数确定栅格单元的代码参与,如可记面积最大的两类BA也可根据B类和A类所占面积百分比数在代码中加入数字。
●其它方法
10完全栅格数据结构
特点:
最直观、最基本的网格存贮结构,没有进行任何压缩数据处理。
A
B
1)每行都从左到右记录;
AAAAABBBAABBAABB
2)奇数行从左到右,偶数行从右到左;
通常有三种组织方法:
✧以像元为记录序列。
用数组来存不同图层上同位置像元的属性值。
简单明了,便于数据修改和扩充。
✧以层为单位,每层以像元为序记录坐标及属性值。
便于属性查询、重复存储。
✧基于面域,以层为单位,每层以面域为单元为记录坐标及属性值。
便于面域边界提取、重复存储。
11压缩编码栅格数据结构
(1)游程长度编码(行程编码)
属性的变化愈少,行程愈长,则压缩的比例越大,压缩比与图的复杂程度成反比。
游程指栅格矩阵相邻同值网格的数量
基本思路:
对于一幅栅格图像,常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。
两种方法:
1)只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数,从而实现数据的压缩。
(属性值,长度)
2)逐个记录各行(或列)代码发生变化的位置和相应代码(属性发生变化的位置,属性值)
补充:
(1)游程编码能否压缩数据量,主要决定于栅格数据的性质,通常可通过事先测试,估算图层的数据冗余度Re:
Re=1-Q/(M×
N)
Q:
图层内相邻属性值变化次数的累加和
M:
为图层网格的行数
N:
为图层网格的列数
当Re的值大于1/5的情况下,表明栅格数据的压缩可取得明显的效果
(2)当栅格数据为规则的数字地形高程即DEM时,由于这种类型数据的相邻的数据具有高度的相关性,可通过差分映射进行预处理,然后在采用游程长度压缩编码法。
例如:
(3)为了提高系统对这些数据的访问效率,通常采用索引顺序文件的方法来组织数据。
当由位置参数访问其属性特征时,利用逻辑顺序和逻辑地址的关系,很快在索引文件中找到指向数据文件欲访栅格的指针,并求出其逻辑地址,就能找到该栅格的属性。
(2)块码
块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。
(x,y,r,p)
•块码具有可变的分辨率,即当代码变化小时图块大,就是说在区域图斑内部分辨率低;
反之,分辨率高。
•块码与游程长度编码相似,随着图形复杂程度的提高而降低效率,就是说图斑越大,压缩比越高;
图斑越碎,压缩比越低。
•块码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。
•然而在某些操作时,则必须把游程长度编码和块码解码,转换为基本栅格结构进行。
(3)链式编码
编码过程为:
遵循从上到下,从左到右的原则,当发现没有记录过的点而且数值也不为零时,就是起始点。
记录下该点的特征码及行列数;
然后按顺时针方向寻找,记录下后续点的方向。
优点:
链式编码对多边形的表达有很强的压缩能力,且具有一定的运算功能,如面积和周长。
且探测边界急弯和凹进部分比较容易,适用于存储图形数据。
缺点是对叠置运算等很难实施,对局部修改将改变整体结构,效率较低,在边界上存储上存在冗余。
(4)四叉树结构
一种可变分率的非均匀网格系统。
是最有效的栅格数据压缩编码方法之一
(一)四叉树基本思想:
将2n×
2n像元组成的图像(不足的用背景补上)按四个象限进行递归分割,并判断属性是否单一,单一:
不分;
不单一:
递归分割。
最后得到一颗四分叉的倒向树。
1)从四叉树的特点可知,一幅2n*2n栅格阵列图,具有的最大深度数为n,可能具有的层次为0,1,2,……..n、
2)每一层的栅格宽度,即每层边上包含的最大栅格数,反映了所在叶结点表示的正方形集合的大小,其值为:
2(最大深度-当前层次)
例:
第0层边长上的最大栅格数为2(3-0)=8
第1层边长上的最大栅格数为2(3-1)=4
第2层边长上的最大栅格数为2(3-2)=2
第3层边长上的最大栅格数为2(3-3)=1
(2)四叉树的分割方法
采用的自上而下分割以及自下而上的合并过程
自上而下方式:
自下而上方式:
(3)四叉树编码方法
①常规四叉树
记录这棵树的每个结点值及结点之间的联系,结点之间的联系用指针表示,每个结点需要6个变量:
父结点指针、四个子结点的指针和本结点的属性值。
指针不仅增加了数据的存储量,还增加了操作的复杂性:
如层次数(分割次数)由从父结点移到根结点的次数来确定,结点所代表的图像块的位置需要从根节点开始逐步推算下来。
所以,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。
②线性四叉树
线性四叉树编码是指用四叉树的方式组织数据,但并不以四叉树方式存储数据。
也就是说,它不像常规四叉树那样存储树中各个结点及其相互间关系,而是通过编码四叉树的叶结点来表示数据块的层次和空间关系。
通过记录叶结点的结点值和位置,表示数据块的层次和空间关系。
叶节点需要记录的变量:
位置,深度(几次分割)和属性。
Ø
存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。
线性四叉树可直接寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树。
定位码容易存储和执行实现集合相加等组合操作。
叶结点的地址码进行编码方法
a.基于深度和层次码的线性四叉树的编码(二进制):
它是通过记录叶结点的深度码和层次码来描述叶结点的位置码。
对一幅
x
栅格图,有n层,选用2n位作层次码,每层占2位;
用4位记录该叶结点的深度,即处于四叉树的第几层上
因为:
第一层是0,第二层是3,第三层是3,深度是3
b.基于四进制的线性四叉树编码
采用自下而上的方法进行四进制四叉树的编码:
✓根据行列号,求出每个栅格单元的四进制M码编码值:
先将栅格的行列号转换为二进制,得二进制行号Iyb,列号Ixb,则M=2×
Iyb+Ixb
✓将M编码值排序
✓检查相邻4个码的属性值,如相同,进行合并,除去最低位
✓经过一次全检测后,再检测上层的相邻四个块编码的属性值,如相同再合并
✓循环直到没有能够合并的子块为止
c.基于十进制的线性四叉树编码(MD码)
首先将二维栅格数据的行列号转换为二进制,然后交叉放入Morton码中,即为线性四叉树的地址码:
例题:
请快速建立8*8栅格阵列中的每个栅格的
Morton码,并采用自下而上的方法进行基于十进制的四叉树编码。
(5)二维行程编码
在生成线性四叉树之后,仍然存在前后叶节点的值相同的情况,故可进一步压缩数据,将前后值相同的叶节点合并,形成一个新的线性表列,即为二维形成编码。
12矢量数据结构:
通过记录坐标的方式,用点、线、面来表达地理实体的一种空间数据表示方法
13.矢量数据结构的组织
矢量数据表示时应考虑以下问题:
矢量数据自身的存贮和处理。
与属性数据的联系。
矢量数据之间的空间关系(拓扑关系)。
多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作。
对于点实体(0维对象),没有长度和宽度只记录其在特定坐标系下的坐标和属性代码;
线实体(1维对象),只有长度没有宽度:
用一系列足够短的直线首尾相接表示一条曲线。
矢量结构中只记录这些小线段的端点坐标,将曲线表示为一个坐标序列,坐标之间认为是以直线段相连,在一定精度范围内可以逼真地表示各种形状的线状地物。
“多边形”在地理信息系统中是指一个任意形状、边界完全闭合的空间区域。
其边界将整个空间划分为两个部分:
包含无穷远点的部分称为外部,另一部分称为多边形内部。
多边形的边界线同线实体一样,可以被看作是由一系列多而短的直线段组成。
1)实体式
多边形数据文件
2)索引式根据多边形边界的索引文件来检索多边形边界的坐标数据的一种数据组织形式。
与实体式相比:
用建索引的方法消除多边形数据的冗余和不一致,邻接信息、岛信息可在多边形文件中通过是否公共弧段号的方式查询。
缺点:
表达拓扑关系较繁琐,给相邻运算、消除无用边、处理岛信息、检索拓扑关系等带来困难,以人工方式建立编码表,工作量大,易出错。
3)双重独立式DIME
特点是采用了拓扑编码结构,对图上或面状要素的任何一条线段,用顺序的两点定义以及相邻多边形予以定义。
三个文件:
点文件、线文件、面文件
4)状双重独立式:
链状双重独立式数据结构是DIME数据结构的一种改进。
在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。
在拓扑结构中,多边形(面)的边界被分割成一系列的线(弧、链、边)和点(结点)等拓扑要素,点、线、面之间的拓扑关系在属性表中定义,多边形边界不重复。
在链状双重独立数据结构中,主要有四个文件:
多边形文件、弧段文件、弧段坐标文件、结点文件。
链状双重独立式编码特点:
1.拓扑关系明确,也能表达岛信息,而且以弧段为记录单位,满足实际应用需要。
2、当图形数据修改、删除、增加点、线、面要素后,其拓扑关系也发生改变,所以,需重新建拓扑。
5)曲面数据结构
拓扑关系的类型(点线面之间关系)
拓扑数据结构最重要的技术特征和贡献是具有拓扑编辑功能:
多边形连接编辑
1.检出与当前编辑的多边形P1相关的所有记录;
2.在检出的记录中,计算机检查当前编辑的多边形P1所处的位置:
若P1位在左多边形位置,将之与位于右多边形位置的多边形号相交换,同时也将该记录的结点号位置作相应的交换;
反之,若当前编辑的多边形P1位于右多边形位置,则该记录的所有数据项顺序不做改变;
3.从经过代码位置转换的记录中,任取一个起结点作为起点,顺序连接各个结点,必要时可对记录的前后顺序作调整,使得连接的结点能自行封闭。
结点连接编辑
1.检出与当前编辑的结点N2相关的所有记录;
2.在检出的记录中,计算机检查当前编辑的结点N2所处的位置:
若N2位在起结点位置,将之与位于终结点位置的结点号相交换,同时也将该记录的多边形号位置作相应的交换;
反之,若当前编辑的结点N2位于终结点位置,则该记录的所有数据项顺序不做改变;
3.从经过代码位置转换的记录中,任取一个左多边形作为起点,顺序连接各个多边形,必要时可对记录的前后顺序作调整,使得连接的多边形能首尾呼应。
曲面是指连续分布现象的覆盖表面,具有这种覆盖表面的要素有地形、降水量、温度和磁场等。
表达和存储这些要素的基本要求是必须便于计算连续现象在任一点的数值。
通常有两种表达曲面的方法,一种是不规则三角网(triangulatedirregularnetwork,TIN),另一种是规则格网(grid)。
TIN曲面数据结构通常用于数字地形的三维建模和显示。
它是将离散分布的实测数据点连成三角网,网中的每个三角形要求尽量接近等边形状,并保证由最近邻的点构成三角形,即三角形的边长之和最小。
在所有可能的三角网中,狄洛尼(Delaunay)三角网在地形拟合方面运用的较普遍,因此常被用于TIN的生成。
15.一、两种数据结构的比较
传统观念中矢量和栅格似乎是两类完全不同性质的数据结构。
✓矢量数据是面向实体的结构,即对于每个具体的目标都直接赋有位置和属性信息以及目标间的拓扑关系说明。
✓栅格数据是面向位置的结构,平面空间上的任何一点都直接联系到某一个或某一类地物。
由于矢量数据结构和栅格数据结构各具有不同的优缺点,一般对它们的应用原则是:
数据采集采用矢量数据结构,有利于保证空间实体的几何精度和拓扑特性的描述;
而空间分析则主要采用栅格数据结构,有利于加快系统数据的运行素和分析应用的进程。
因此,在数据处理阶段,经常要进行两种数据结构的相互转换。
16.矢量数据结构向栅格数据结构的转换
点的栅格化
矢量坐标点(x,y)转换后的栅格单元行列值(I,J)
I=[(y-ymin)/dy]
J=[(x-xmin)dx]
线的栅格化:
曲线可近似地看成由多个直线段组成的折线,对于直线,需要求算它所经过哪些格网单元。
设直线两端点的坐标为(x1,y1)、(x2,y2),先求出这两个端点栅格单元的行列号,然后求出中间经过的栅格。
两个端点的行列号分别是(I1,J1)(I2,J2),则行数差:
∆I=|I2-I1|,∆J=|J2-J1|。
分两种情况处理:
一是∆J>
∆I;
二是∆I>
∆J。
面的栅格化
基于弧段的栅格化方法
该方法是针对拓扑结构的矢量数据进行栅格化的方法。
对整个要进行栅格化的范围按行或者按列作中心扫描线,对其中的任一条扫描线求出所有矢量多边形的边界弧段的交点,记录其坐标,并用点的栅格化方法求出交点的栅格坐标行列值;
根据弧段的左右多边形信息判断并记录交点左右多边形的数值;
通过对一行所有交点按其坐标x值从小到大排序,并参照左右多边形配对情况,逐段生成栅格数据。
基于多边形数据的栅格化方法
●内部点扩散算法
该算法首先按线的栅格化方法把多边形边界栅格化,然后由每个多边形一个内部点(种子点)开始,向其八个方向的邻点扩散,判断各个新加入点是否在多边形边界上,如果是边界上,则该新加入点不作为种子点,否则把非边界点的邻点作为新的种子点与原有种子点一起进行新的扩散运算,并将该种子点赋以该多边形的编号。
重复上述过程直到所有种子点填满该多边形并遇到边界停止为止。
扩散算法程序设计比较复杂,并且在一定的栅格精度上,如果复杂图形的同一多边形的两条边界落在同一个或相邻的两个栅格内,会造成多边形不连通,这样一个种子点不能完成整个多边形的填充。
●射线算法和扫描算法
射线算法可逐点判断数据栅格点在某多边形之外或在多边形内,由待判点向图外某点引射线,判断该射线与某多边形所有边界相交的总次数,如相交偶数次,则待判点在该多边形外部,如为奇数次,则待判点在该多边形内部。
采用射线算法,要注意的是:
射线与多边形边界相交时,有一些特殊情况会影响交点的个数,必须予以排除。
扫描算法是射线算法的改进,将射线改为沿栅格阵列的列或行方向扫描线,判断与射线算法相似。
扫描算法省去了计算射线与多边形边界交点的大量运算,大大提高了效率。
●边界代数算法
边界代数算法是一种基于积分思想的矢量格式向栅格格式转换算法,它适合于记录拓扑关系的多边形矢量数据转换为栅格结构。
多边形编号为a,模仿积分求多边形区域面积的过程,初始化的栅格阵列各栅格值为零,以栅格行列为参考坐标轴,由多边形边界上某点开始顺时针搜索边界线,当边界上行时(图a),位于该边界左侧的具有相同行坐标的所有栅格被减去a;
当边界下行时(图b),该边界左边(前进方向看为右侧)所有栅格点加一个值a,边界搜索完毕则完成了多边形的转换。
事实上,每幅数字地图都是由多个多边形区域组成的,如果把不属于任何多边形的区域(包含无穷远点的区域)看成编号为零的特殊的多边形区域,则图上每一条边界弧段都与两个不同编号的多边形相邻,按弧段的前进方向分别称为左、右多边形。
可以证明,对于这种多个多边形的矢量向栅格转换问题,只需对所有多边形边界弧段作如下运算而不考虑排列次序:
当边界弧段上行时,该弧段与左图框之间栅格增加一个值(左多边形编号减去右多边形编号);
当边界弧段下行时,该弧段与左图框之间栅格增加一个值(右多边形编号减去左多边形编号)。
两个多边形转换过程如图所示。
●边界点跟踪算法
多边形边界的栅格单元确定后,从边界上某栅格单元开始,顺时针跟踪边界栅格,以保证多边形位于前进方向的右方。
将边界经过的格网赋予R、L、N中的一个。
R代表右方,行数一直增加的单元为R;
L代表左方,行数一直减少的单元为L;
N代表中,行数不变的单元为N。
最后逐行扫描,以多边形属性值填充所有L和R之间的栅格单元。
岛按逆时针跟踪
●复数积分算法
基本概念
也称为检验夹角之和,即对全部栅格阵列,逐个栅格单元判断栅格归属的多边形及编码。
判别方法:
由待判点对每个多边形的封闭边界计算复数积分。
如果积分值为2π,则该待判点属于此多边形,赋予多边形编号(记录属性);
如果积分值为0,则该待判点在此多边形外部。
17.矢量化的目的:
(1)将扫描仪获取的图像栅格数据存入矢量形式的空间数据库;
(2)将栅格数据进行数据压缩,将面状栅格数据转换为由矢量数据表示的多边形边界。
18.矢量化方法:
基于图像数据的矢量化方法
基于再生栅格数据的矢量化方法
19.基于图像数据的矢量化方法
图像数据是不同灰阶的影像,通过扫描仪按一定的分辨率进行扫描采样,得到不同灰度值(0-255)表示的数据。
扫描仪的分辨率一般可达0.0125mm,因此对一般粗细(0.1mm)的线条,其横断面扫描后也会有大约8个像元,而矢量的要求只能允许横断面保持一个栅格的宽度,因此需要进行二值化、细化、跟踪、去除多余点及曲线光滑、拓扑关系生成。
二值化
细化:
“剥皮法”和“骨架法”
剥皮法
思想:
从曲线的边缘开始,每次剥掉等于一个栅格宽的一层,直到最后留下彼此连通的由单个栅格点组成的图形。
不允许剥去会导致曲线不连通的栅格;
不能形成孔;
不允许剥去线段或弧段的端点。
算法案例:
1)N(p)为p的邻点的数值的和;
2)图像像素联接数T(p),如果旋转着看像素周围的点,T(p)就是p周围8个点从0变成1的次数,它反映了像素邻点的联接的块数
算法步骤如下:
✓对于栅格图像中的每个点p,进行如下操作:
如果2=<
N(p)=<
6,并且T(p)=1,则标志p点;
✓将所有被标志的栅格点赋值为0
✓如果没有被标志的点,则算法结束。
骨架法
找出图形的骨架,将非骨架上的多余栅格删除。
扫描全图,将像元值为1的栅格用v代替。
v是该栅格与北、东、东北三个相邻栅格像元值之和。
将全图转换完成之后,取v值最大为其骨架。
(有些学者提出v是该栅格单元东、西、南、北四个方向栅格像元值之和,有些学者还认为是所有3×
3栅格单元的栅格像元值之和。
)
跟踪
目的是将写入数据文件的细化处理后的栅格数据,整理为从节点出发的线段或闭合的线条,并以矢量形式存储于特征栅格点中心的坐标。
一般从西北角开始,顺时针或者逆时针,依次跟踪相邻点。
去除多余点及曲线光滑
由于上述过程是逐个栅格进行的,因此存在大量多余点需要除去,多余点去除根据直线方程求得,即找线段上连续的3个点,检查中间点是否在直线上或基本上(规定误差范围内)在直线上时,如上述条件成立则去除中间点。
同时,由于栅格精度所限,跟踪曲线可能不光滑,为此可用线性叠代法、分段三次多项式插值、样条函数插值等算法使曲线光滑。
拓扑关系生成
对于矢量表示的边界弧段数据,判断其与原图上各多边形的空间关系,以形成完整的拓扑结构并建立与属性数据的联系。
专业术语:
实体数据结构、DIME、游程、游程长度编码结构、四叉树数据结构、链码结构。
GIS中地理空间数据组织的主要对象与空间关系?
简述栅格单元的确定。
简述栅格数据压缩编码的几种方式与各自优缺点。
简述矢量数据编码的几种方式与各自优缺点。
给出一张图,试写出该图DIME数据文件和对其中多边形进行链接编辑的算法步骤,比较多边形链接编辑的异同。
栅格与矢量数据结构相比较各有什么特征?
简述矢量数据结构与栅格数据结构相互转换方法与思想。
✧专业术语:
地理空间、地理实体、矢量数据模型、栅格数据模型、影像金字塔、八叉树数据结构、三维边界表示法。
✧矢量和栅格数据的结构有通用标准吗?
请说明。
✧有人说矢量数据的实质还是栅格数据,你怎么理解这句话?
第四章空间数据库
1.空间数据库定义
空间数据库是存放空间数据的数据库。
空间数据库是描述空间实体的位置数据、位置数据元素(点、线、面、体)之间拓扑关系及描述这些实体的属性数据的数据库,是按照一定的空间数据模型组织的数据集合体。
2.GIS空间数据包括的内容:
空间特征数据包括
定位数据
拓扑数据
属性特征数据
包括地理实体或现象的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GIS原理 总复习 总结 试题 GIS 原理 复习