山东省气温空间插值方法比较研究Word文件下载.docx
- 文档编号:16733961
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:15
- 大小:1.08MB
山东省气温空间插值方法比较研究Word文件下载.docx
《山东省气温空间插值方法比较研究Word文件下载.docx》由会员分享,可在线阅读,更多相关《山东省气温空间插值方法比较研究Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
空间气候资源信息的快速发展使其在这些科学领域中起着越来越重要的作用,因而空间气候资源信息的挖掘有着广泛的应用前景,如在重大活动保障中的应用,在防灾减灾中的应用,在气候和气候变化方面的应用,在数值预报中的应用,在农业与生态中的应用,在空间天气监测预警中的应用,可以说气候信息的发展影响着人类的可持续发展。
对于气温的空间插值,基本理论依据是空间位置上越靠近的点,越可能具有相似的特征值,GIS的空间分析功能提供了很多种插值方法,各种方法由于使用算法不同而有各自的优势和局限性。
由于气象站点是有限的,获取的气温点数据的空间分布一般也是不均匀的,不同的插值方法产生的插值效果也必定因所选研究区以及所选的气象站点不同产生很大的差异,因此对各种插值方法的比较研究也是十分有意义的一项工作。
GIS提供得空间插值方法很多,本文选取了其中主要的几种插值方法:
样条函数插值法(Splines)、克里金插值法(Kriging)、反距离加权法(InverseDistanceWeight,简称IDW),对山东省100多个气象站点1991-2000十年的典型月份(一月、四月、七月、十月)的月平均气温值进行空间数据内插,对插值效果进行对比分析,并采用交叉验证法比较出插值效果最好的的月均气温空间插值方法,得出最佳的山东省月均气温空间分布图,为其它科学领域提供有效的基础数据源。
1.研究区概况及数据来源
1.1研究区概况
本文以山东省作为研究区进行气温数据空间插值的比较研究。
山东省坐落于我国东部沿海,地处黄河下游,其东面与渤海和黄海相邻。
山东锦绣壮美,资源丰富,历史悠久,名人辈出,农业发达,工业体系完备。
山东省东部和南部区域是平缓的的鲁东南丘陵区,中部地区是高突的山地区,北部和西北部为鲁西北平原区。
山东省境内河湖交错,水网密布,属温带季风气候,降水集中,雨热同季,年平均温度为11摄氏度至14摄氏度,全省气温地区差异东西大于南北。
1.2数据来源
要做空间点数据的内插,首先需获取研究区插值点的空间分布情况,本文所采用的空间插值点数据为山东省气象站点空间分布图(图1.1),从图中可以清楚的了解山东所有气象站点的分布情况,图中共有124个气象站点,且东部气象站点分布较西部稀疏,整个气象站点的分布是稠密
不均的。
图1.1山东省气象站点空间分布
空间插值点的数据获取后,主要搜集这些插值点的属性数据,本文使用的数据是山东省120多个气象站点1971-2000年的逐月温度值,由于部分气象站点的气温数据有缺失或者有误,经过筛选后一共选取了100个站点的气温数据,获取的数据为TXT文本格式,另外获取的为一个表格文件,其中包括了TXT文档数据中的气象区站号所对应的气象站点名称,以及各个站点的经纬度和海拔值。
这样气象站点的空间点数据和其对应的气象站点名称、区站号、经纬度、海拔、温度值便能一一对应起来,导入SuperMap软件中,便能进行进一步插值研究了。
2.研究目的及意义
气温是进行区域研究的重要基础数据,通过有限的气温数据插值生成研究区的气温分布数据是一项有意义的工作,它能反映气候条件的综合影响,在一定条件下也能反映热量状况,是生态、农业、资源环境等相关学科的基础数据源,各类生态系统模型都需要气候要素。
本课题的研究目的就是通过对山东省月均温度使用不同的插值方法进行插值后,对不同空间插值方法的插值效果进行比较研究,从而得出比较合理的山东省气温预测图。
发展中国家需要一个廉价、可靠的插值法来适应缺乏足够的取样站数量,这些气候变量是一个合理的规划所必须的输入数据。
研究在一个区域未取样的站点以有限数量的采样点为线索进行属性的价值估值。
本课题的主要研究意义就是通过使用不同的插值方法将从气象站点获取的空间点数据,利用空间内插和外推的方法进行气象要素的空间展布,得到区域尺度的有关参数,从而为生态、农业、资源环境等相关学科提供基础数据源,对在区域和全球尺度生态系统变化的模拟、生态系统管理、自然资源区划和管理中有着着重要作用。
3.国内外研究进展
近些年,随着地理信息系统(GIS)空间信息技术的快速发展,气候资源信息化工作得到了强有力的技术保障,渔业、生态、农业、自然资源管理等领域均以这些数据为基础,进行气候资源的评价、监测和变化分析等研究。
有很多国内外学者从不同角度对气温空间插值方法进行了比较研究,并取得了一定的成果。
张蕾等[1]利用基于温度梯度修正的空间气温内插方法对气温数据进行空间插值试验,得到了比较好的空间气温插值效果;
李莎等[2]以黑龙江省近37a的月均气温数据为研究对象,介绍了一类积分式时空协方差(变异)函数模型进行时空Kriging插值。
针对月均气温呈现出的明显季节变化,并在此基础上建立时空变异函数。
将空间维的普通Kriging插值扩展至时空维,同时考虑空间和时间相关性对研究变量进行时空估计,并将估计结果与空间Kriging插值效果进行了比较;
杨凤海等[3]以SuperMapGeostaticticalAnalyst为支撑,利用高程、坡向数据作为辅助,采用协同克里金(Cokriging)方法,对黑龙江省近10年旬平均气温进行空间插值;
李莎等[4]以月平均气温数据为例,运用时空Kriging方法结合R统计语言进行时空插值研究及其实现;
陈锋锐等[5]为了提高地表气温的插值精度,提出了融合多源信息的地表气温插值方法,该方法以地表气温和辅助信息之间显著相关为前提条件,利用多元地统计(拟协同克里金、基于局部变化均值的简单克里金、带外部漂移的克里金)来实现多源信息的融合。
SaileshSamanta等[6]利用遥感和GIS技术提出了一种建模和映射的月度和年度空气温度经验方法。
李兰海[7]采用Delta方法对24个GCMs模型月数据降尺度至0.5°
水平分辨率,分析A1B、A2和B1三个情景下新疆未来气候变化格局。
郑东凯等[8]对插值结果图以及插值精度进行了简要的分析,结果表明:
综合考虑气温分布图以及插值精度,四种插值方法的优劣程度为:
“多元回归+残差分析”的插值方法>
基于DEM的插值方法>
普通Kriging>
IDW。
从这些学者的研究当中,可以看出,即使是同一种插值方法,会由于研究区域和时间尺度的不同,而得到不同的插值效果,不同的方法插值出来的效果也有差异。
气象要素的空间分布受诸多要素影响,由于气象观测站点稀少而且分布不均,在很多地形复杂的地区,可用的气象数据非常有限,因此如何充分利用有限的气候资源,根据气候要素的空间分异规律,推测无观测点和少观测点区域的气候要素值,一直是相关学科研究的热点。
4.研究方法
空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其他空间现象的分布模式进行比较,它包括了空间内插和外推两种算法,本文的数据源为离散的气象站点的气温数据,使用空间数据的内插方法。
空间数据的内插可以表述为:
设已知一组空间数据,它们可以是离散的点的形式,也可以是多边形分区数据的形式,现在要从这些数据中找到一个函数关系式,使关系式最好的逼近这些一直的空间数据,并能根据该函数关系式推求出区域范围内其它任一点或任意多边形翻去范围的值。
这种通过任一点或多边形分区的数据,推求任一点或多边形分区数据的方法就称为空间数据的内插。
点的内插是用来建立具有连续变化特征现象的数值方法。
内插的理论基础在于对空间相关性的认知,空间相关性即对于地理上连续分布的现象,邻近点之间关联性强,较远的点之间关联性弱或者无关,这样才能用未知点附近的已知数据点的数据,推测未知点处的数据。
各种插值方法各有优缺点,没有绝对最优的,必须根据数据的特点,在对结果进行严格检验后选择一种相对最优的方法。
考虑到可操作性,本文借助地理信息系统软件中的空间分析模块,采用反距离加权插值法(IDW)、克立格插值法(Kriging)、样条函数插值法(Spline)对山东省近十年气温数据进行空间内插,通过交叉检验法比较出一种最优插值方法。
下面介绍这几种插值方法的基本原理:
4.1反距离加权插值法
反距离加权(InverseDistanceWeighted,简称IDW)插值法是一种基于相近相似的原理,即两个物体相离的越近,他们的性质就会越相似,反之,相离的越远则相似性越小。
IDW使用一组采样点的线性权重组合来确定像元值。
权重是一种反距离函数。
进行插值处理的表面应当是具有局部因变量的表面。
此方法假定所映射的变量因受到与其采样位置间的距离的影响而减小。
例如,为分析零售网点而对购电消费者的表面进行插值处理时,在较远位置购电影响较小,这是因为人们更倾向于在家附近购物。
反距离加权插值法的一般公式如下:
(3-1)
其中Zp为相邻点的高程,d为空间插值点到点p的距离;
n为固定参数,范围为1.0~6.0,通常用的值为2.0。
-n表示越靠近被插值点越重要。
反距离权重法主要依赖于反距离的幂值。
幂参数可基于距输出点的距离来控制已知点对内插值的影响。
幂参数是一个正实数,默认值为
2。
通过定义更高的幂值,可进一步强调最近点。
因此,邻近数据将受到最大影响,表面会变得更加详细(更不平滑)。
随着幂数的增大,内插值将逐渐接近最近采样点的值。
指定较小的幂值将对距离较远的周围点产生更大影响,从而导致更加平滑的表面。
4.2克里金插值法
克里金法(kriging)假定采样点之间的距离或方向可以反映可用于说明表面变化的空间相关性。
克里金法工具可将数学函数与指定数量的点或指定半径内的所有点进行拟合以确定每个位置的输出值。
克里金法是一个多步过程;
它包括数据的探索性统计分析、变异函数建模和创建表面,还包括研究方差表面。
当您了解数据中存在空间相关距离或方向偏差后,便会认为克里金法是最适合的方法。
该方法通常用在土壤科学和地质中。
由于克里金法可对周围的测量值进行加权以得出未测量位置的预测,因此它与反距离权重法类似。
这两种插值器的常用公式均由数据的加权总和组成:
(3-2)
其中:
Z(si)为第i个位置处的测量值;
λi为第i个位置处的测量值的未知权重;
s0为预测位置;
N为测量值数。
在反距离权重法中,权重λi仅取决于预测位置的距离。
但是,使用克里金方法时,权重不仅取决于测量点之间的距离、预测位置,还取决于基于测量点的整体空间排列。
要在权重中使用空间排列,必须量化空间自相关。
因此,在普通克里金法中,权重λi取决于测量点、预测位置的距离和预测位置周围的测量值之间空间关系的拟合模型。
以下部分将讨论如何使用常用克里金法公式创建预测表面地图和预测准确性地图。
(1)变异分析:
拟合模型或空间建模也称为结构分析或变异分析。
在测量点结构的空间建模中,以经验半变异函数的图形开始,针对以距离h分隔的所有位置对,通过以下方程进行计算:
(3-3)
该公式涉及到计算配对位置的差值平方。
通常,各位置对的距离都是唯一的,并且存在许多点对。
快速绘制所有配对则变得难以处理。
并不绘制每个配对,而是将配对分组为各个步长条柱单元。
空间自相关量化时采用以下地理的基本原则:
距离较近的事物要比距离较远的事物更相似。
因此,位置对的距离越近(在半变异函数云的x轴上最左侧),具有的值就应该越相似(在半变异函数云的y轴上较低处)。
位置对的距离变得越远(在半变异函数云的x轴上向右移动),就应该变得越不同,差值的平方就会更高(在半变异函数云的y轴上向上移动)。
(2)区域化变量:
当一个变量呈空间分布时,就称之为区域化变量。
这种变量反映了空间某种属性的分布特征。
(3)协方差函数。
协方差又称半方差,是用来描述区域化随机变量之间的差异的参数。
在概率理论中,随机向量X与Y的协方差被定义为:
(3-4)
区域化变量
(3-5)
在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为Z(x)的自协方差函数,即
(3-6)
区域化变量Z(x)的自协方差函数也简称为协方差函数。
一般来说,它是一个依赖于空间点x和向量h的函数。
(4)变异函数。
变异函数又称变差函数、变异矩,是地统计分析所特有的基本工具。
在一维条件下变异函数定义为,当空间点x在一维x轴上变化时,区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半为区域化变量Z(x)在x轴方向上的变异函数,记为γ(h),即:
(3-7)
在二阶平稳假设条件下,对任意的h有,
,因此上式可以改写为:
(3-8)
从上式可知,变异函数依赖于两个自变量x和h,当变异函数γ(x,h)仅仅依赖于距离h而与位置x无关时,可改写成γ(h),即
(3-9)
(5)克里金估计量。
假设x是所研究区域内任一点,Z(x)是该点的测量值,在所研究的区域内总共有n个实测点,即x1,x2,...,xn,那么,对于任意待估点或待估块段V的实测值Zv(x),其估计值是通过该待估点或待估块段影响范围内的n个有效样本值
的线性组合来表示,即
(3-10)
式中:
λi为权重系数,是各已知样本在Z(xi)在估计值时影响大小的系数,而估计值的好坏主要取决于怎样计算或选择权重系数λi
在求取权重系数时必须满足两个条件,一是使估计值的估计是无偏的,即偏差的数学期望为零;
二是最优的,即使估计值和实际值Zv(x)之差的平方和最小,在数学上,这两个条件可表示为
(3-11)
4.3样条函数插值法
样条函数(Splines)工具应用的插值方法是利用最小化表面总曲率的数学函数来估计值,从而生成恰好经过输入点的平滑表面。
其一般公式如下:
(3-15)
j=1,2,...,N;
N为点数;
λj是通过求解线性方程组而获得的系数;
rj是点(x,y)到第j点之间的距离。
根据所选的选项,T(x,y)和R(r)的定义将有所不同。
出于计算目的,输出栅格的整个空间被划分为大小相等的块或区域。
x方向和y方向上的区域数相等,并且这些区域的形状均为矩形。
将输入点数据集中的总点数除以指定的点数值可以确定区域数。
如果数据的分布不太均匀,则这些区域包含的点数可能会明显不同,而点数值只是粗略的平均值。
如果任何一个区域中的点数小于八,则该区域将会扩大到至少包含八个点。
从概念上讲,采样点被拉伸到它们数量上的高度;
样条函数折弯一个橡皮页,该橡皮页在最小化表面总曲率的同时穿过这些输入点。
在穿过采样点时,它将一个数学函数与指定数量的最近输入点进行拟合。
此方法最适合生成平缓变化的表面,例如高程、地下水位高度或污染程度。
基本最小曲率法也称为薄板插值法。
它确保表面平滑(连续且可微分),一阶导数表面连续。
在数据点的周边,梯度或坡度的变化率(一阶导数)很大;
因此,该模型不适合估计二阶导数(曲率)。
通过将权重参数的值指定为0,可将基本插值法应用到样条函数工具。
4.4技术流程图
图4.1技术流程图
5.数据处理
5.1数据预处理
首先,打开SuperMap软件,新建一个工作空间,将获取的山东省气象站点分布图导入到GIS软件中,进行配准和投影设置,然后新建一个点层面,将栅格地图矢量化,生成气象站点的空间分布矢量图。
由于获取的气象站点的温度值为TXT文档格式,如果直接导入软件中处理起来是很麻烦的,经过试验研究,本文采用的方法是在TXT文档中每一个数据后加上英文状态下的逗号,然后直接将文件后缀TXT改成XLS的表格格式,添加逗号后在表格中便识别为单元格分界线,数据便易于进行下一步处理。
由于本研究的数据量巨大,所以选取了十二个月份中的各个季度的中间月份作为代表,即一月、四月、七月、十月共四个月的温度值,在表格中进行从1991年到2000年的求平均值运算,得到了的每个站点的四个月的十年的平均温度值,然后便可将表格文件直接导入到GIS软件中生成数据库,与已经生成的空间气象站点的点层进行关联。
5.2气温数据插值处理
通过软件的插值分析模块,做出各种方法下的山东省月均气温预测图。
5.2.1反距离加权插值
(1)在SuperMap中加载地统计数据点图层。
(2)在“空间分析”选项卡上的“插值”组中,单击“距离反比权重”按钮,进入栅格插值分析向导。
(3)设置插值分析的公共参数,包括源数据、插值范围和结果数据。
(4)单击“下一步”,进入插值分析的第二步,在这一步中,需要设置样本点查找方式和其他参数(幂次)。
(5)设置样本点查找方式。
支持变长查找和定长查找两种方式。
(6)设置幂次。
幂次是权重距离的指数,控制插值时周围点的权重。
可以是大于0的任意值,最好使用0.5-3之间的值。
默认值为2。
(7)单击“完成”按钮,执行IDW插值功能。
如图4.1。
5.2.2克里金插值
(1)在“空间分析”选项卡上的“插值”组中,单击“普通克吕金”按钮,进入栅格插值分析向导。
(2)设置插值分析的公共参数,包括源数据、插值范围和结果数据。
(3)单击“下一步”,进入插值分析的第二步,在这一步中,需要设置样本点查找方式和其他参数。
可以点击“直方图”按钮,查看数据的直方图,了解数据的分布情况。
(4)设置样本点查找方式。
支持变长查找、定长查找和块查找三种方式。
(5)在设置完查找方式后,对其他参数进行设置。
其他参数包括半变异函数、旋转角度、平均值、基台值、自相关阈值、块金效应值等。
半变异函数:
单击“半变异函数”右侧的下拉箭头,选择一种函数类型。
SuperMap支持球函数、指数函数和高斯函数三种半变异函数。
使用哪个模型需要根据数据的空间自相关性和数据现象的先验知识来决定。
默认使用球函数。
旋转角度:
每个查找邻域相对于水平方向逆时针旋转的角度。
默认为0度。
块查找不支持旋转角度设置。
基台值:
半变异函数达到的顶点值,即在距离(X轴)为0时,半变异函数与Y轴相交的值。
默认为0。
自相关阈值:
半变异函数到达基台值处的距离,即X轴相应的值。
默认值为0。
块金效应值:
在h=0(X轴)时,半变异函数与Y轴相交的值。
(6)单击“完成”按钮,执行Kriging插值功能。
如图4.5、图4.6、图4.7、图4.8。
5.2.3样条函数插值
(1)在“空间分析”选项卡上的“插值”组中,单击“样条”按钮,进入栅格插值分析向导。
(5)在“张力系数”右侧的文本框中,输入张力系数值,默认为40。
张力系数是用来调整结果栅格数据表面的特性,张力越大,插值时每个点对计算结果影响越小,反之越大。
(6)在“光滑系数”右侧的文本框中,输入光滑系数值,值域为0-1,默认为0.1。
光滑系数是指插值函数曲线与点的逼近程度,此数值越大,函数曲线与点的偏差越大,反之越小。
(7)单击“完成”按钮,执行样条插值功能。
如图4.9、图4.10、图4.11、图4.12。
图5.1IDW插值方法一月份插值效果图
图5.2IDW插值方法四月份插值效果图
图5.3IDW插值方法七月份插值效果图
图5.4IDW插值方法十月份插值效果图
图5.5Kriging插值方法一月份插值效果图
图5.6Kriging插值方法四月份插值效果图
图5.7Kriging插值方法七月份插值效果图
图5.8Kriging插值方法十月份插值效果图
图5.9Splines插值方法一月份插值效果图
图5.10Splines插值方法四月份插值效果图
图5.11Splines插值方法七月份插值效果图
图5.12Splines插值方法十月份插值效果图
5.3插值结果验证与比较
交叉检验法是指把空间数据分为两部分,一部分作为训练集,即trainingSet,一部分为测试集,即testingSet,一般前者占数据的70%,后者占数据的30%,用训练集来进行训练,用测试集来进行检验,将最后的误差作为总体预测误差。
通过软件的地统计分析模块,使用交叉检验法得出检验数据样点预测值误差图,如表4.1,X轴代表样点的真实值,Y轴代表内插出来的样点值,黑线代表理论上的点值的拟和曲线,蓝线代表内插出点值的拟合曲线。
蓝线的趋势越与黑线吻合,说明插值效果越好。
最后通过交叉检验法算出各种插值方法误差的均值(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 山东省 气温 空间 方法 比较 研究