计量复习资料详解.docx
- 文档编号:4046608
- 上传时间:2022-11-27
- 格式:DOCX
- 页数:21
- 大小:61.44KB
计量复习资料详解.docx
《计量复习资料详解.docx》由会员分享,可在线阅读,更多相关《计量复习资料详解.docx(21页珍藏版)》请在冰豆网上搜索。
计量复习资料详解
第一章
1.现代地理学发展史上的计量运动
(1).计量运动的萌芽:
舍弗尔等人对区域学派的批评与否定,拉开了现代地理学发展史上的计量运动的帷幕。
计量运动主要是由美国地理学家发起的,形成了3大学派:
1艾奥瓦的经济派。
代表人物是舍弗尔、麦卡尔蒂。
受杜能、廖什、克里斯塔勒等区位论学者影响很深,极力倡导建立地理学法则,着重探讨经济区位现象间相互内在联系及其组合类型。
2威斯康星的统计派。
代表人物是威弗尔.罗宾逊、东坎和仇佐里,以经典著作《统计地理学》为代表作,主要特征是发展和应用统计分析方法。
3普林斯顿的社会物理学派。
代表人物是司徒瓦特(J・Q・Stewart)<>该派把物理学原理应用于社会现象的研究之中,发展了理论地理学中的引力模型、位势模型、空间相互作用模式。
(2).计量运动的飞速发展:
加里森(W・L.Garrison)及其领导的华盛顿小组首次把地理学的理论和方法建立在定量的基础上,编写了第一本《计量地理学》教材,率先在华盛顿大学举办了地理计量方法研讨班,培养了大批现代地理学名家。
美国区域科学协会组织了大量的学术活动,编辑出版了《区域科学年鉴》,成为美国计量运动的源地之一。
瑞典学者哈格斯特朗积极组织瑞典和美国的地理学家交流学术思想,大大促进了计量运动向全世界的扩散。
⑶、计量运动中涌现的著名学派、组织和学术刊物:
英国以乔莱(R.J.Chorley)^哈格特(P.Hagge11)和哈威(D.Harvey)等为代表的剑桥学派;
1964年国际地理学联合会(IGU)设立的地理计量学方法委员会;
1967年英国地理学会设立的地理教学采用模型和计•量技术委员会;
1968年曰本成立的计量地理学研究委员会,1973年乂改称理论、计量地理学委员会;
1963年英国出版的《地理学计量资料杂志》和1969年美国出版的《地理分析——国际理论地理学》杂志。
2.地理计量化的表现:
(1)、古代地理学和近代地理学中的数学方法限于定量地描述、记载和解释。
(2)、现代地理学中运用数学方法,是为了深入地进行定量化研究,揭示地理现象发生、发展的内在机制及运动规律,从而为地理系统的预测及优化调控提供科学依据。
3.计量地理学的发展经历了那几个阶段:
第一阶段(20世纪50年代末期到60年代末期)
把统计•学方法引入地理学研究领域,构造一系列统计量来定量地描述地理要素的分布特征,应用各种概率分布函数、方差等简单的统计特征回归分析方法。
分布中心、区域形状、地理要素分布的集中和离散程度等都有了定量指标,许多地理要素间的相关关系,也可以进行定量地表示。
第二阶段(20世纪60年代末期到70年代末期)
多元统计分析方法和电子计算机技术在地理学研究中广泛应用。
以电子计算机技术为手段,许多地理学家熟练地掌握了多元统计方法,具备了分析多因素、复杂结构和动态特征等复杂地理问题的能力。
第三阶段(20世纪70年代末期开始到80年代末期)
系统理论、系统分析方法、系统优化方法、系统调控方法等被引进地理学研究领域,促进了运筹学中的规划方法、决策方法、网络分析方法,以及数学物理方法、模糊数学方法、分形儿何学方法、非线性分析方法等一系列现代数学方法的形成。
同时GIS技术的发展为其提供了先进的技术手段支持。
第四阶段(20世纪90年代初至今)
按照英国著名地理学家、里兹大学S.奥彭肖(S・Openshaw)教授的提法,90年代初进入计•算地理学(GeocomputationalGeography)时代。
得益于计算机技术与计算理论和方法的巨大发展和3S技术在获取大容量、整体性地理数据信息中的成功应用,以向量或并行处理器为基础的超级计算机为工具,对“整体”、“大容量”资料所表征的地理问题实施高性能计算,探索构筑新的地理学理论和应用模型。
4.计量地理学包括哪些主要内容:
(1)>研究对象:
①地理空间与过程的研究;②生态研究;③区域研究。
⑵.研究内容:
①空间分布规律性;②空间要素分析:
③空间过程分析;④地理系统模拟、预测和规划。
5.计量地理学的应用主要包括哪些方面:
⑴分布型分析一一对地理要素的分布特征及规律进行定量分析。
⑵相互关系分析一一对地理要素、地理事物之间的相互关系进行定量分析。
⑶分类研究一一对地理事物的类型和各种地理区域进行定量划分。
⑷网络分析一一对水系、交通网络、行政区划、经济区域等的空间结构进行定量分析。
⑸趋势面分析一一做岀地理要素的趋势等值线图,展示所要分析的地理要素的空间分布规律。
⑹空间相互作用分析一一定量分析各种“地理流”在不同区域之间流动的方向和强度。
⑺系统仿真研究,步骤:
1对复朵地理系统的各种系统要素之间的相互关系与反馈机制进行分析,构造系统结构;
2建立描述系统的数学模型;
3以适当的计•算方法与算法语言将数学模型转化为计算机可以识别运行的工作模型:
4运行模型,对真实系统进行模拟仿真,从而揭示其运行机制与规律。
⑻过程模拟与预测研究:
通过对地理过程的模拟与拟合,定量地揭示地理事物、地理现象随时间变化的规律,预测其未来发展趋势。
⑼空间扩散研究:
定量地揭示各种地理现象,包括自然现象、经济现象、社会现象、文化现象、技术现象在地理空间的扩散规律
Q6空间行为研究:
主要是对人类活动的空间行为决策进行定量的研究。
(1D地理系统优化调控研究:
运用系统控制论的有关原理与方法,研究人地相互作用的地理系统的优化调控问题,寻找人口、资源、环境与社会经济协调发展的方法、途径与措施。
⑫地理系统的复杂性研究:
地理系统是高度复杂的巨系统,其复杂系统研究已经引起了国际地理学界的高度重视。
6.在地理学研究中应用计量地理学方法应该注意的主要问题:
⑴、地理数据的筛选与质量检验问题:
地理数据在建模分析中的作用:
1确定模型中的参数与初值;
2检验模型的正确性、合理性和有效性。
⑵.模型的建造问题
建模程序(威尔逊,英国)
1建造一个数学模型,首先必须明确建模的LI标;
2地理问题,即所研究的对象系统,其构成要素;
3在各类变量中必须明确哪些变量是可控变量,即通过对哪些变量的调控可以使系统的行为发生改变;
4在模型中,如何处理时间概念,即认为被研究的对象系统是无记忆系统还是记忆系统,是建立静态模型还是建立动态模型;
5所建模型将采用什么观点、解决哪些理论问题、与此问题有关的建立模型的基本假设,以及所依据的理论、将要解决的问题等都将直接或间接地体现在模型之中;
6能用于建模的有关数据、资料是什么,可能性如何,应釆用何种建模技术,有现成的技术方法可供借鉴还是需要建造新模型,釆用什么方法确定模型的参数;
7所建模型的精度及该模型的合理性和有效性如何,采用什么方法和手段检验所建模型。
⑶、数学方法和GIS的结合
1研究一些复杂的地理问题,需要综合应用多种数学方法,建立一系列具有分析、模拟、仿真、预测、规划、决策、调控等多种功能的众多模型组成的模型系统。
这些模型系统离不开GIS的支持。
2GIS的基本技术及建造空间分析模型需要借助有关的数学方法来实现。
近儿年来出现的基于知识的空间决策支持系统(苏理宏等,2000)就是数学方法、人工智能技术与GIS技术在地理学应用研究领域中相互结合的成功典范。
第二章
平均值:
反映了地理数据一般水平。
计算方法:
1未分组的地理数据
2分组的地理数据
7=4
m
工力
Z=1
中位数:
①对于未分组的地理数据,样本数G为奇数时,中位数是位置排在第
("1)/2位的数据;样本数力为偶数时,中位数是排在中间位置的两个数据的平均值。
②分组的地理数据,中位数的计算方法:
确定中位数所在的组位置,按下述公式计算中位数
恥代表中位数;
Z为中位数所在组的下限值;
〃为中位数所在组的上限值;
曲为中位数所在组的频数;
Snr\为中位数所在组以下的累计频数;
为中位数所在组以上的累计频数;
d为中位数所在组的组距。
众数:
众数就是出现频数最多的那个数,计算方法分为以下两种情况:
①未分组的地理数据,可以根据每一个数据出现的频数大小直接确定众
②对于已经分组的地理数据,中位数的讣算步骤如下:
确定频数最多的组为众数所在组。
按以下公式计算众数
M。
=L+dx—M()=U—dx—亠-
△+d或者A+d
代表众数;
厶为众数所在组的下限值;
〃为众数所在组的上限值;
△1为众数组频数与下一组频数之差;
△2为众数组频数与上一组频数之差;
d为众数所在组的组距。
极差:
指所有数据中最大值与最小值之差,计算公式为:
''
离差:
指每一个地理数据与平均值的差,计算公式为:
d{=xi~x离差平方和:
它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为:
=牙-X)
/=1
方差与标准差:
方差是从平均概况衡量一组地理数据与平均值的离散程度。
91n—o
=_Z(乂*_乂)2
ni=\
标准差为方差的平方根,计算公式为:
如果以样本方差对标准差进行无偏估计,则计算公式为
(x-r)2
S=7——
O
变异系数:
变异系数表示地理数据的相对变化(波动)程度
st艺(R-乂)_
Cv==X100%=-AX100%
xxVn—\
O
洛伦兹曲线:
使用累汁频率曲线研究工业化的集中化程度。
集中化指数:
是一个描述地理数据分布的集中化程度的指数。
1地理数据类型
地理数据划分成两大基本类型即空间数据和属性数据。
/空间数据:
用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范用及空间联系。
/属性数据:
用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征。
联系:
空间数据和属性数据都是用于表述地理位置和地域空间范圉的特征,具有地理数据的一切特征。
区别:
空间数据和属性数据在测度方式和测度标准上存在不同。
1各种类型的地理数据的测度方法分别是什么
空间数据:
可以用点,线,面三种儿何实体以及描述它们之间空间联系的拓扑关系
;点一一由一个独立的坐标点(X,刃定位,是空间上不可再分的儿何实体。
/线一一由若干个(至少两个,理论上是无穷个)坐标点(Myi)(2=1,
2,…)定义,有一定的长度和走向,表示线状地物或点实体之间的联系。
/面一一表示在空间上连续分布的地理景观或区域。
/点、线、面之间的拓扑关系。
属性数据:
乂可以进一步分为两种类型,即数量标志数据和品质标志数据数量标志数据:
根据测度标准可以划分两种类型
1间隔尺度数据:
以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。
2比例尺度数据:
以无量纲的数据形式表示测度对象的相对量。
品质标志数据:
根据测度标准可以划三种类型
1有序数据:
(对数列排序,这种数据并不表示量的多少,而只是给岀一个等级和次序)当测度标准不是连续的量,只是表示其顺序关系的数据。
2二元数据:
(对于二元数据有非此即彼的性质)用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题。
3名义尺度数据:
(对于名义尺度数据是用数字作为地理实体、地理要素等的代号)用数字表示地理实体、地理要素、地理现象或地理事件的状态类型
2根据数据画出洛伦兹曲线和计算集中化指数(此题是作业题LI)
以2004年为例:
(1)计算2004年各亚区的GDP占总GDP的比重(百分比),从大到小重新排序;
(2)从大到小,逐次计算累计百分比;
(3)以9个亚区自然顺序为横坐标(0,累计百分比为纵坐标(y);画出曲线即为洛伦兹曲线。
起上凸的程度越大表示该地区GDP越集中在某个亚区中,该亚区对地区GDP影响越大,各个亚区的GDP差异越大。
I=A—/€
集中化指数:
=M
常釆用如下近似取值方法:
A——实际数据的累计白分比总和:
R——均匀分布时的累计百分比总和;
.1/——集中分布时的累计百分比总和。
(即正方形的面积)
显然,Z越大,就说明数据分布的集中化程度越高;反之,Z越小,就说明数分布的集中化程度越低(越均衡)。
集中化指数在[0,1]区间上取值。
只有数据的个数相同而且横坐标划分一致时,才有可比性。
第三章地理学中经典统计分析方法
相关分析的任务,是揭示地理要素之间相互关系的密切程度。
•相关系数:
■1、定义:
见书上P47
■2、说明:
-1<=r<=l,大于0时正相关,小于0时负相关。
r的
绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。
3、检验:
f称为自由度,其数值为52,刀为样本数:
上方的a代表不同的置信水平;表内的数值代表不同的置信水平下相关系数P二0的临界值,即ra;公式的意思是当所计算的相关系数r的绝对值大于在a水平下的临界值厂。
时,两要素不相关(即p二0)的可能性只有ao
秩相关:
乂称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
偏相关系数的计算与检验
定义:
在多要素所构成的地理系统中,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。
用以度量偏相关程度的统计量,称为偏相关系数。
性质:
①偏相关系数分布的范围在-1到1之间;
2偏相关系数的绝对值越大,表示其偏相关程度越大;
3偏相关系数的绝对值必小于或最多等于山同一系列资料所求得
的复相关系数,即R1•23372•3°
复相关系数的计算与检验
复相关系数:
反映儿个要素与某一个要素之间的复相关程度
性质:
①复相关系数介于0到1之间
②复相关系数越大,则表明要素(变量)之间的相关程度越密切。
复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。
3复相关系数必大于或至少等于单相关系数的绝对值。
一元线性回归模型
假设有两个地理要素(变量)x和%x为自变量,y为因变量儿/如+心记和分别为参数◎与E的拟合值,八则一元线性回归模型为
y=a+bx
代表'与y之间相关关系的拟合直线,称为回归直线:
是y的估计值,亦称回归值。
参数织厶的最小二乘估计
参数$与E的最小二乘拟合原则要求yf与y的误差訂的平方和达到最小统计量F(见P62)
尸越大,模型的效果越佳。
统计量尸〜尸(1,/t-2)o在显著水平。
下,若DF则认为回归方程效果在此水平下显著。
一般地,当尺刊・10(l,n-2)时,则认为方程效果不明显。
多元线性回归模型P63
时间序列分析的基本原理
时间序列的组合成份
■长期趋势(T)
是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。
■季节变动(S)
是指时间序列在一年中或固定时间内,呈现出的固定规则的变动。
■循环变动(0)
是指沿着趋势线如钟摆般地循环变动,乂称景气循环变动。
■不规则变动(D
是指在时间序列中曲于随机因素影响所引起的变动。
时间序列的组合模型
■加法模型
假定时间序列是基于4种成份相加而成的。
长期趋势并不影响季节变动。
若以F表示时间序列,则加法模型为
Y二T+S+C+I
・乘法模型
假定时间序列是基于4种成份相乘而成的。
假定季节变动与循环变动为长期趋势的函数。
该模型的方程式为Y二
■趋势拟合方法:
(平滑法--一移动平均法,滑动平均法,指数平滑法
趋势线法——直线,指数,抛物线)
自回归模型
时间序列的自相关,是指序列前后期数值之间的相关关系,对这种相关关系程度的测定便是自相关系数
季节性预测法
■基本步骤
(1)对原时间序列求移动平均,以消除季节变动和不规则变动,保留长期趋势;
(2)将原序列y除以其对应的趋势方程值(或平滑值),分离岀季节变动(含不规则变动),即季节系数二ZSC7/趋势方程值(7T或平滑值)二SI
(3)将月度(或季度)的季节指标加总,以由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。
(4)求预测模型,若求下一年度的预测值,延长趋势线即可;若求各月(季)的预测值,需以趋势值乘以各月份(季度)的季节性指标。
常用的聚类要素的数据处理方法有如下几种:
1总和标准化:
分别求出各聚类要素所对应的数据的总和,以各要素的数据
除以该要素的数据的总和
2标准差标准化:
各要素的平均值为0,标准差为1
3极大值标准化:
各要素的极大值为1,其余各数值小于1。
4极差的标准化:
各要素的极大值为1,极小值为0,其余的数值均在0与
1之间。
距离的计算:
①绝对值距离②欧氏距离③明科夫斯基距离④切比雪夫距离P84
直接聚类法原理:
先把各个分坯对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。
如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。
每一次归并,都划去该对象所在的列与列序相同的行。
经过斤1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图及聚类关联表。
最短距离聚类法原理
最短距离聚类法,是在原来的mXm距离矩阵的非对角元素中找出〃的=min{d/把分类对象Gp和Gq归并为一新类6?
然后按计算公式P86计算原来各类与新类之间的距离,这样就得到一个新的(加一』)阶的距离矩阵;再从新的距离矩阵中选出最小者dij.把Gi和0•归并成新类;再计•算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。
最远距离聚类法(类似)
主成分分析法
主成分分析方法就是综合处理这种问题的一种强有力的工具,是把原来多个变量划为少数儿个综合指标的一种统讣分析方法,从数学角度这是一种降维处理技术
原理及计算步骤:
P95
趋势面分析的一般原理
趋势面分析,是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种数学方法,它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素
在地域空间上的变化趋势。
趋势面分析方法常常被用来模拟资源、环境、人口及经济要素在空间上的
分布规律,它在空间分析方面具有重要的应用价值。
趋势面分析的一个基本要求,就是所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合度精度才能达到足够的准确性。
趋势面分析的核心:
从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和趋于最小P101
估计趋势面模型的参数
■实质:
根据观测值zi,xi,yi(2=1,2,…,刀)确定多项式的系数aO,ah•••,ap9使残差平方和最小。
■过程:
①将多项式回归(非线性模型)模型转化为多元线性回归模型。
2求其残差平方和
3求0对aO,日1,…,矽的偏导数,并令其等于0
4用矩阵形式表示
检验:
趋势面与实际面的拟合度系数农是测定回归模型拟合优度的重要指标。
1、一般用变量z的总离差平方和中回归平方和所占的比重表示回归模型
的拟合优度。
总离差平方和等于回归平方和与剩余平方和之和,回归平方和越大或剩余平方和越小就表示因变量与自变量的关系越密切,回归的规律性越强、效果越好。
2、趋势面适度的尸检验
是利用变量z的总离差平方和中剩余平方和与回归平方和的比值,确定变量z与自变量扒y之间的回归关系是否显著,在显著性水平。
下,查尸分布表得尸a,若计算的尸值大于临界值Fa.则认为趋势面方程显著;反之则不显著。
3、趋势面适度的逐次检验
(1)求出较高次多项式方程的回归平方和与较低次多项式方程的回归平方和之差;
(2)将此差除以回归平方和的自山度之差,得岀山于多项式次数增高所产生的回归均方差;
(3)将此均方差除以较高次多项式的剩余均方差,得岀相继两个阶次趋势面模型的适度性比较检验值尸。
课后习题:
1.相关分析:
是揭示地理要素之间相互关系的密切程度的统讣指标。
长期趋势(T):
是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。
季节变动(S):
是指时间序列在一年中或固左时间内,呈现岀的固泄规则的变动。
2.回归分析:
是研究要素之间具体数咼关系。
联系:
都是揭示地理要素之间关系的传统的统讣分析方法,后者主要侧重于数量关系研究。
(仅供参考)
3•时间序列分析:
要素的数据按照时间顺序变动排列而形成的一种数列,它反映了
要素随时间变化的发展过程。
地理过程的时间序列分析:
通过分析地理要素随时间变化的历史过程,揭示其发展变化规律,并对其未来状态进行预测。
4•系统聚类分析:
它是研究多要素事物分类问题的数量方法,基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,左量的确左样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。
三种:
直接聚类法,最短距离聚类法,最远距离聚类法
距离的计算:
①绝对值距离②欧氏距离③明科夫斯基距离④切比雪夫距离P84
5.趋势面分析的一般原理
趋势而分析,是利用数学曲而模拟地理系统要素在空间上的分布及变化趋势的一种数学方法,它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。
趋势而分析方法常常被用来模拟资源、环境、人口及经济要素在空间上的分布规律,它在空间分析方而具有重要的应用价值。
趋势而分析的一个基本要求,就是所选择的趋势而模型应该是剩余值最小,而趋势值最大,这样拟合度精度才能达到足够的准确性。
6.主成分分析法
主成分分析方法就是综合处理这种问题的一种强有力的工具,是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度这是一种降维处理技术原理及计算步骤:
P95
第四章空间统计的初步
1•什么是空间数据的统计分析?
它与传统的统计分析方法有何区别,为什么不能用传统统计方法解决空间数据的统计分析问题?
空间统计分析,即空间数据(spatialdata)的统计分析,是现代计量地理学中一个快速发展的方向和领域。
空间统讣分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。
空间数据间并非完全独立,而是存在某种空间联系和关联性,但是经典的统计分析方法的基本出发点是样本独立假设。
由于空间依赖性的存在打破了大多数经典统讣方法中样本相互独立的基本假设,因此无法直接用经典的统讣方法分析解释与地理位置相关的空间数据关联和依赖性。
2.Moran点图的意义?
在Moran散点图中,第一,二,三,四象限分别表示什么含义?
以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳左性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示
第1象限代表了高观测值的区域单元被同是髙值的区域所包用的空间联系形式;
第2象限代表了低观测值的区域单元被髙值的区域所包围的空间联系形式:
第3象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式;
第4象限代表了髙观测值的区域单元被低值的区域所包用的空间联系形式。
3.什么是区域化变量?
什么是协方差函数和变异函数?
三者之间的关系如何?
变异函数的四个重要参数的含义?
当一个变量呈现为空间分布时,就称之为区域化变量(regionalizedvariable)0这种变量常常反映某种空间现
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 复习资料 详解