计量地理学第三次作业.docx
- 文档编号:5366913
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:15
- 大小:701.89KB
计量地理学第三次作业.docx
《计量地理学第三次作业.docx》由会员分享,可在线阅读,更多相关《计量地理学第三次作业.docx(15页珍藏版)》请在冰豆网上搜索。
计量地理学第三次作业
一、主成分分析
1、数据来源
查阅《浙江省统计年鉴2014》与《浙江省土地利用总体规划(2006—2020)》。
选取杭州市、宁波市与绍兴市三个地级市的县级行政单位的人口、财政收入、国民生产总值、居民收入、三次产业从业人数与产值、粮食产量、耕地面积、居民点面积等数据。
2、研究方法与数据处理
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。
在土地评价中用主成分分析的方法把大量错综复杂的变量变成几个少数几个综合因子是一种常见方法。
2.1数据预处理
影响土地整治的因素很多,例如当地的经济水平,人口的变化发展、土地集约程度、产业发展状况等。
现参考其它研究成果,选取人均财政收入(X1)、人均生产总值(X2)、农村居民人均纯收入(X3)、农村居民二三产从业比(X4)、农村居民二三产产值比(X5)、人均粮食产量(X6)、人均耕地面积(X7)、农村居民人均居民点面积(X8)等八项数据作为环杭州湾土地整治优先度评价的指标。
根据初始数据计算出八项指标数值如表1。
表1环杭州湾区域土地整治优先度评价指标
区域
x1
x2
x3
x4
x5
x6
x7
x8
杭州市区
1.68
14.03
1.85
0.82
0.93
100.15
0.24
42.61
桐庐县
0.48
6.38
1.52
0.73
0.87
228.70
0.55
135.09
淳安县
0.25
3.50
0.94
0.53
0.74
205.82
0.42
101.49
建德市
0.31
4.85
1.31
0.58
0.85
194.47
1.67
220.45
富阳市
0.64
8.27
1.74
0.69
0.90
225.95
0.46
131.60
临安市
0.45
7.24
1.58
0.73
0.87
169.76
0.47
134.61
宁波市区
2.22
17.53
2.02
0.87
0.93
113.54
0.42
74.70
余姚市
0.74
8.50
1.80
0.80
0.90
250.68
0.72
143.05
慈溪市
0.78
9.20
2.04
0.87
0.91
116.97
0.63
84.12
奉化市
0.50
5.67
1.77
0.74
0.83
149.00
0.77
91.18
象山县
0.50
6.23
1.64
0.62
0.72
193.49
0.70
136.32
绍兴市区
0.97
9.05
1.88
0.86
0.92
90.12
0.17
43.86
诸暨市
0.49
7.66
1.91
0.81
0.88
358.48
0.51
130.92
上虞市
0.50
7.42
1.77
0.69
0.86
377.84
0.54
114.76
嵊州市
0.27
4.95
1.49
0.74
0.85
232.67
0.54
117.01
绍兴县
0.97
13.97
2.18
0.88
0.92
289.13
0.35
78.16
新昌县
0.46
6.45
1.46
0.65
0.90
185.24
0.43
103.53
2.2数据分析步骤
(1)将表1数据导入spss软件,设置变量视图与数据视图,如图1、图2。
图1导入数据
(2)点击“分析”—“降维”—“因子分析”,将上述的8个指标选择为变量。
SPSS中的“主成分分析”嵌入到“因子分析”中。
如下图。
图2
(3)依次设置“因子分析”框中的“描述”、“抽取”、“旋转”、“得分”、“选项”,勾选相应的选项,如下图。
图3描述统计图4抽取
图5旋转图6因子得分
图7选项
(4)点击确定,得到输出文档,如下图
图4输出文档
2.2数据分析结果
(1)经KMO和巴特利特球度检验,发现各变量之间的相关系数较高,适合提取公因子,并做因子分析。
SIg为0.000,小于显著性水平0.05,显著性较强,KMO为0.689,接近于0.7,大于0.5,说明适合做相关性分析。
表2KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.689
Bartlett的球形度检验
近似卡方
110.489
df
28
Sig.
.000
(2)公因子方差是指全部公共因子对于变量的总方差做所的贡献,说明了全部公共因子反映出的原变量的信息的百分比。
例如:
X6的共同度是0.918,即提取的公因子对原变量的方差作出了91.8%的贡献。
据表3提取公因子之后各个变量的数值都比较大,说明在变量空间转化为因子空间是,保存了比较多的信息,因此因子分析的效果是显著的。
表3公因子方差
初始
提取
X1
1.000
.851
X2
1.000
.868
X3
1.000
.862
X4
1.000
.877
X5
1.000
.720
X6
1.000
.918
X7
1.000
.950
X8
1.000
.938
提取方法:
主成份分析。
(3)表3中可以看到各个特征值的贡献率以及累积贡献率。
可见,在本次分析中,前三个因子的累积贡献率已达到87.281%。
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
4.718
58.972
58.972
4.718
58.972
58.972
3.652
45.653
45.653
2
1.249
15.613
74.585
1.249
15.613
74.585
1.931
24.140
69.793
3
1.016
12.696
87.281
1.016
12.696
87.281
1.399
17.488
87.281
4
.479
5.983
93.265
5
.355
4.438
97.703
6
.093
1.166
98.869
7
.068
.851
99.719
8
.022
.281
100.000
提取方法:
主成份分析。
(4)图5为碎石图,横坐标为因子数,纵坐标为特征值,从图中可以看出前面三个因子的特征值比较大,都大于1,从第三个因子以后,折线平缓,因此,本次分析选择前面三个因子。
图5碎石图
聚类分析
1、数据来源
查阅《浙江省统计年鉴2014》与《浙江省土地利用总体规划(2006—2020)》。
选取杭州市、宁波市与绍兴市三个地级市的县级行政单位的人口、财政收入、国民生产总值、居民收入、三次产业从业人数与产值、粮食产量、耕地面积、居民点面积等数据。
2、研究方法与数据处理
2.1研究方法
聚类分析,亦称群分析或点群分析,它是研究多要素事物分类问题的数量方法。
其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。
最近邻元素:
也是最近距离法。
定义类与类之间的距离为两类中最近的样品之间的距离。
3、实验步骤
(1)点击“分析”—“分类”—“系统聚类”,将上述的7个指标选择为变量。
如图所示。
(2)依次点击“系统聚类分析”框中的“统计量”、“绘制”、“方法”、“保存”,勾选相应的选项,如图所示。
方法选择:
最近邻元素(最近距离法)、距离选择:
欧式距离。
(3)点击“确定”,得到相应的结果,如图所示
案例处理汇总a,b
案例
有效
缺失
总计
N
百分比
N
百分比
N
百分比
17
100.0
0
0.0
17
100.0
a.Euclidean距离已使用
b.单个联结
上图给出了样本处理的基本信息,包括样本数为31、含有缺失值的样本数为0以及百分比等。
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
2
5
4.837
0
0
4
2
1
12
11.291
0
0
12
3
7
9
13.115
0
0
11
4
2
15
16.409
1
0
6
5
3
17
20.899
0
0
9
6
2
8
23.477
4
0
9
7
6
11
23.815
0
0
10
8
13
14
25.220
0
0
16
9
2
3
31.053
6
5
10
10
2
6
32.867
9
7
13
11
7
10
32.991
3
0
12
12
1
7
34.952
2
11
13
13
1
2
38.297
12
10
14
14
1
16
69.134
13
0
15
15
1
4
84.154
14
0
16
16
1
13
87.368
15
8
0
a.上表是聚类过程表,其中勒出了聚类中观测量或者合并的顺序。
试验中共有17个观测量,经过16步的聚类,所有的观测量被合并为1类。
b.第一步,首先将距离最近的号观测量合并为一类G1(首次出现阶聚类中,群集1=群集2=0),出现复聚类的下一阶段为第二步。
c.第二步是将21号样品并入G1类中(首次出现阶聚类中,群集1=0、群集2=1),形成G2类,下一阶段的复聚类将出现在第4步。
以此类推。
d.随着聚类进程,系数的数值一直在增大,说明聚类刚开始的时候样品或者类间的差异比较小,聚类结束时,类与类的差异变得比较大,体现了聚类分析的基本思想。
判别分析
案例:
国家分类与判别。
这个例子的数据来源于联合国开发计划署(UN-DP)发表的《2000年人类发展报告》。
UN-DP的人类发展报告采用出生时预期寿命、成人识字率、人均GDP等的指标将全世界的国家分为三类:
高人类发展水平、中等人类发展水平和低人类发展水平。
为了简明起见,不妨分析其中两类国家:
第一类为高人类发展水平(抽取6个国家作为样品),第二类为中等人类发展水平(抽取8个国家作为样品),另外抽取4个国家作为待判别类样品。
指标选取三个:
出生时预期寿命、成人识字率和人均GDP。
1、将表格数据输入SPSS中,并增加新的变量“发展水平”,将发展水平送入到分组变量框,然后定义它的区域,最小值为0,最大值为1。
然后再将出生时预期寿命、承认识字率、人均GDP这三个变量送入解释变量的框。
如下图所示
需要注意的是在分类窗口下选择“个案结果”,SPSS就会输出对每个个体的判别结果。
2、点击确定便可完成基本的判别分析,
(1)上图反映的是有效样本量及变量缺失的情况。
图中显示的待判别的国家类别有四个,与SPSS中的数据视图一致;
(2)上图中第一张表反映判别函数的特征值、解释方差的比例和典型相关系数;第二张表示对第一个判别函数的wilks’lambda检验。
统计值的显著性概率表明这两类有显著的差异。
(3)上图显示的是判别函数、判别载荷和各组的重心。
第一张表示标准化的判别函数。
表示为Y=0.943X1+0.514X2+0.102X3。
第二张表是结构矩阵,即判别函数。
(4)上图为每个个体的判别结果。
表的最后一列为典型判别函数之值,是我们进行判别的主要依据,并参考第三列给定的预测组结果,我们得出如下结论:
第15、16个数目,即瑞典和希腊,判别式得分接近第一分组,因此我们判别其为高人类发展水平的国家;同样可得,第17、18个数目,即中国和罗马尼亚,判别式得分接近第二分组,为负值,因此我们判别其为中等人类发展水平。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 地理学 第三次 作业
![提示](https://static.bdocx.com/images/bang_tan.gif)