计量地理学实验报告分解.docx
- 文档编号:22880695
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:29
- 大小:313.55KB
计量地理学实验报告分解.docx
《计量地理学实验报告分解.docx》由会员分享,可在线阅读,更多相关《计量地理学实验报告分解.docx(29页珍藏版)》请在冰豆网上搜索。
计量地理学实验报告分解
《计量地理学》实验报告
学院:
班级:
学号:
姓名:
指导老师:
实验地点:
目录
一、第一次实验
(1)多元线性回归分析·····································3
(2)逐步回归分析·········································6
2、第二次实验
(1)主成分回归分析·······································10
(2)方差分析·············································13
三、第三次实验
(1)非线性回归分析·······································17
(2)聚类分析·············································20
四、第四次实验
趋势面分析············································22
第一次实验
1.实验名称:
多元线性回归分析
实验目的:
通过探讨自变量与因变量之间变动的比例关系,建立模型,揭示地理要素之间的线性相关关系。
实验内容:
以《贵州省遵义市海龙坝水源地供水水文地质详查报告》中的数据资料为例,对该地区地下水流量进行预测。
从详查报告可以看出,该区地下水流量的动态变化主要受降雨量及人工开采两个因素的影响,因此主要通过研究区降雨量及人工开采用水资料来预测地下水各观测孔流量的变化,而不考虑其它因素的影响,则模型可简化为:
式中,y为观测孔地下水流量的变化;
分别为降雨量和人工开采量。
年份
降雨量
/mm
人工开采量
/
观测孔流量y/(L/s)
1990
954
658.8
51.54
1991
1389.5
723.1
63.71
1992
864
701.9
54.44
1993
1193.2
689.5
56.78
1994
841
734.6
53.45
1995
1378.4
699.2
65.92
1996
1686.9
685.4
67.58
1997
1592.1
704.7
64.59
1998
1956.7
613.7
75.31
实验步骤:
(1)在DPS系统中对原始数据进行回归分析,将上表中数据编辑、定义成数据块;
(2)在“多元分析”菜单下选择“回归分析”中的“线性回归”,系统给出下图界面
点击右下角的“返回编辑”,得到以下数据:
多元线性回归分析结果:
方差来源
平方和
df
均方
F值
p值
回归
461.3979
2
230.6989
38.0527
0.0004
剩余
36.3757
6
6.0626
总的
497.7736
8
62.2217
相关系数R=0.962768决定系数RR=0.926923调整相关R'=0.950034
变量
回归系数
标准系数
偏相关
标准误
t值
p-值
b0
26.3907
21.6685
1.2179
0.2627
b1
0.0201
0.9914
0.9523
0.0026
7.6450
0.0001
b2
0.0125
0.0568
0.1760
0.0284
0.4379
0.6746
press=117.3509剩余标准差sse=2.4622
预测误差标准差MSPE=4.4225Durbin-Watsond=2.2597
序号
观察值
拟合值
残差
标准残差
学生残差
cook距离
1
51.5400
53.7836
-2.2436
-0.9112
-1.3434
0.7061
2
63.7100
63.3429
0.3671
0.1491
0.1774
0.0044
3
54.4400
52.5106
1.9294
0.7836
0.9332
0.1214
4
56.7800
58.9766
-2.1966
-0.8921
-0.9563
0.0454
5
53.4500
52.4554
0.9946
0.4039
0.5048
0.0477
6
65.9200
62.8219
3.0981
1.2582
1.3518
0.0940
7
67.5800
68.8541
-1.2741
-0.5175
-0.5965
0.0390
8
64.5900
67.1881
-2.5981
-1.0552
-1.2416
0.1976
9
75.3100
73.3868
1.9232
0.7811
1.4858
1.9270
通径系数分析
直接作用
通过x1
通过x2
x1
0.9914
-0.0298
x2
0.0568
-0.5206
剩余通径系数=0.270327
成果处理:
经过以上分析,由上表可知,该区地下水流量计算模型为:
通过对回归方程进行F显著性检验,该地下水流量预测模型显著性很好,符合该地区的实际情况,因此可以通过该模型对研究区地下水流量进行预测。
另外从实例的计算结果可知,把降雨量及人工开采量这两个因素作为地下水流量影响的主要因素是可行的。
2.实验名称:
逐步回归分析
实验目的:
通过建立逐步回归分析,建立“最优”的回归方程。
使之包括所有对Y有显著影响的变量而不包含对Y影响不显著的变量。
实验内容:
以某地1989年到2003年共计15组数据(下表所示)建立回归模型。
设工业总产值为
亿元。
农业总产值设
亿元,建筑业总产值为
亿元;社会消费总额为
亿元,人口数为
万人,受灾面积为
,国民财政收入为y亿元。
工业产值
/亿元
农业产值
/亿元
建筑业产值/亿元
消费总额
/亿元
人口数
/万人
受灾面积/
财政收入
/亿元
6484
4100.6
794
8101.4
112704
46991
2664.9
6858
4954.3
859.4
8300.1
114333
38474
2937.1
8087.1
5146.4
1015.1
9415.6
115823
55472
3149.48
10284.5
5588
1415
10993.7
117171
51333
3483.37
14143.8
6605.1
2284.7
12462.1
118517
48829
4348.95
19359.6
9169.2
3012.6
16264.7
119850
55043
5218.1
24718.3
11884.6
3819.6
20620
121121
45821
6242.2
29082.6
13539.8
4530.5
24774.1
122389
46989
7407.99
32412.1
13852.5
4810.6
27298.9
123626
53429
8651.14
33387.9
14241.6
5231.4
29152.5
124761
50145
9875.95
35087.2
14106.2
5470.6
31134.7
125786
49981
11444.08
39047.3
13873.6
5888
34152.6
126743
54668
13395.23
42374.6
14462.8
6375.4
37595.2
127627
52125
16386.04
45975.2
14931.5
7005
42027
128453
47119
18903.64
53092.9
14870.1
8181.3
45842
129227
54506
21715.25
实验步骤:
(1)将财政收入y设为因变量,
设为因变量,将数据定义成数据块;
(2)在“多元分析”菜单下进入“回归分析”,选择“逐步回归”功能,考虑引入自变量,按“yes”按钮,系统会自动将
引入,如下图所示。
由于调整的相关系数比原来的大,而且回归模型诊断各个回归系数的偏相关系数的显著水平最好也不大于0.05,所以这里的
引入变得不合适,按“No”剔除。
当模型既不能引入新的变量,也不能从回归方程中剔除一个方差贡献小的变量时,点击“OK”,输出分析结果。
所求回归模型为:
y=2654.155286-0.8914381010
+0.6109577445
+0.6377787735
-0.03418200925
逐步回归分析结果:
相关系数
X1
X2
X3
X4
X5
X6
Y
显著水平P
X1
1.0000
0.9449
0.9989
0.9961
0.9839
0.3267
0.9587
0.0001
X2
0.9449
1.0000
0.9495
0.9249
0.9532
0.2667
0.8201
0.0002
X3
0.9989
0.9495
1.0000
0.9926
0.9855
0.3209
0.9515
0.0001
X4
0.9961
0.9249
0.9926
1.0000
0.9774
0.3100
0.9751
0.0001
X5
0.9839
0.9532
0.9855
0.9774
1.0000
0.3690
0.9257
0.0001
X6
0.3267
0.2667
0.3209
0.3100
0.3690
1.0000
0.2948
0.2861
Y
0.9587
0.8201
0.9515
0.9751
0.9257
0.2948
1.0000
0.0001
Y=2654.155286-0.8914381010
+0.6109577445
+0.6377787735
-0.03418200925
偏相关
t检验值
p值
r(y,X2)
-0.9627
11.2459
0.0001
r(y,X3)
0.3963
1.3648
0.1996
r(y,X4)
0.9466
9.2877
0.0001
r(y,X6)
-0.4452
1.5723
0.1442
相关系数R=0.9989F值=1101.8360Df=(4,10)p值=0.0001
样本
观测值
拟合值
拟合误差
1
2664.9000
3044.4788
-379.5788
2
2937.1000
2741.2696
195.8304
3
3149.4800
2795.5669
353.9131
4
3483.3700
3794.1878
-310.8178
5
4348.9500
4440.9622
-92.0122
6
5218.1000
4812.7524
405.3476
7
6242.2000
5978.1287
264.0713
8
7407.9900
7546.4224
-138.4324
9
8651.1400
8828.9307
-177.7907
10
9875.9500
10033.6036
-157.6536
11
11444.0800
11570.2564
-126.1764
12
13395.2300
13797.1601
-401.9301
13
16386.0400
15852.2476
533.7924
14
18903.6400
18816.7127
86.9273
15
21715.2500
21770.7401
-55.4901
Durbin-Watson统计量d=2.0491598
成果分析:
从相关系数矩阵可以看出,此例还存在多重共线性。
对于
,它与
具有最大相关系数,为0.999;同理,对于
,它与
具有最大相关系数,为0.953;对于
,它与
具有最大相关系数,为0.996;对于
,没有显著相关。
因此
,
,
之间高度相关,具有多重共线性。
同样,
,
之间高度相关,具有多重共线性。
该结论与模型是吻合的。
事实上,在模型中,由于
,
,
之间的共线性,
和
可由
来表征;由于
和
的共线性,
可由
来表征。
从实际情况看,工业的发展为建筑业的崛起提供了基础,而建筑业的兴旺又会拉动工业总产值的增长,两者之间是物资交换过程经过社会商品零售总额反映出来。
同时,由于我国农业生产力相对落后,农业人口占总人口的比重过大,农业总产值与人口总数有直接关系。
这些说明模型有合理的实际意义。
第二次实验
1.实验名称:
主成分回归分析
实验目的:
在保持原始数据信息损失最少的前提下,通过线性变换将原始自变量集合由高维空间映射到一个低维空间,从而实现数据的降维。
实验内容:
以法国有关进口总额经济分析为例,考虑的因变量Y是法国进口总额,自变量分别是法国国内生产总值
存储量
和总消费量
.
Y
149.3
4.2
108.1
15.9
161.2
4.1
114.8
16.4
171.5
3.3
123.2
19
175.5
3.1
126.9
19.1
180.8
1.1
132.1
18.8
190.7
2.2
137.7
20.4
202.1
2.1
146
22.7
212.4
5.6
154
26.5
226.1
5
162.3
28.1
231.9
5.1
164.3
27.6
239
0.7
167.6
26.8
实验步骤:
(1)在DPS系统中,点击“多元分析”→“有偏回归分析”→“主成分回归”,界面上出现三个特征根(如右图),按大小依次顺序为
=199.8185,
=99.9162,
=0.2653。
第3个特征根较前面两个相比,已是很小,故选择保留两个特征根(主成分个数为2),输出结果如下表:
一般线性回归分析表
变量
平均值
标准差
膨胀系数VIF
x1
194.5909
29.9995
188.6830
x2
3.3182
1.6479
1.0150
x3
139.7273
20.6275
188.7524
y
21.9364
4.5944
自变量主成分分析与特征向量(转置)
No
特征值
百分率%
累计百分率%
1
1.9982
66.6062
66.6062
2
0.9992
33.3054
99.9116
3
0.0027
0.0884
100.0000
x1
x2
x3
z1
0.7067
0.0296
0.7069
z2
-0.0254
0.9995
-0.0165
z3
0.7070
0.0062
-0.7072
方差分析表
方差来源
平方和
df
均方
F值
p-值
回归
209.2834
3
69.7611
270.9885
0.0001
剩余
1.8020
7
0.2574
总的
211.0855
10
21.1085
相关系数R=0.995722决定系数RR=0.991463调整相关R'=0.993883
变量z
回归系数
标准系数
偏相关
标准误
t值
p-值
b0
21.9364
0.1581
138.7362
0.0001
b1
3.1784
0.9779
0.9946
0.1173
27.0926
0.0001
b2
0.8387
0.1825
0.8727
0.1659
5.0553
0.0007
剩余标准差sse=0.5244Durbin-Watsond=2.6812
标准化回归方程:
标准化变量系数
std(xi)的表达式:
2.224988std(x1)
std(x1)=(x1-194.5909)/29.9995
0.932468std(x2)
std(x2)=(x2-3.3182)/1.6479
2.232791std(x3)
std(x3)=(x3-139.7273)/20.6275
主成分回归方程:
y=-9.498114+0.074167x1+0.565846x2+0.108244x3
成果分析:
从上述结果可以看出,主成分回归模型统计检查F值270.9885,显著水平P<0.0001,复相关系数R为0.9957,这表明模型拟合良好。
对比普通最小二乘回归,主成分回归舍弃了一个约等于0的特征值,也就是去掉了了一个复共线性关系(第三个特征量):
0.7070
+
0.0062-
0.7072
0
这就使得整个回归模型在拟合未来资料时,会表现出较好的稳定性。
从上述分析过程来看,主成分回归的过程是先得到代表原始自变量集合大部分信息的新综合变量,然后使用这些综合变量对因变量进行回归分析。
由于得到的新综合变量之间是相互正交的,所以避免了直接利用最小二乘法所遇到的“病态问题”,提高了预测的准确性和可靠性。
因为因变量可以表示为新综合变量的线性组合,同时新综合变量又均可以表示为原始变量集合的线性组合,因此,可以将因变量表示为原始自变量集合线性组合的形式。
2.实验名称:
单因素方差分析
实验目的:
通过试验数据分析测试某一控制变量的不同水平是否给观察变量造成显著差异和变化。
实验内容:
以某河流断面浮游植物观测数据为例,针对浮游植物这个指标分析各断面之间是否存在显著差异。
河流断面
样本数
浮游植物观测值/(
个/
)
1
10
29
28
23
26
26
19
25
29
26
28
2
10
17
25
24
19
28
21
20
25
19
24
3
10
17
16
21
22
23
18
20
17
25
21
4
10
18
20
25
24
16
20
20
17
19
17
对上表中的数据做方差分析,以判断四个断面在浮游植物之间是否存在显著差异。
实验步骤:
在DPS系统中依次选择“试验统计→完全随机设计→单因素试验统计分析”,在“方差分析参数设置”中选“LSD”法。
得出以下数据:
处理
样本数
均值
标准差
标准误
95%置信区间
处理1
10
25.9000
3.0714
0.9713
23.7029
28.0971
处理2
10
22.2000
3.4897
1.1035
19.7036
24.6964
处理3
10
20.0000
2.9439
0.9309
17.8940
22.1060
处理4
10
19.6000
2.9515
0.9333
17.4887
21.7113
方差分析表:
变异来源
平方和
自由度
均方
F值
p值
处理间
249.8750
3
83.2917
8.5450
0.0002
处理内
350.9000
36
9.7472
总变异
600.7750
39
LSD多重比较表(下三角为均值差,上三角为显著水平):
No.
均值
1
2
3
4
5%显著水平
1%显著水平
1
25.9000
0.0119
0.0002
0.0001
a
A
2
22.2000
3.7000
0.1238
0.0708
b
AB
3
20.0000
5.9000
2.2000
0.7761
b
B
4
19.6000
6.3000
2.6000
0.4000
b
B
成果处理:
在方差分析中,显著水平P值是推断试验处理间差异程度的指标。
由于P值小于0.001(方差分析表中),可以认为存在显著差异。
要进一步研究这种差异的具体形式,检验各个处理之间的差异,只有当显著水平P<=0.05时,才能进一步做多重比较分析。
首先对四个断面浮游植物的平均值(
)做初步分析,经过计算(LSD法多重比较表),断面1的平均值最大,为25.9;断面3、4的平均值非常接近,分别为20.0和19.6;而断面2的平均值大体介于断面1和断面3、4的中间,为22.2。
根据初步分析大致可以认为断面3和4的平均值之间没有显著区别,而断面1的平均值显著地大于断面3、4(因为方差分析结果是显著的)。
问题在于2,它可能与断面1有(或没有)显著差别,也可能与断面3、4有(或没有)显著差别。
无论何种情况,需要做多重比较检验。
3.实验名称:
双因素方差分析
实验目的:
对影响总体均值的两个或两个以上的因素进行考虑,,并对它们的联合影响(交互作用)做出估计。
实验内容:
对“存在交互作用的双因素方差”进行分析
现有一组土壤、肥料试验数据,A因素为三种肥料处理,B因素为三种土壤处理,每组合包含三次重复。
试根据试验结果(小麦产量)分析施肥、土壤以及它们的交互作用对小麦产量的影响。
肥料
土壤
重复
A1
B1
21.4
21.2
20.1
B2
19.6
18.8
16.4
B3
17.6
16.6
17.5
A2
B1
12
14.2
12.1
B2
13
13.7
12
B3
13.3
14
13.9
A3
B1
12.8
13.8
13.7
B2
14.2
13.6
13.3
B3
12
14.6
14
实验步骤:
根据表中数据,在DPS系统中,选择“试验统计→完全随机设计→二因素有重复试验统计分析”。
系统提示输入A因素处理(a)和B因素处理数(b),
然后再按提示数据转换方式,最后进行运算分析,并输出结果(如下表)。
方差分析表(随机模型)
变异来源
平方和
自由度
均方
F值
p值
A因素间
179.3807
2
89.6903
18.6450
0.0094
B因素间
3.9607
2
1.9803
0.4120
0.6877
AxB
19.2415
4
4.8104
5.1850
0.0059
误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 地理学 实验 报告 分解