基于全国主要城市平均气温的统计分析.docx
- 文档编号:27093612
- 上传时间:2023-06-27
- 格式:DOCX
- 页数:23
- 大小:335.87KB
基于全国主要城市平均气温的统计分析.docx
《基于全国主要城市平均气温的统计分析.docx》由会员分享,可在线阅读,更多相关《基于全国主要城市平均气温的统计分析.docx(23页珍藏版)》请在冰豆网上搜索。
基于全国主要城市平均气温的统计分析
基于全国主要城市平均气温的统计分析
摘要本文主要采用2012年全国主要城市平均气温的统计数据,首先通过相关分析对全国主要城市的平均气温进行简单的相关分析,然后在控制平均气温的基础上对个月平均气温进行偏相关分析;其次运用聚类分析对各相似省份进行聚类分析;最后运用因子分析对各城市进行因子分析,计算出每个城市的综合得分,通过综合得分计算出每个城市平均气温的排名。
关键词:
相关分析;聚类分析;因子分析
1、研究背景及目的
全球气温变暖为世人所瞩目,近几十年来的全球气候变暖是一个国内外都非常关注的重大问题。
自从全球气温变暖的议题出现以来,关于气温的不正常变化仁者见仁,智者见智。
气温的变化对农作物,人们的生活及经济的运行都有重要的影响。
全世界的气温研究工作者都研究出了许多关于气温的结论,但都有一个共性即全球气温变暖。
然而我国跨北纬4度到北纬53度,从东经73度到东经135度,具有比较丰富的气候和比较多变的气温,因此对我国气温的研究具有很重要的意义。
在此大背景下,对我国气温的研究不仅能说明我国气温的分布和变化,同时对世界气温的研究同样具有重要作用。
本文的研究目的如下:
通过对我国主要城镇平均气温的研究和分析,一方面可以得出我国各市平均气温与全国平均气温差异;另一方面也可以给我们以后的就业进行指导,在适宜的季节去适宜的城市工作。
2、研究方法
气温的变化不仅能促进经济的发展,同时也能阻碍经济的发展。
据此我们通过全国各主要城市每个月份的平均气温对我国气温的分布情况进行分析。
本研究采用的数据是《中国2012年主要城市平均气温的数据指标》,数据摘自《中国统计年鉴2013》7-7.
采用的分析方法主要有相关分析,聚类分析,因子分析等。
基本思路是:
首先利用线图分析各个月份平均气温的分布,然后利用条形图分析全国主要城市平均气温的对比,得出平均气温最高和最低的城市;然后利用因子分析对各个月份的平均气温进行相关分析;其次利用聚类分析对各个城市在不同气温下的类别;再次利用因子分析对构成平均气温的各各月平均气温提取公因子;最后使用一些简单的SPSS数据处理技巧依据提出的公因子对各城市进行分类及排序。
3、实证分析
由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,我们共设置了14个变量,分别是“城市”、“@1月”、“@2月”、“@3月”、“@4月”、“@5月”、“@6月”、“@7月”、“@8月”、“@9月”、“@10月”、“@11月”、“@12月”和“年平均气温”。
样本是中国2012年全国重要城市平均气温的主要数据。
数据参见附表1。
3.1、画基本图形
图1
通过图1可以看出全国平均的月份气温最低在0度左右,最高在25度左右,说明全国平均月份气温比较温和。
图2
条形图反映的是各个城市的年平均气温的情况,最高的为海口,最低的为哈尔滨,比较符合现实的气温分布。
3.2、相关分析
对于相关分析主要有以下几部分;
第一、对每个季度的平均气温进行简单相关分析;
第二、在控制年平均气温的情况下,再分别对各季度的平均气温进行偏相关分析。
3.2.1各季度平均气温的相关分析
图3
相关性
1月
2月
3月
1月
Pearson相关性
1
.989**
.981**
显著性(双侧)
.000
.000
N
31
31
31
2月
Pearson相关性
.989**
1
.984**
显著性(双侧)
.000
.000
N
31
31
31
3月
Pearson相关性
.981**
.984**
1
显著性(双侧)
.000
.000
N
31
31
31
**.在.01水平(双侧)上显著相关。
图3显示的是1月、2月和3月的平均气温的相关性,可以看出这三个月的相关性比较明显。
通过这三个月的相关分析我们容易得到其他三个季度的气温也具有比较强的相关性。
3.2.2各个季度平均气温的偏相关分析
图4
相关性
控制变量
1月
2月
3月
年平均
1月
相关性
1.000
.913
.724
显著性(双侧)
.
.000
.000
XX文库-让每个人平等地提升自我df
0
28
28
2月
相关性
.913
1.000
.859
显著性(双侧)
.000
.
.000
df
28
0
28
3月
相关性
.724
.859
1.000
显著性(双侧)
.000
.000
.
df
28
28
0
在控制年平均气温的情况下第一季度个月平均气温的相关性有所下降,但是没有改变它们的相关性。
说明各个季度各个月份的平均气温都具有非常强的相关性。
图5
图5表示的是各个月份平均气温的相关图,可以看出每个月份之间的相关性都非常好。
3.3聚类分析
图6
图7
图8
聚类成员
案例号
城市
聚类
距离
1
北京
3
4.686
2
天津
3
4.215
3
石家庄
3
6.470
4
太原
3
5.996
5
呼和浩特
1
4.772
6
沈阳
1
5.291
7
长春
1
7.295
8
哈尔滨
1
10.396
9
上海
2
3.933
10
南京
2
4.354
11
杭州
2
3.896
12
合肥
2
4.869
13
福州
4
8.106
14
南昌
2
5.977
15
济南
3
7.860
16
郑州
2
8.487
17
武汉
2
4.328
18
长沙(望城)
2
4.953
19
广州
4
1.885
20
南宁
4
3.346
21
海口
4
10.973
22
重庆(沙坪坝)
2
7.870
23
成都(温江)
2
5.005
24
贵阳
2
11.223
25
昆明
2
16.419
26
拉萨
3
17.504
27
西安(泾河)
3
7.079
28
兰州(皋兰)
1
8.338
29
西宁
1
13.208
30
银川
3
9.756
31
乌鲁木齐
1
7.466
通过聚类分析,由图6到图8我们可以清晰的看出,在图6和图8中对各个城市的划分比较统一,而在图7中我们显然发现对于气温我们可以分成4类,分别是5、6、7、8、9月为第一类,4、10月为第二类,3、11月第三类,1、2、12月为第四类,很显然是根据气温的从高到低进行分类的,第一类温度最高,第二类次之,第三类温度稍低,第四类温度最低。
3.4因子分析
在上面的研究中,我们分别对温度和城市进行了分类,并且对气温进行了相关分析,得出了气温的分布情况,并且研究了气温对城市的影响,但是由于各种变量的多重共线性问题,不太利于具体问题意义解释,因此我们可以利用因子分析对各个月份的平均气温变量提取公因子,对数据进行降维处理。
首先利用主菜单分析中的降维工具条进行因子分析。
在对话框中,依次将“@1月”、“@2月”、“@3月”、“@4月”、“@5月”、“@6月”、“@7月”、“@8月”、“@9月”、“@10月”、“@11月”和“@12月”添加到“变量”列表中。
接着在相应的按钮中选中输出相关系数矩阵和KMO和Bartlett的球形度检验的复选框,并且设置特征根大于1为提取公因子的要求,利用最大方差法进行因子旋转,最后保存因子得分变量,并显示因子得分系数矩阵,输出结果参见图9至图15
(1)KMO和Bartlett的检验,如图9所示,KMO的取值为0.811,表明变量间有较强的相关性,数据很适合做因子分析。
Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。
图9
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.811
Bartlett的球形度检验
近似卡方
1009.087
df
66
Sig.
.000
(2)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。
如图10所示,所有变量共同度都在90%以上,所以提取这几个公因子对各变量的解释力非常好。
图10
公因子方差
初始
提取
1月
1.000
.984
2月
1.000
.987
3月
1.000
.990
4月
1.000
.952
5月
1.000
.890
6月
1.000
.925
7月
1.000
.962
8月
1.000
.924
9月
1.000
.952
10月
1.000
.984
11月
1.000
.987
12月
1.000
.986
提取方法:
主成份分析。
(3)解释的总方差,由图11中可以看出,“初始特征值”一栏显示只有前两个特征值大于1,所以只选取了前两个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是82.367%,前两个公因子的方差总和占所有主成分方差的96.014%,可见选取前两个因子已足够替代原来的变量。
图11
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
9.884
82.367
82.367
9.884
82.367
82.367
6.458
53.813
53.813
2
1.638
13.646
96.014
1.638
13.646
96.014
5.064
42.201
96.014
3
.260
2.166
98.180
4
.074
.618
98.798
5
.065
.545
99.343
6
.032
.266
99.610
7
.025
.208
99.818
8
.008
.070
99.888
9
.007
.056
99.944
10
.005
.040
99.984
11
.001
.010
99.994
12
.001
.006
100.000
提取方法:
主成份分析。
(4)碎石图,是按照特征根大小排列的主成分散点图。
如图12所示,我们可以看到有;两个成分的特征值超过1。
图12
(5)成分矩阵,如表13可见,所有的因子都聚集在第一主成分中,因此有必要进行因子旋转。
我们利用最大方差法进行因子旋转得到的旋转成分矩阵如图13所示。
图13
成份矩阵a
成份
1
2
10月
.992
-.032
4月
.975
-.002
11月
.958
-.262
9月
.951
.216
3月
.931
-.350
1月
.927
-.352
5月
.916
.227
12月
.906
-.407
2月
.895
-.432
8月
.838
.471
6月
.821
.500
7月
.750
.632
提取方法:
主成份。
a.已提取了2个成份。
图14
旋转成份矩阵a
成份
1
2
2月
.962
.246
12月
.955
.273
3月
.937
.333
1月
.936
.329
11月
.902
.417
10月
.779
.615
4月
.747
.627
7月
.166
.966
6月
.305
.912
8月
.337
.900
9月
.588
.778
5月
.554
.763
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛。
这样每个因子都很明确了,第一主成分包括1、2、3、4、10、11、12月,可以命名为较冷气温;第二主成分包括5、6、7、8、9月,可以命名为叫人气温。
(6)成分得分矩阵
图15
成份得分系数矩阵
成份
1
2
1月
.210
-.104
2月
.239
-.143
3月
.210
-.103
4月
.076
.063
5月
-.018
.165
6月
-.133
.287
7月
-.191
.344
8月
-.121
.275
9月
-.011
.163
10月
.089
.050
11月
.177
-.060
12月
.230
-.131
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
构成得分。
通过图15可以得出,F1=0.21*1月+0.239*2月+0.21*3月+0.076*4月-0.018*5月-0.133*6月-0.191*7月-0.121*8月-0.011*9月+0.089*10月+0.177*11月+0.23*12月,
F2也可以如此得出。
通过图16可见,各因子之间是正交的,即相互之间彼此独立。
图16
成份得分协方差矩阵
成份
1
2
1
1.000
.000
2
.000
1.000
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
构成得分。
3.5因子分析后续分析
当我们获得两个因子的得分之后,就可以利用因子分析进行分类和排序,我们可以利用计算变量和排序来进行各城市的平均气温得分计算和排序,具体操作步骤如下:
【1】打开数据文件,依次单击“转换”→“计算变量”命令,弹出如图4所示的对话框。
图17
在“目标变量”一栏中输入“综合得分”,这一变量将最终代表各个城市的综合排名。
综合得分=FAC1_1*53.813+FAC2_1*42.201,单击“确定”,返回数据文件可以看到“综合得分”这一变量。
【2】在数据文件中,在“综合得分”单元格上单击右键,在弹出的菜单中选择“降序”排列,对数据进行整理,得到综合排名,参见图18。
图18
观察“综合得分”一列,可以看出,海口、广州和南宁平均气温最高,因为该类城市所处纬度比较低,因此该类地区气温比较高;然而长春、哈尔滨和西宁的得分比较低,说明该类城市的平均气温比较低,因为长春和哈尔滨所处维度比较高,温度较为寒冷,西宁位于青海省,地势较高,容易受高寒气候影响,因此也较为寒冷。
3.6结论研究
通过以上的研究分析,我们可以从一种宏观的视野下对我国的城市的平均气温有一个比较全面的了解,这对于我们以后对工作和生活的城市有重要的借鉴和指导意义。
同时,对于我们个人来说也是工作地选择的重要参考。
比如,因子分析表明,排序靠前的南方沿海城市,平均气温比较高,适合冬季到南方生活和工作。
4、结论
本文利用了多种统计学的方法对各地区的平均气温进行了统计分析,加入了偏相关分析,这样有利于控制其他变量的影响。
同时有借住聚类分析对各个城市在不同气温下的分类;又利用因子分析对各月平均气温进行降维处理,并且利用各因子得分可以计算综合成绩,进而对各地区进行综合排名,但是,由于缺少季度数据,在分析过程中用月度数据代替了季度数据,这点事本文的不足,有望在以后的数据分析中搜集更全面的数据,并且可以利用回归分析和多重对应分析对各地区的平均气温进行更多信息的提取。
参考文献
[1]赵辉,基于城市综合经济实力评价指标的统计分析
[J].spss论文
[2]谢龙汉,尚涛.SPSS统计分析与数据挖掘[M].电子工业出版社,2012.1.
附表
本文数据选自2013年中国统计年鉴7-7
城市
1月
2月
3月
4月
5月
6月
7月
8月
9月
10月
11月
12月
年平均
北京
-3.6
-1.3
5.9
16.2
22.8
25.0
27.4
26.0
21.1
14.6
4.3
-4.2
12.9
天津
-3.8
-2.2
5.2
15.6
22.6
24.7
27.2
25.2
20.7
14.6
4.5
-3.9
12.5
石家庄
-2.2
0.5
7.6
17.9
23.8
26.6
28.0
25.8
20.8
15.6
5.3
-2.2
14.0
太原
-5.4
-2.2
4.8
14.7
20.9
22.8
24.5
22.7
16.7
10.9
2.1
-4.7
10.7
呼和浩特
-10.8
-7.7
0.7
11.5
18.4
20.6
23.7
21.6
14.3
7.2
-3.7
-10.0
7.2
沈阳
-14.0
-8.8
-0.4
10.5
18.6
21.6
24.8
23.0
17.7
9.4
-0.4
-12.9
7.4
长春
-16.1
-11.9
-3.5
8.7
17.2
20.4
23.5
22.1
17.0
7.0
-4.9
-16.7
5.2
哈尔滨
-18.3
-12.4
-3.3
7.8
16.4
21.3
23.9
21.8
16.4
6.4
-5.2
-19.4
4.6
上海
4.7
4.4
9.5
17.5
21.3
24.3
29.7
29.0
23.7
19.8
12.2
6.3
16.9
南京
2.9
3.0
9.0
17.9
21.9
25.5
29.4
28.1
22.3
18.3
10.0
3.5
16.0
杭州
4.3
4.3
###
19.0
21.8
25.1
30.8
28.7
23.4
19.7
12.1
6.0
17.1
合肥
3.1
3.5
9.6
18.8
22.7
26.7
30.6
28.2
22.7
18.6
10.0
3.4
16.5
福州
10.0
10.6
###
20.0
23.0
26.5
29.9
28.8
25.8
22.4
17.7
12.8
20.2
南昌
5.0
5.5
###
19.5
23.4
26.5
31.0
29.6
24.5
20.9
12.5
6.6
18.0
济南
-1.1
0.9
7.1
17.6
23.8
27.0
28.1
24.7
20.9
17.3
7.1
-1.3
14.3
郑州
0.3
2.9
9.1
18.5
23.8
27.8
28.9
25.9
21.9
17.3
8.6
0.5
15.5
武汉
2.8
4.1
9.4
18.2
22.3
26.6
30.3
28.0
22.9
17.8
10.1
3.9
16.4
长沙(望城)
4.1
5.4
###
19.2
22.9
27.1
30.9
28.7
24.5
19.6
12.2
5.9
17.6
广州
11.4
14.0
###
23.1
26.8
27.6
28.1
28.1
26.0
23.2
19.2
14.6
21.7
南宁
9.8
12.1
###
24.0
27.1
27.5
28.2
27.9
25.8
23.8
19.2
14.4
21.4
海口
16.4
17.8
###
26.6
28.3
28.4
28.5
28.1
27.6
26.1
24.5
20.6
24.6
重庆(沙坪坝)
7.2
8.7
###
20.0
22.5
24.5
28.5
29.8
23.2
18.4
13.4
9.4
18.3
成都(温江)
5.0
6.0
###
17.7
21.2
22.5
24.8
26.0
20.9
17.2
11.0
6.8
15.9
贵阳
0.7
2.5
9.6
17.1
19.2
19.8
22.8
23.0
18.2
15.6
10.2
5.1
13.7
昆明
9.9
13.1
###
17.9
20.8
20.7
20.5
20.5
18.3
16.5
13.9
9.5
16.3
拉萨
-1.1
3.8
6.6
8.9
15.1
18.1
16.9
16.7
15.2
9.9
3.8
1.4
9.6
西安(泾河)
-0.9
2.0
8.3
17.8
21.6
26.7
27.6
25.5
19.8
15.0
6.4
0.2
14.2
兰州(皋兰)
-10.1
-5.3
3.1
11.3
15.7
20.4
21.4
21.1
14.0
8.0
-1.5
-7.6
7.5
西宁
-10.3
-6.3
1.0
8.4
12.4
15.4
17.2
16.4
11.9
5.8
-2.8
-6.5
5.2
银川
-8.5
-4.7
4.5
13.5
19.3
23.1
24.8
23.7
16.3
10.1
0.8
-5.2
9.8
乌鲁木齐
-15.0
-12.0
0.5
14.0
18.7
23.7
24.6
23.7
18.1
8.9
-3.9
-12.6
7.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 全国 主要 城市 平均气温 统计分析