关于我国国内生产总值的统计分析Word文档下载推荐.docx
- 文档编号:19048723
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:48
- 大小:837KB
关于我国国内生产总值的统计分析Word文档下载推荐.docx
《关于我国国内生产总值的统计分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《关于我国国内生产总值的统计分析Word文档下载推荐.docx(48页珍藏版)》请在冰豆网上搜索。
570
1981
100072
961
1138.41
1982
101654
1983
103008
1984
104357
1201
1985
105851
1986
107507
1987
109300
1988
111026
1989
112704
4156
1990
114333
4517
1991
115823
1992
117171
1993
118517
11271
1994
119850
1995
121121
1996
122389
1997
123626
1998
124761
1999
125786
2000
126743
2001
127627
2002
128453
2003
129227
2004
129988
2005
130756
2006
131448
140974
2007
132129
2021
132802
133450
134091
473104
134735
2、数据处理
这里我们录入全国1980年到2021年的GDP,人口数,固定资产投资,进出口总额、国家财政支出数据。
在相关性分析中,我们以GDP为参考,利用SPSS软件研究其他四种因素与GDP的相关性,由于做单个比拟需要进行四次操作,因而我们在这里直接利用SPSS的相关功能直接给出五个量的两两相关系数,这之中自然包括我们所需要的GDP与其他四类因素的相关系数。
在回归分析中,我们令GDP为因变量Y,将人口数,固定资产投资,进出口总额、国家财政支出四个数据作为自变量X1、X2、X3、X4,然后利用excel的数据分析工具做回归分析。
3、分析步骤
〔1〕相关性分析
录入数据到SPSS→画出关于GDP的散点图→做大致分析→做相关性分析
具体操作过程见附录一,
所得散点图见附录二。
〔2〕回归分析
录入数据到excel→选择分析工具→定好自变量和因变量→做回归分析
具体操作过程见附录三。
4、结果分析
下表是通过SPSS所做相互的两两相关系数表格:
Correlations
GDP
人口数
固定资产投资
进出口总额
国家财政支出
PearsonCorrelation
1
.798**
.956**
.984**
.992**
Sig.(2-tailed)
.000
N
32
.633**
.781**
.729**
.933**
.974**
.969**
**.Correlationissignificantatthe0.01level(2-tailed).
从表中我们可以知道:
1〕GDP与人口数之间的相关系数是0.798,双尾检验的概率值为0,小于,那么相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着比拟强的正相关性。
2〕GDP与固定资产投资之间的相关系数是0.956,双尾检验的概率值为0,小于,那么相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着非常强的正相关性。
3〕GDP与进出口总额之间的相关系数是0.984,双尾检验的概率值为0,小于,那么相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着比拟强的正相关性。
4〕GDP与国家财政支出数据之间的相关系数是0.992,双尾检验的概率值为0,小于0.01,那么相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着非常强的正相关性。
对于回归分析,我们可以利用excel中自带的会给分析予以分析。
下表是通过excel软件做出的回归分析结果:
1)方差分析表
方差分析
df
SS
MS
F
SignificanceF
回归分析
4
4.96E+11
1.24E+11
残差
27
9.83E+08
36423935
总计
31
2)参数确定表
由输出结果可以知道,线性回归方程为:
1>
、Y=-149510+1.4495*X1+0.189964*X2+0.427531*X3+2.461343*X4。
2>
、<
α=0.05,说明回归方程是显著的。
3>
、而由结果中的回归系数的tStat检测可知:
a:
P-value=1.25E-08<
α=0.05,
b1:
P-value=2.79E-09<
α=0.05,
b2:
P-value=0.031325<
b3:
P-value=2.89E-06<
b4:
P-value=0.000433<
α
综上所述,因此回归方程是有效可靠的。
〔二〕中南六省GDP方差分析
1、数据收集:
中南六省1980-2021年GDP数据〔现价〕
湖北
湖南
河南
江西
广西
广东
国内生产总值指数〔可比价,1978=100〕
1978
151
87
100
1979
2
4660
11555
7021
2、数据分析
对表格数据进行分析,我们可以知道,此GDP数据没有消除物价因素影响。
通过上网查资料我们可以知道:
现价GDP没有消除价格因素影响,可比价GDP消除了价格因素的影响。
要对实际GDP消除价格因素影响,我们只需要知道当年的GDP可比价指数就可以消除价格因素对当年的GDP的影响。
在这里我们可以利用excel的计算功能进行计算。
3、分析过程
录入数据到excel→消除物价因素影响→选择适宜工具→数据描述→做方差分析
得出消除物价因素影响后的中南六省GDP表见附录四,
具体操作过程见附录五。
下表是利用SPSS软件求解所得:
1〕数据描述表:
下表给出了水稻品种分组的样本含量N、平均数Mean、标准差、标准误、95%的置信区间、最小值和最大值。
2〕方差分析表
下表给出了组间变差,组内变差以及总变差等一些数据。
第五栏为F值〔组间均方与组内均方之比〕第六栏为F值所对应的概率值,针对假设Ho:
组建均值无显著性差异〔即省间GDP均值无显著性差异〕。
P<
0.0001,由此可以认为全国各省市的GDP水平是不同的。
3〕Tamhane'
sT2法比拟表
MultipleComparisons
Tamhane
(I)组别
(J)组别
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
3
.200
*
.001
5
.002
6
.160
.005
.004
*.Themeandifferenceissignificantatthe0.05level.
从上表我们可以知道:
湖北的年度GDP水平与江西、广西、广东有显著性差异;
湖南的年度GDP水平与江西、广西、广东有显著性差异;
河南的年度GDP水平与江西、广西、广东有显著性差异;
江西的年度GDP水平与湖北、湖南、河南、广东有显著性差异;
广西的年度GDP水平与湖北、湖南、河南、东有显著性差异;
广东的年度GDP水平与湖北、湖南。
,河南、西、有显著性差异。
〔三〕全国各省市GDP聚类分析
全国各省市2021年GDP数据〔现价/单位:
地区
地区生产总值
农业
工业
建筑业
交通运输、仓储和邮政业
批发和零售业
住宿和餐饮业
金融业
房地产业
其他
北京
天津
河北
178
山西
内蒙古
辽宁
吉林
黑龙江
12582
上海
江苏
49
浙江
安徽
7062
福建
山东
13949.32
987
海南
重庆
396.28
四川
贵州
云南
西藏
74.47
陕西
甘肃
青海
宁夏
新疆
根据要求,我们需要对全国GDP做聚类分析,简而言之,就是做一个分类处理。
这个分类,我们可以根据全国各省市的GDP构成来对其进行一个简单地划分。
通过对全国各省市的GDP构成的了解,以及通过比拟各省市之间的各行GDP进行分类。
在这里我们利用了SPSS软件中的系统聚类法和快速聚类法。
并且在聚类分析之前通过对统计量进行描述,对数据做初步分析。
〔1〕统计量描述
录入数据到SPSS→选用适宜的分析工具→做数据分析
〔2〕系统聚类法
选择适宜的分析工具→选择变量→选择系统聚类方法→做系统聚类→选择下一种系统聚类法分析
具体操作过程见附录七,
用七种系统聚类法所得的树状聚类图见附录八。
〔3〕快速聚类法
选择合理的分析工具→选择变量→预先数据分为三类→做快速聚类
具体造作过程见附录九。
〔1〕数据描述
DescriptiveStatistics
Minimum
Maximum
Mean
Std.Deviation
交通运输仓储蓄和邮政业
8.0067E2
批发分零售业
其他
ValidN(listwise)
平均GDP较高的三个行业是工业、交通运输仓储和邮政业、金融业。
从GDP的极大值和极小值方面分析,我们可以知道GDP的极小值是住宿和餐饮业的17.75亿元。
极大值是工业的24649.60亿元。
〔2〕系统聚类法〔注:
取用间距SquaredEuclideanDistance〕
1〕下表是利用“组间联结〞聚类法计算所得的近似矩阵表,其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越小,表示两样本的差距越小。
〔由于表格数据很大,故截取一局部作说明〕
2〕下列图是利用利用“组间联结〞聚类法生成的树状聚类图。
Dendrogram
using
Average
Linkage
(Between
Groups)
Rescaled
Distance
Ctluser
Combine
C
A
S
E
0
5
10
15
20
25
Label
Num
+---------+---------+---------+---------+---------+
西
藏
26
─┐
青
海
29
─┤
宁
夏
30
南
21
─┼─┐
甘
肃
28
─┤
│
新
疆
31
贵
州
24
─┘
山
4
─┐
├─────┐
重
庆
22
│
天
津
2
黑龙江
8
广
─┼─┘
江
14
陕
27
吉
林
7
云
25
安
徽
12
内蒙古
辽
6
福
建
13
─┼─┐
湖
北
17
├─────────────────────────────────┐
18
├─┐
四
川
23
├───┘
河
16
───┘
3
─────┘
京
1
─┬───────┐
上
9
├─────┘
浙
11
─────────┘
苏
───┬───┐
东
├─────────────────────────────────────────┘
19
───────┘
由上图可以知道,如果将样本分为三类的话,如下图,第一类包括广东、山东、江苏;
第二类包括浙江、北京、上海;
第三类为其他。
5〕结果总结
纵观七种聚类方法,比拟其聚类结果〔分为三类〕可总结出如下表:
第一类
第二类
第三类
组间联结聚类法
广东、山东、江苏
浙江、上海、北京
组内联结聚类法
山东、江苏
最近邻元素聚类法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 我国 国内生产总值 统计分析