多元统计中国农业发展状况.docx
- 文档编号:8220113
- 上传时间:2023-01-29
- 格式:DOCX
- 页数:23
- 大小:388.01KB
多元统计中国农业发展状况.docx
《多元统计中国农业发展状况.docx》由会员分享,可在线阅读,更多相关《多元统计中国农业发展状况.docx(23页珍藏版)》请在冰豆网上搜索。
多元统计中国农业发展状况
多元统计论文
(级)
论文(设计)题目1983-2007年中国农业发展状况研究
作者
分院、专业理学分院
班级
指导教师(职称)
字数(5400字)
成果完成时间2011-12-12
目录
1引言1
1形象分析5
2聚类分析6
3主成分分析6
3.1标准化6
3.2标准化8
4因子分析11
结论:
15
1983~2007年中国农业发展状况
1引言
当今世界风云变化,中国异军突起,虽无称霸之心,但是树大招风,再者我国幅员辽阔。
邻国众多,虽有睦邻友好之策,但还有许多历史遗留问题,错综复杂,正在解决。
更有其他不同意识形态的国家对社会主义国家的中国的打压。
国内粮食需求还有待外国进口,在此我们认为保障我国粮食安全,做到自给自足是保障我国在世界范围内掌握话语权,维护本国核心利益的必要条件之一!
为此我以1983到2007我国农业发展的相关数据做出以下相关分析。
TestsofNormality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
粮食产量(万吨)
.124
25
.200*
.945
25
.190
农业化肥施用量(万公斤)
.144
25
.196
.928
25
.077
粮食播种面积(千公斤)
.170
25
.059
.898
25
.017
成灾面积(公顷)
.081
25
.200*
.974
25
.741
农业机械总动力(万千瓦)
.434
25
.000
.302
25
.000
农业劳动力(万人)
.117
25
.200*
.934
25
.105
a.LillieforsSignificanceCorrection
*.Thisisalowerboundofthetruesignificance.
表1
对单个变量正态性的检验,凡是sig<0.05的,一般我们认为不遵从正态分布。
因此我们认为农业机械总动力不遵从正态分布,所以在下面的分析中,我们只对粮食产量、农业化肥施用量、粮食播种面积、成灾面积和农业劳动力这五个指标进行比较,并且认为这五个指标组成的向量遵从正态分布,这五个指标涉及了农业生产的各个方面,我们认为可以反映农业发展状况。
另外我们认为虽然农业机械总动力不遵从正态分布,但是,它对农业生产的发展是有明显的促进作用的,随着科学技术的发展,我们可以从原始数据中看到从1983年到2007年在农业机械总动力每年大幅动在增加,这也印证了表一统计结果,更是对现实社会的一种很好诠释,即国家正在逐步实现的“农业现代化和解放生产力”。
Between-SubjectsFactors
N
时代
80年代
7
90年代
10
新世纪
8
表2
表2很简单说明的是数据采集的年代包含了80年代的7组数据,90年代的10组数据和2000年以后的8组数据,这里需要说明的是虽然从各年代采集的数据组数不同,但是所采集数据的年份是连续的,因此我们认为不影响分析的结果。
MultivariateTestsc
Effect
Value
F
Hypothesisdf
Errordf
Sig.
Intercept
Pillai'sTrace
1.000
25023.203a
5.000
18.000
.000
Wilks'Lambda
.000
25023.203a
5.000
18.000
.000
Hotelling'sTrace
6950.890
25023.203a
5.000
18.000
.000
Roy'sLargestRoot
6950.890
25023.203a
5.000
18.000
.000
时代
Pillai'sTrace
1.841
44.029
10.000
38.000
.000
Wilks'Lambda
.004
50.966a
10.000
36.000
.000
Hotelling'sTrace
34.505
58.659
10.000
34.000
.000
Roy'sLargestRoot
27.422
104.204b
5.000
19.000
.000
a.Exactstatistic
b.ThestatisticisanupperboundonFthatyieldsalowerboundonthesignificancelevel.
c.Design:
Intercept+时代
表3
表3从多变量检验结果来看,不同的统计量结果都反映了这三个时代的农业发展状况从粮食产量、农业化肥施用量、粮食播种面积、成灾面积、农业劳动力这五个指标整体来看都是有显著差别的。
这也符合我们现实的农业生产活动,近30年来我们正逐步从传统农业向现代农业转变,每年都在进步,因此从年代来看,不同年代农业发展状况都有一大跨越,符合统计结果。
TestsofBetween-SubjectsEffects
Source
DependentVariable
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
粮食产量(万吨)
2.825E8
2
1.413E8
23.736
.000
农业化肥施用量(万公斤)
2.588E7
2
1.294E7
70.927
.000
粮食播种面积(千公斤)
3.006E8
2
1.503E8
35.121
.000
成灾面积(公顷)
1.247E8
2
6.233E7
2.622
.095
农业劳动力(万人)
1.061E8
2
5.306E7
19.389
.000
Intercept
粮食产量(万吨)
4.854E10
1
4.854E10
8154.751
.000
农业化肥施用量(万公斤)
2.696E8
1
2.696E8
1477.547
.000
粮食播种面积(千公斤)
2.918E11
1
2.918E11
68187.804
.000
成灾面积(公顷)
1.434E10
1
1.434E10
602.969
.000
农业劳动力(万人)
2.899E10
1
2.899E10
10593.314
.000
时代
粮食产量(万吨)
2.825E8
2
1.413E8
23.736
.000
农业化肥施用量(万公斤)
2.588E7
2
1.294E7
70.927
.000
粮食播种面积(千公斤)
3.006E8
2
1.503E8
35.121
.000
成灾面积(公顷)
1.247E8
2
6.233E7
2.622
.095
农业劳动力(万人)
1.061E8
2
5.306E7
19.389
.000
Error
粮食产量(万吨)
1.309E8
22
5951880.158
农业化肥施用量(万公斤)
4013731.314
22
182442.332
粮食播种面积(千公斤)
9.416E7
22
4279875.262
成灾面积(公顷)
5.230E8
22
2.377E7
农业劳动力(万人)
6.020E7
22
2736550.369
Total
粮食产量(万吨)
5.092E10
25
农业化肥施用量(万公斤)
3.162E8
25
粮食播种面积(千公斤)
2.993E11
25
成灾面积(公顷)
1.555E10
25
农业劳动力(万人)
3.030E10
25
CorrectedTotal
粮食产量(万吨)
4.135E8
24
农业化肥施用量(万公斤)
2.989E7
24
粮食播种面积(千公斤)
3.948E8
24
成灾面积(公顷)
6.477E8
24
农业劳动力(万人)
1.663E8
24
a.RSquared=.683(AdjustedRSquared=.655)
b.RSquared=.866(AdjustedRSquared=.854)
c.RSquared=.761(AdjustedRSquared=.740)
d.RSquared=.192(AdjustedRSquared=.119)
e.RSquared=.638(AdjustedRSquared=.605)
表4
表4给出的是对粮食产量、农业化肥施用量、粮食播种面积、成灾面积和农业劳动力的分析结果,同时也给出了它们的方差来源,包括校正模型、截距、主效应(时代)、误差及总方差来源,还给出了自由度、均方、F统计量及sig.值。
从该表中的sig值0,0,0,0.095,0表明三个时代在粮食产量、农业化肥施用量、粮食播种面积和农业劳动力方面均有显著差别。
成灾面积在这三个时代无显著差别,这一点我们给出解释为,粮食产量、农业化肥施用量、粮食播种面积、和农业劳动力主要依靠的是中国社会发展因素,因此随着中国社会的改革开放和实现现代化发展在不同时代有了不同的发展,而成灾面积主要决定因素是自然因素,不同的年代的自然情况为不可测因素和较难改变因素,且不同时代灾害发生的状况比较平衡。
因此在表现不同时代农业生产状况方面不太显著。
Box'sTestofEqualityofCovarianceMatricesa
Box'sM
99.316
F
2.128
df1
30
df2
1269.766
Sig.
.000
Teststhenullhypothesisthattheobservedcovariancematricesofthedependentvariablesareequalacrossgroups.
a.Design:
Intercept+时代
表5
从表5的sig值为0我们认为三个时代(总体)的协方差阵是不等的,我们认为这表明在不同的时代农业的发展水平是不一样的,发展速度也是不一样的。
这也刚好符合我国农业发展现状,80年代我国农业基本处于原始状态,与几千年来传承的传统农业没有说明区别,90年代,随着改革开放,人们观念改变,农业也有了初步的发展,2000年来,我国农业进入快速发展阶段。
Levene'sTestofEqualityofErrorVariancesa
F
df1
df2
Sig.
粮食产量(万吨)
6.116
2
22
.008
农业化肥施用量(万公斤)
5.308
2
22
.013
粮食播种面积(千公斤)
.775
2
22
.473
成灾面积(公顷)
1.316
2
22
.288
农业劳动力(万人)
4.324
2
22
.026
Teststhenullhypothesisthattheerrorvarianceofthedependentvariableisequalacrossgroups.
a.Design:
Intercept+时代
表6
表6表明在0.05显著性水平下,我们认为表中各指标的误差平方在三个时代均没有显著差异。
这也符合现实一般状况,即,除了时代因素外,没有其他因素对表6中各指标产生影响。
尽管事实上,还有很多因素比如,机械化水平,生物技术的发展以及管理水平的提高都对各指标产生一定的影响。
我们这里暂不考虑。
1形象分析
表7
从表7我们可以形象的看到从80年代到90年代粮食播种面积没有明显的下降,但是粮食产量却得到了很大的提高从80年代平均的40000万吨提高到90年代平均48000万吨左右,从90年代到新世纪初我们看待虽然粮食产量没有明显上升,但是粮食播种面积却大幅度下降,这表明我国的农业正向高效,精种、多产的方向发展。
这符合我国农业的发展轨迹。
2聚类分析
表8从这张由系统聚类法做出的结果可以看到从5为界,
第一类{1983~1996};第二类{1997~1999};第三类{2000~2003};第四类{2005~2006};第五类{2007}。
我们可以通过数据进行分析:
第一类,农业成灾面积较为均匀,没有大灾年;第二类,以98洪灾为例,成灾面积有所扩大;第三类,每年成灾面积维持在高位;第四类,灾害面积回归到较低水平;第五类,成灾面积开始变得平稳。
3主成分分析
3.1标准化
公因子方差
初始
提取
年份
1.000
.970
粮食产量(万吨)
1.000
.969
农业化肥施用量(万公斤)
1.000
.970
粮食播种面积(千公斤)
1.000
.892
成灾面积(公顷)
1.000
.678
农业机械总动力(万千瓦)
1.000
.618
农业劳动力(万人)
1.000
.757
提取方法:
主成份分析。
表3.1.1
公因子方差给出了该次分析从每个原始变量中提取的信息。
可以看到“成灾面积”、“农业机械总动力”、“农业劳动力”信息损失较大外,主成分包括了各个原始变量90%的信息。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
3.612
51.606
51.606
3.612
51.606
51.606
2
1.346
19.223
70.829
1.346
19.223
70.829
3
.895
12.793
83.621
.895
12.793
83.621
4
.655
9.351
92.972
5
.477
6.811
99.783
6
.013
.188
99.971
7
.002
.029
100.000
提取方法:
主成份分析。
表3.1.2
解释的总方差表显示了各个主成分解释原始变量总方差的情况,在本例中选择保留3个主成分,这3个主成分集中了原始7个变量信息的83.6%。
由下图3.1.1碎石图也可看出前三个成分特征值较大,其余四个特征值较小。
图3.1.1
3.2标准化
成份矩阵a
成份
1
2
3
年份
.980
-.098
-.010
粮食产量(万吨)
.804
.084
.561
农业化肥施用量(万公斤)
.981
-.044
.078
粮食播种面积(千公斤)
-.645
.309
.617
成灾面积(公顷)
.498
.506
-.416
农业机械总动力(万千瓦)
.468
-.619
.126
农业劳动力(万人)
.400
.770
.070
提取方法:
主成份。
a.已提取了3个成份。
表3.2.1
成份矩阵a
成份
1
2
3
4
5
6
7
年份
.980
-.098
-.010
-.140
-.073
.067
-.027
粮食产量(万吨)
.804
.084
.561
-.051
-.153
-.070
-.009
农业化肥施用量(万公斤)
.981
-.044
.078
-.128
-.107
.030
.035
粮食播种面积(千公斤)
-.645
.309
.617
.285
-.155
.053
.002
成灾面积(公顷)
.498
.506
-.416
.494
-.280
-.011
-.001
农业机械总动力(万千瓦)
.468
-.619
.126
.539
.304
.000
.001
农业劳动力(万人)
.400
.770
.070
-.026
.492
.004
.000
提取方法:
主成份。
a.已提取了7个成份。
表3.2.2
对比表3.2.1和表3.2.2,可以看到,表3.2.1三个主成分的相应结果与表3.2.2中对应部分结果是一致的。
由此可以得到标准化原始变量用各主成分线性表示的精确的表达式。
年份(标准化)=0.98prin1-0.098prin2-0.01prin3;
粮食产量(标准化)=0.804prin1+0.084prin2+0.561prin3;
农业化肥施用量(标准化)=0.981prin1-0.044prin2+0.078prin3;
粮食播种面积(标准化)=-0.645prin1+0.309prin2+0.617prin3;
成灾面积(标准化)=0.498prin1+0.506prin2-0.416prin3;
农业机械总动力(标准化)=0.468prin1-0.619prin2+0.126prin3;
农业劳动力(标准化)=0.400prin1+0.770prin2+0.070prin3;
以上输出结果,我们还不能得到用原始变量表示出主成分的表达式,这是因为成分矩阵中表示的是因子载荷矩阵而不是主成分的系数矩阵,因此要对SPSS的因子分析模块运行结果进行调整,将成分矩阵中第I列的每个元素分别除以第I个特征根的平方根,就得到主成分分析的第I个主成分的系数。
主成分系数如下表3.2.3:
成份得分系数矩阵
成份
1
2
3
年份
.271
-.073
-.011
粮食产量(万吨)
.223
.062
.627
农业化肥施用量(万公斤)
.272
-.033
.087
粮食播种面积(千公斤)
-.179
.229
.689
成灾面积(公顷)
.138
.376
-.464
农业机械总动力(万千瓦)
.129
-.460
.141
农业劳动力(万人)
.111
.572
.078
提取方法:
主成份。
表3.2.3
由表3.2.3得各个主成分用标准化后的原始变量表示的表达式:
Prin1=0.271年份(标准化)+0.223粮食产量(标准化)+0.272农业化肥施用量(标准化)-0.179粮食播种面积(标准化)+0.138成灾面积(标准化)+0.129农业机械总动力(标准化)+0.111农业劳动力(标准化)
Prin2=-0.073年份(标准化)+0.062粮食产量(标准化)-0.033农业化肥施用量(标准化)+0.229粮食播种面积(标准化)+0.376成灾面积(标准化)-0.46农业机械总动力(标准化)+0.572农业劳动力(标准化)
Prin3=-0.011年份(标准化)+0.627粮食产量(标准化)+0.087农业化肥施用量(标准化)+0.689粮食播种面积(标准化)-0.464成灾面积(标准化)+0.141农业机械总动力(标准化)+0.078农业劳动力(标准化)
将原始数据带入主成分标准化表达式,得到下表主成分得分表
年份
prin1
prin2
prin3
1983
-1.81677
-0.86215
0.3213
1984
-1.63745
-1.04491
0.50857
1985
-1.35525
-0.73531
-1.25766
1986
-1.27372
-0.52404
-0.78433
1987
-1.24607
-0.65494
-0.25851
1988
-1.04628
-0.36694
-0.8624
1989
-0.92068
-0.00163
-0.30468
1990
-0.61123
0.86459
1.27165
1991
-0.25596
1.52857
0.03921
1992
-0.1392
1.19811
0.021
1993
-0.08664
0.77309
0.45546
1994
0.14873
1.04915
-0.6351
1995
0.05925
0.18592
0.5818
1996
0.19181
0.12953
1.66777
1997
0.43941
0.77046
0.77678
1998
0.441
0.52532
1.67705
1999
0.56377
0.70106
1.39614
2000
0.78292
0.95702
-0.77062
2001
0.85345
0.70135
-1.06552
2002
0.92984
0.31608
-0.95247
2003
1.16707
0.30901
-2.57892
2004
0.88878
-0.9897
-0.18953
2005
0.96429
-0.86143
0.13098
2006
1.76652
-2.97347
0.68257
2007
1.1924
-0.99472
0.12946
表3.2.4
以prin1为x轴,prin2为y轴,prin3为z轴绘制三维空间主成分图。
如下图3.2.1。
图3.2.1
4因子分析
在进行因子分析之前,先来判断了解变量之间的相关性,是否合适进行因子分析。
输出原始变量各相关系数的显著性水平,如下表4.1:
相关矩阵
年份
粮食产量(万吨)
农业化肥施用量(万公斤)
粮食播种面积(千公斤)
成灾面积(公顷)
农业机械总动力(万千瓦)
农业劳动力(万人)
相关
年份
1.000
.788
.991
-.694
.393
.420
.284
粮食产量(万吨)
.788
1.000
.849
-.141
.229
.321
.351
农业化肥施用量(万公斤)
.991
.849
1.000
-.617
.401
.395
.315
粮食播种面积(千公斤)
-.694
-.141
-.617
1.000
-.238
-.308
-.061
成灾面积(公顷)
.393
.229
.401
-.238
1.000
.048
.410
农业机械总动力(万千瓦)
.420
.321
.395
-.308
.048
1.000
-.145
农业劳动力(万人)
.284
.351
.315
-.061
.410
-.145
1.000
Sig.(单侧)
年份
.000
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 中国农业 发展 状况