完整版多元统计分析实例汇总.docx
- 文档编号:26747319
- 上传时间:2023-06-22
- 格式:DOCX
- 页数:25
- 大小:43.16KB
完整版多元统计分析实例汇总.docx
《完整版多元统计分析实例汇总.docx》由会员分享,可在线阅读,更多相关《完整版多元统计分析实例汇总.docx(25页珍藏版)》请在冰豆网上搜索。
完整版多元统计分析实例汇总
多元统计分析实例
院系:
商学院学号:
姓名:
多兀统计分析实例
本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对收集的数据进行比较分析对31个省市自治区进行分类•选取了6个指标农业产值林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.
数据如下表:
江
区京津北H蒙宁林龙海苏江徽建西东南北南东西南庆川州南藏西肃海夏牘
地北天河山内辽吉黒上江浙安福江山河湖湖广广海重四贵77西陕甘青宁新
农业总产值
林业驰产{牧业总产懾业总产侬村居民家庭拥有生产性[5
166.29
54.83
154.16
1298
12767.09
0・5
195.^9
£79
105.01
61,66
17508.57
1.58
3095.29
77.88
1747.66
1?
7.74
17904.S3
1789
847-41
79,07
298.83
8.42
^808.38
2.5
1171.-57
97.7G
U1S.86
26.08
293曲.旳
10.4
1539.65
128.68
16ZL23
618.74
249^7.92
3.78
1166.ES
90.1
1130.36
34.14
24937.SB
S.27
2315.64
134.5
1350.63
77.92
31507.91
13.56
171.48
9.55
72.59
57.45
4146.13
0.26
2966.72
99.75
1226,18
1235.4
14541.03
L25
1229.36
142.14
549.01
687.05
22747.33
654
1867.64
209.5
1119.73
334.43
15134.35
1.39
1263.71
256.45
48L28
p03.36
11821.38
73
1003.21
228.91
752.63
333.06
gggg.31
L57
39&0.储
107.01
22S5.92
1267.07
19168.14
L&4
3958.^5
140.85
2255.61
SS.4
12980.72
1.&2
2488.06
100.05
1334,X
626,23
10813.13
1.71
2651.69
259.97
1488.58
279.94
3904.32
1.22
2229.27
222.74
1134.14
914.05
8516.72
0.53
1724
245.56
1072.77
331.74
11851.56
L37
4S0.72
137.85
214.14
236.27
11387.06
0.83
341.51
43.48
453.9
44.99
122S5.74
L29
2764-9
151.5
2269.86
163.77
13759.17
1.14
364.
54.19
421.55
28.21
11957.31
L18
1398.17
225.S3
912.97
63.1
19020.92
1..6
53.39
2”56
59.02
0.22
52935.07
L89
1526.23
58.44
598.72
14.61
12273.06
L52
984,24
20.07
231.72
1,8
1$486.44
2.72
117-09
4.57
137.08
0.56
21919.甜
L33
240,4&
9・77
105,72
13.36
24266.19
3・69
1675
収04
485.37
15*26
35Q70.31
576
.聚类法
设定4个群聚,采用了系统聚类法.下表为spss分析之后的结果.
聚类表
阶
群集组合
首次岀现阶群集
群集1
群集2
系数
群集1
群集2
下一阶
1
5
7
226.381
0
0
13
2
2
9
1715.218
0
0
5
3
22
24
1974.098
0
0
7
4
1
29
5392.690
0
0
6
5
2
30
6079.755
2
0
6
6
1
2
11120.902
4
5
8
7
4
22
21528.719
0
3
11
8
1
26
23185.444
6
0
14
9
12
20
26914.251
0
0
19
10
27
31
35203.443
0
0
20
11
4
28
50321.121
7
0
22
12
11
13
65624.068
0
0
24
13
5
25
114687.756
1
0
17
14
1
21
169600.075
8
0
22
15
8
18
188500.814
0
0
21
16
17
19
204825.463
0
0
21
17
5
14
268125.103
13
0
20
18
3
23
387465.457
0
0
26
19
6
12
425667.984
0
9
23
20
5
27
459235.019
17
10
23
21
8
17
499195.430
15
16
25
22
1
4
559258.810
14
11
28
23
5
6
708176.881
20
19
24
24
5
11
854998.386
23
12
28
25
8
10
1042394.608
21
0
26
26
3
8
1222229.597
18
25
29
27
15
16
1396048.280
0
0
29
28
1
5
1915098.014
22
24
30
29
3
15
3086204.552
26
27
30
30
1
3
6791755.637
28
29
0
RescaledDistaneeClusterCombine
CASE0510152025
内蒙
5
-+
吉林
7
-+
云南
25
-+-+
江西
14
-++-+
陕西
27
-+-+|
新疆
31
-++-+
安徽
12
-+-+11
广西
20
—++—++———————+
辽宁
6
---+||
浙江
11
-+—+1
福建
13
-+1
重庆
22
-++
+
贵州
24
-+1
|
山西
4
-++|
|
甘肃
28
-+||
|
北京
1
-+||
|
青海
29
+++
|
1
天津
2
-+1
|
上海
9
-+1
|
宁夏
30
-++
|
西藏
26
-+
|
海南
21
-+
|
河北
3
|
1
四川
23
+|
|
黑龙江
8
-+-+++
|
湖南
18
-+++||
|
湖北
17
-+-++-++
■+
广东
19
-+||
江苏
10
--——+|
山东
15
++
河南
16
+
群集成员
案例
4群集
1:
北京
1
2:
天津
1
3:
河北
1
4:
山西
1
5:
内蒙
2
6:
辽宁
1
7:
吉林
2
8:
黑龙江
2
9:
上海
1
10:
江苏
1
11:
浙江
1
12:
安徽
1
13:
福建
1
14:
江西
1
15:
山东
3
16:
河南
1
17:
湖北
1
18:
湖南
1
19:
广东
1
20:
广西
1
21:
海南
1
22:
重庆
1
23:
四川
1
24:
贵州
1
25:
云南
1
26:
西藏
4
27:
陕西
1
28:
甘肃
1
29:
青海
1
30:
宁夏
1
31:
新疆
2
从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的
特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平
农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因为,
西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较少•
三.判别法
X1,X2,X3,X4,X5,X6分别代表农业产值,林业产值.牧业总产值,渔业总产
值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积
分析案例处理摘要
未加权案例
N
百分比
有效
31
100.0
排除的
缺失或越界组代码
0
.0
至少一个缺失判别变量
0
.0
缺失或越界组代码还有至少一
个缺失判别变量
0
.0
合计
0
.0
合计
31
100.0
实验结果分析:
组统计量
AverageLinkage(BetweenGroups)
有效的N(列表状态)
均值
标准差
未加权的
已加权的
1
农业总产值
1463.8900
1062.03486
25
25.000
林业总产值
118.5768
87.02052
25
25.000
牧业总产值
830.3664
671.10440
25
25.000
渔业总产值
291.4128
346.71902
25
25.000
农村居民家庭拥有生产性固定
资产原值
14432.3400
5287.92950
25
25.000
农村居民家庭经营耕地面积
1.5496
.88484
25
25.000
2
农业总产值
1582.2975
543.92851
4
4.000
林业总产值
93.3500
37.71131
4
4.000
牧业总产值
1021.3175
372.88255
4
4.000
渔业总产值
38.3500
27.49067
4
4.000
农村居民家庭拥有生产性固定
资产原值
30226.4175
4233.77839
4
4.000
农村居民家庭经营耕地面积
9.4975
3.30626
4
4.000
3
农业总产值
3960.6200
a
1
1.000
林业总产值
107.0100
a
1
1.000
牧业总产值
2285.9200
a
1
1.000
渔业总产值
1267.0700
a
1
1.000
农村居民家庭拥有生产性固定
资产原值
19168.1400
1
1.000
农村居民家庭经营耕地面积
1.6400
a
1
1.000
4
农业总产值
53.3900
a
1
1.000
林业总产值
2.5600
a
1
1.000
牧业总产值
59.0200
a
1
1.000
渔业总产值
.2200
a
1
1.000
农村居民家庭拥有生产性固定
资产原值
52935.0700
a
1
1.000
农村居民家庭经营耕地面积
1.8900
a
1
1.000
从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明显的差异.
组均值的均等性的检验
Wilks的Lambda
F
df1
df2
Sig.
农业总产值
.773
2.640
3
27
.070
林业总产值
.928
.699
3
27
.561
牧业总产值
.801
2.238
3
27
.107
渔业总产值
.691
4.019
3
27
.017
农村居民家庭拥有生产性固定
资产原值
.253
26.538
3
27
.000
组均值的均等性的检验
Wilks的Lambda
F
df1
df2
Sig.
农业总产值
.773
2.640
3
27
.070
林业总产值
.928
.699
3
27
.561
牧业总产值
.801
2.238
3
27
.107
渔业总产值
.691
4.019
3
27
.017
农村居民家庭拥有生产性固定
资产原值
.253
26.538
3
27
.000
农村居民家庭经营耕地面积
.190
38.263
3
27
.000
由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大,不过仍说明接受原假设,各指标族群间差异较大.
汇聚的组内矩阵
农业总产值
林业总产值
牧业总产值
渔业总产值
相关性
农业总产值
1.000
.449
.895
.400
林业总产值
.449
1.000
.489
.481
牧业总产值
.895
.489
1.000
.294
渔业总产值
.400
.481
.294
1.000
农村居民家庭拥有生产性固定
资产原值
-.093
-.262
-.052
-.040
农村居民家庭经营耕地面积
.056
-.033
.181
-.104
汇聚的组内矩阵
农村居民家庭拥
有生产性固定资
产原值
农村居民家庭经
营耕地面积
相关性
农业总产值
-.093
.056
林业总产值
-.262
-.033
牧业总产值
-.052
.181
渔业总产值
-.040
-.104
农村居民家庭拥有生产性固定
资产原值
1.000
.326
农村居民家庭经营耕地面积
.326
1.000
从表中可以知道,检验结果p值>0.05,此时,说明协方差矩阵相等,可以进
行bayes检验.
Fisher分析法
协方差矩阵的均等性的箱式检验
对数行列式
Average
Linkage(Between
Groups)
秩
对数行列式
1
6
61.125
2
a
b
3
c
b
4
c
b
汇聚的组内
6
62.351
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
典型判别式函数摘要
特征值
函数
特征值
方差的%
累积%
正则相关性
1
4.874a
64.2
64.2
.911
2
2.084a
27.4
91.6
.822
3
.638a
8.4
100.0
.624
由表中看出,函数1,2的特征值达到0.911,0.822比较大,对判别的贡献大
标准化的典型判别式函数系数
函数
1
2
3
农业总产值
.500
-.196
.000
林业总产值
.234
.164
-.742
牧业总产值
-.639
.143
.649
渔业总产值
-.185
-.130
.869
农村居民家庭拥有生产性
固定资产原值
.370
1.022
.071
农村居民家庭经营耕地面积
.865
-.676
.051
典型判别式函数系数
函数
1
2
3
农业总产值
.000
.000
.000
林业总产值
.003
.002
-.009
牧业总产值
.000
.000
.001
渔业总产值
.000
.000
.003
农村居民家庭拥有生产性固定资产原值
.000
.000
.000
农村居民家庭经营耕地面积
.626
-.489
.037
(常量)
-2.928
-2.269
-.975
典型判别式函数系数
函数
1
2
3
农业总产值
.000
.000
.000
林业总产值
.003
.002
-.009
牧业总产值
.000
.000
.001
渔业总产值
.000
.000
.003
农村居民家庭拥有生产性固定资产原值
.000
.000
.000
农村居民家庭经营耕地面积
.626
-.489
.037
(常量)
-2.928
-2.269
-.975
非标准化系数
由表中可知,3个Fishe判别函数分别为
yi
2.928
0.003X2
0.626X6
y2
2.269
0.002X2
0.489X6
y3
0.975
0.009X2
0.01X30.03X40.037X6
农村居民家庭拥有生产性固定资产原值对判别数据所属群体无用
结构矩阵
函数
1
2
3
农村居民家庭经营耕地面积
.909*
-.319
.126
农村居民家庭拥有生产
性固定资产原值
.585
.775*
.213
林业总产值
-.068
-.162*
-.027
渔业总产值
-.164
-.059
.695*
农业总产值
-.026
-.179
.591*
牧业总产值
.007
-.166
.547*
判别变量和标准化典型判别式函数之间的汇聚组间相关性
按函数内相关性的绝对大小排序的变量。
*.每个变量和任意判别式函数间最大的绝对相关性
该表是原始变量与典型变量(标准化的典型判别函数)的相关系数,相关系数的
绝对值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关性较强.符合较好.
组质心处的函数
AverageLinkage(Between
Groups)
函数
1
2
3
1
-.859
-.159
-.170
2
5.184
-.860
.085
3
-1.262
.162
4.058
4
2.013
7.257
-.144
在组均值处评估的非标准化典型判别式函数
由上表可知各类别重心的位置,通过计算观测值与各重心的距离,距离最小的即为该观测值的分类.
贝叶斯分析法
分类函数系数
AverageLinkage(BetweenGroups)
1
2
3
4
农业总产值
.003
.006
.002
.003
林业总产值
.029
.042
-.010
.051
牧业总产值
-.003
-.009
.002
-.004
渔业总产值
-.002
-.004
.010
-.006
农村居民家庭拥有生产性
固定资产原值
.001
.001
.001
.002
农村居民家庭经营耕地面积
.153
4.286
-.100
-1.675
(常量)
-8.418
-38.180
-20.732
-61.646
分类函数系数
AverageLinkage(BetweenGroups)
该表为贝叶斯函数判别函数的取值,从图中可以知道三类贝叶斯函数
第一类:
y1
0.03x1
0.029x2
0.03x3
0.002x4
0.001x5
0.153x1
8.418
第二类;
y2
0.06x1
0.42x2
0.009x3
0.004x4
0.004x5
4.286x6
38.18
第三类;
y3
0.02x-i
0.010x2
0.002x3
0.010x4
0.001x5
1.x620.732
第四类:
『40.OO3X-I0.051x20.004x30.006x40.002x51.675x661.646
将各样品的自变量值代入上述4个BayeS判别函数,得到函数值。
比较函数值,哪个函数值比较大就可以判断该样品判入哪一类.
判别结果检验
按照案例顺序的统计量
案例数
目
最高组
P(D>d|G=g)
实际组
预测组
P
df
初始
1
1
1
.684
3
2
1
1
.945
3
3
1
1
.724
3
4
1
1
.390
3
5
2
2
.961
3
6
1
1
.117
3
7
2
2
.533
3
8
2
2
.013
3
9
1
1
.172
3
10
1
3**
.585
3
11
1
1
.219
3
12
1
1
.975
3
13
1
1
.980
3
14
1
1
.699
3
15
3
3
1.000
3
16
1
1
.900
3
17
1
1
.313
3
18
1
1
.773
3
19
1
1
.468
3
20
1
1
.868
3
21
1
1
.742
3
22
1
1
.949
3
23
1
1
.672
3
24
1
1
.910
3
25
1
1
.268
3
26
4
4
1.000
3
27
1
1
.929
3
28
1
1
.568
3
29
1
1
.526
3
30
1
1
.182
3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 多元 统计分析 实例 汇总