多元统计分析课程设计Word文档格式.docx
- 文档编号:17947759
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:29
- 大小:97.64KB
多元统计分析课程设计Word文档格式.docx
《多元统计分析课程设计Word文档格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程设计Word文档格式.docx(29页珍藏版)》请在冰豆网上搜索。
1.按Analyze→Classify→K-means-cluster顺序单击菜单项,打开聚类分析主对话框。
2.选择分析变量送到右边的Variables栏中。
3.在“NumberofCluster”中选择3,在Method选项中选择“Classifyonly”
4.单击Save按钮,在对话框栏内选择Clustermembership选项,
5.单击Option按钮,,在对话框Statistics栏内选择Initialclustercenters选项,在对话框MissingValues栏内选择Excludecaseslistwise选项
(二)判别分析的步骤
1.按Analyze→Classify→Discriminant顺序单击菜单项,打开判别分析主对话框。
2.主对话框左边的矩形框中选定分类变量,并用上面一个箭头按钮将其移到“GroupingVariable”框中。
然后用其下面的“DefineRange”输入最小变量和最大变量
3.选择判别变量送到右边的Independents栏中。
在主对话框中选择“Enterindependentstogether”
4.在主对话框中单击“Statistics”按钮可以打开选择输出统计量的对话框,在对话框Description栏内选择Means选项,在对话框FunctionCoefficints栏内选择Fisher’s和unstandardized选项,在对话框Matrices栏内选择Within-groupscovariance选项。
5.在主对话框中单击“classification”按钮,打开选择分类参数与分类结果对话框,除系统默认之外,在对话框Display栏内选择和Casewiseresults选项和Summarytable选项,在对话框Plots栏内选择三种。
6.在主对话框中单击“Save...”可打开选择将各样品的判别结果保存于数据文件的对话框,选中“Predictedgroupmembership”可保存各样品的预报(判别)分类;
选中“Discriminantscores”可保存各样品的典型判别函数值;
选中“Probabilitiesofgroupmembership”可保存各样品的后验概率。
(三)聚类分析的结果
快速聚类整理表:
类别
地区
第一类
北京天津山西内蒙古黑龙江上海广西海南重庆贵州云南西藏陕西甘肃青海宁夏新疆
第二类
河北辽宁吉林浙江安徽福建江西河南湖北湖南广东四川
第三类
江苏山东
(四):
判别分析的的结果
各类的均值:
地区
第一类均值
第二类均值
第三类均值
农、林、牧、渔业
153.8799
299.0844
344.9445
采矿业
271.5194
289.2842
304.3328
制造业
749.0112
3381.7967
8649.0746
电力、燃气及水的生产和供应业
354.5886
571.5384
605.5636
建筑业
40.0365
68.7633
243.34
交通运输、储蓄和邮政业
470.2504
847.4208
1026.35
信息传输、计算机服务和软件业
61.2263
110.7646
109.4647
批发和零售业
63.6769
236.4418
606.5013
住宿和餐饮业
33.4261
130.2939
246.8029
金融业
6.8905
17.43
16.9265
房地产业
859.6059
2225.9117
4017.1351
租赁和商务、服务业
34.3253
90.568
182.916
科学研究、技术服务和地质勘查业
23.252
45.3526
126.5754
水利、环境和公共设施管理业
366.3587
905.947
1311.6814
居民服务和其他服务业
10.0867
34.8087
106.375
教育
68.6707
157.3901
232.5481
卫生、社会保障和社会福利业
30.9537
92.5174
111.1115
文化、体育和娱乐业
38.154
99.1365
272.5649
公共管理和社会组织
109.5961
158.9508
477.9933
Eigenvalues(特征值)
Function
Eigenvalue
%ofVariance
Cumulative%
CanonicalCorrelation
1
56.435(a)
89.1
.991
2
6.893(a)
10.9
100.0
.935
aFirst2canonicaldiscriminantfunctionswereusedintheanalysis.
两个典型判别分析,特征值(Eigenvalue)分别为56.435和6.89,典型相关系数(CanonicalCorrelation)分别为0.991和0.935,
Wilks'
Lambda
TestofFunction(s)
Chi-square
df
Sig.
1through2
.002
116.217
38
.000
.127
39.254
18
.003
根据Wilks'
Lambda表,可知:
=0.002和0.127很小,近视分布
=116.217和39.254,相伴概率为7.418568558275e-010和0.03,小于0.01,高度显著,所以各类的样本均值向量有显著性差异,因此判别有效。
ClassificationFunctionCoefficients分类函数系数
ClusterNumberofCase
3
.006
-.088
-.482
.005
-.071
.001
.010
.062
-.001
-.023
-.065
.017
.061
.266
.012
.055
.279
-.021
-.013
.427
-.019
.108
.807
.040
.443
-.022
-.248
-4.632
-.006
-.032
.020
-.010
-.546
-.009
-.265
-.699
-.058
-.278
-.028
.148
2.607
.011
.116
1.310
-.039
.242
-2.637
-.018
-.084
.096
.084
-3.782
-30.072
-451.326
Fisher'
slineardiscriminantfunctions
StandardizedCanonicalDiscriminantFunctionCoefficients
-2.655
.588
-.631
-.486
1.775
.157
-.574
.608
.574
-.064
2.729
-.096
.829
.680
2.457
.446
-.959
-1.115
-.695
-.858
.321
-.872
-.523
-.587
.697
-2.348
.366
1.335
.691
2.582
1.113
-2.159
-3.450
.161
.800
.315
.396
判别函数
FunctionsatGroupCentroids(各组重心的函数值)
-3.683
1.863
.905
-3.124
25.881
2.909
Unstandardizedcanonicaldiscriminantfunctionsevaluatedatgroupmeans
CasewiseStatistics(各数据统计量)
ActualGroup
HighestGroup
SecondHighestGroup
DiscriminantScores
PredictedGroup
P(G=g|D=d)
SquaredMahalanobisDistancetoCentroid
Group
Function1
Function2
p
北京
0.442
1.000
1.633
0.000
64.846
-4.499
2.846
天津
0.611
0.985
55.535
-3.554
2.847
河北
0.471
1.508
63.486
1.943
-3.779
山西
0.037
6.572
28.774
-1.120
1.844
内蒙古
0.259
2.706
65.223
-5.321
2.021
辽宁
0.172
3.521
64.332
2.768
-2.903
吉林
0.103
4.549
22.193
-0.182
-1.288
黑龙江
0.916
0.176
47.917
-4.067
1.693
上海
0.663
0.823
44.687
-4.239
1.146
江苏
0.811
0.420
641.159
25.636
2.309
浙江
0.845
0.336
54.099
1.323
-3.526
安徽
0.299
2.418
50.309
-0.136
-4.279
福建
0.075
5.168
27.786
0.835
-0.852
江西
0.904
0.201
50.556
1.352
-3.157
山东
680.141
26.127
3.508
河南
0.890
0.234
52.690
1.205
-3.503
湖北
0.262
2.678
36.668
-0.707
-3.410
湖南
0.497
1.397
52.011
0.308
-4.144
广东
0.700
0.713
57.953
1.381
-3.821
广西
0.010
0.999
9.307
0.001
23.235
-3.508
-1.183
海南
0.910
0.189
40.215
-3.382
1.549
重庆
0.439
1.647
59.197
-3.563
3.140
四川
0.947
0.109
41.756
0.764
-2.825
贵州
0.987
0.027
45.991
-3.566
1.976
云南
0.867
0.284
51.776
-4.212
1.936
西藏
0.809
0.424
44.567
-3.126
2.198
陕西
0.572
1.116
35.345
-2.651
1.641
甘肃
0.313
2.323
39.717
-2.236
2.340
青海
0.757
0.556
56.449
-4.269
2.325
宁夏
0.875
0.268
53.157
-3.991
2.279
新疆
0.192
3.297
56.296
-5.317
1.070
根据此图可以大概看出各类的分布,便于粗略的观察。
ClassificationResults(a)(判别结果)
ClusterNumberofCase
PredictedGroupMembership
Total
1
2
Original
Count
17
12
%
.0
a100.0%oforiginalgroupedcasescorrectlyclassified.
预测分组恰好与实际分组是一致的,判对率为100%
分析
第一类:
北京天津山西内蒙古黑龙江上海广西海南重庆贵州云南西藏陕西甘肃青海宁夏新疆在主要行业分的全社会固定资产投资数额比较少,原因有:
第一像北京天津上海重庆这些发达的地区,尽管经济较发达,但由于这些区域面积较小,固定投资数额较小,第二:
像其它省市都是中国经济落后地区,固定投资额就比较少,但这些地区的矿产资源较丰富采矿业投资数额和其它类差不多。
大部分的省市处于中国的西北,西南地区,经济落后,需要加强各个行业的投资。
第二类:
河北辽宁吉林浙江安徽福建江西河南湖北湖南广东四川这些省在主要行业分的全社会固定资产投资数额相对比较多,原因有以下三点:
第一,这些省大部分处于中部和沿海地区,经济较发达。
第二,国家在十一五计划中实施中部崛起战略,促进了中部省的投资数额,第三:
国家为保持沿海地区的经济发达,加强了投资。
特别是房地产与制造业这两个产业投资数额非常大,主要因为这两个行业与国家的政策和人民的生活密切相关。
第三类:
江苏山东属于沿海地区,在主要行业分的全社会固定资产投资数额相当大,总投资额分别为18949.8746亿元和19034.53亿元占全国总投资的比率分别为0.086601和0.086988,大力促进经济的发展。
因子分析:
(1)是否可进行因子分析的判断
在进行因子分析前,作KMOandBartlett'
sTest,
KMOandBartlett'
sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.778
Bartlett'
sTestofSphericity
Approx.Chi-Square
728.572
Df
171
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy值为0.778。
渐近的x^2=728.572较大,适合进行因子分析。
(2)因子分析的步骤
1.打开spss软件
2.按Analyze→DataReduction→Factor顺序单击菜单项,打开因子分析主对话框。
3.选择分析变量送到右边的Variables栏中。
4.单击Descriptives按钮,在对话框Statistics栏内选择Initialsolution选项,在CorrelationMatrix选项选择Coefficients,KMOandBartlett'
sTestofsphericity选项。
5.在主对话框中单击Extraction按钮,相应的对话框中:
a)Method菜单中选择Principlecomponents项,使用主成分分析方法。
b)Analyze栏中选择Correlationmatrix项,分析相关矩阵。
c)Extract栏中选择Numberoffactors4。
d)Display栏中选择Unrotatedfactorsolution,显示未旋转的因子结果。
同样选择Screeplot,要求作出特征值的散点图。
e)Maximumiterationconvagence25,结束迭代的判据为到达最大迭代次数25.
6.主对话框中单击Score按钮。
在相应的对话框中选择Saveasvariables,并在Method栏中选择Rregression,要求通过回归方法计算因子得分并把因子得分作为变量保存到数据文件中。
同时选择Displayfactorscorecoefficientmatrix显示因子得分系数阵。
7.主对话框中单击Rotation按钮。
在相应对话框中选择Method,并在Method栏中选择Varimax,在Display中选择Rotatedsolution和Loadingplots选项。
8.主对话框中单击Options按钮。
在相应对话框中选择MissingValues,并在MissingValues栏中选择Excludecaseslistwise选项。
9.在主对话框中单击OK按钮执行运算。
(3)因子分析的结果及其分析
总方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课程设计