书签分享收藏举报版权申诉 / 29

立即下载加入VIP,免费下载

当前位置：首页 > 求职职场 > 简历 > 多元统计分析课程设计Word文档格式.docx

多元统计分析课程设计Word文档格式.docx

文档编号：17947759
上传时间：2022-12-12
格式：DOCX
页数：29
大小：97.64KB

《多元统计分析课程设计Word文档格式.docx》由会员分享，可在线阅读，更多相关《多元统计分析课程设计Word文档格式.docx（29页珍藏版）》请在冰豆网上搜索。

多元统计分析课程设计Word文档格式.docx

1.按Analyze→Classify→K-means-cluster顺序单击菜单项，打开聚类分析主对话框。

2.选择分析变量送到右边的Variables栏中。

3.在“NumberofCluster”中选择3，在Method选项中选择“Classifyonly”

4.单击Save按钮，在对话框栏内选择Clustermembership选项，

5.单击Option按钮，，在对话框Statistics栏内选择Initialclustercenters选项，在对话框MissingValues栏内选择Excludecaseslistwise选项

（二）判别分析的步骤

1.按Analyze→Classify→Discriminant顺序单击菜单项，打开判别分析主对话框。

2.主对话框左边的矩形框中选定分类变量，并用上面一个箭头按钮将其移到“GroupingVariable”框中。

然后用其下面的“DefineRange”输入最小变量和最大变量

3.选择判别变量送到右边的Independents栏中。

在主对话框中选择“Enterindependentstogether”

4.在主对话框中单击“Statistics”按钮可以打开选择输出统计量的对话框，在对话框Description栏内选择Means选项，在对话框FunctionCoefficints栏内选择Fisher’s和unstandardized选项，在对话框Matrices栏内选择Within-groupscovariance选项。

5.在主对话框中单击“classification”按钮，打开选择分类参数与分类结果对话框，除系统默认之外，在对话框Display栏内选择和Casewiseresults选项和Summarytable选项，在对话框Plots栏内选择三种。

6.在主对话框中单击“Save...”可打开选择将各样品的判别结果保存于数据文件的对话框，选中“Predictedgroupmembership”可保存各样品的预报（判别）分类；

选中“Discriminantscores”可保存各样品的典型判别函数值；

选中“Probabilitiesofgroupmembership”可保存各样品的后验概率。

（三）聚类分析的结果

快速聚类整理表：

类别

地区

第一类

北京天津山西内蒙古黑龙江上海广西海南重庆贵州云南西藏陕西甘肃青海宁夏新疆

第二类

河北辽宁吉林浙江安徽福建江西河南湖北湖南广东四川

第三类

江苏山东

（四）：

判别分析的的结果

各类的均值：

地区

第一类均值

第二类均值

第三类均值

农、林、牧、渔业

153.8799

299.0844

344.9445

采矿业

271.5194

289.2842

304.3328

制造业

749.0112

3381.7967

8649.0746

电力、燃气及水的生产和供应业

354.5886

571.5384

605.5636

建筑业

40.0365

68.7633

243.34

交通运输、储蓄和邮政业

470.2504

847.4208

1026.35

信息传输、计算机服务和软件业

61.2263

110.7646

109.4647

批发和零售业

63.6769

236.4418

606.5013

住宿和餐饮业

33.4261

130.2939

246.8029

金融业

6.8905

17.43

16.9265

房地产业

859.6059

2225.9117

4017.1351

租赁和商务、服务业

34.3253

90.568

182.916

科学研究、技术服务和地质勘查业

23.252

45.3526

126.5754

水利、环境和公共设施管理业

366.3587

905.947

1311.6814

居民服务和其他服务业

10.0867

34.8087

106.375

教育

68.6707

157.3901

232.5481

卫生、社会保障和社会福利业

30.9537

92.5174

111.1115

文化、体育和娱乐业

38.154

99.1365

272.5649

公共管理和社会组织

109.5961

158.9508

477.9933

Eigenvalues（特征值）

Function

Eigenvalue

%ofVariance

Cumulative%

CanonicalCorrelation

1

56.435（a）

89.1

.991

2

6.893（a）

10.9

100.0

.935

aFirst2canonicaldiscriminantfunctionswereusedintheanalysis.

两个典型判别分析，特征值（Eigenvalue）分别为56.435和6.89，典型相关系数（CanonicalCorrelation）分别为0.991和0.935，

Wilks'

Lambda

TestofFunction（s）

Chi-square

df

Sig.

1through2

.002

116.217

38

.000

.127

39.254

18

.003

根据Wilks'

Lambda表，可知：

=0.002和0.127很小，近视分布

=116.217和39.254，相伴概率为7.418568558275e-010和0.03，小于0.01，高度显著，所以各类的样本均值向量有显著性差异，因此判别有效。

ClassificationFunctionCoefficients分类函数系数

ClusterNumberofCase

3

.006

-.088

-.482

.005

-.071

.001

.010

.062

-.001

-.023

-.065

.017

.061

.266

.012

.055

.279

-.021

-.013

.427

-.019

.108

.807

.040

.443

-.022

-.248

-4.632

-.006

-.032

.020

-.010

-.546

-.009

-.265

-.699

-.058

-.278

-.028

.148

2.607

.011

.116

1.310

-.039

.242

-2.637

-.018

-.084

.096

.084

-3.782

-30.072

-451.326

Fisher'

slineardiscriminantfunctions

StandardizedCanonicalDiscriminantFunctionCoefficients

-2.655

.588

-.631

-.486

1.775

.157

-.574

.608

.574

-.064

2.729

-.096

.829

.680

2.457

.446

-.959

-1.115

-.695

-.858

.321

-.872

-.523

-.587

.697

-2.348

.366

1.335

.691

2.582

1.113

-2.159

-3.450

.161

.800

.315

.396

判别函数

FunctionsatGroupCentroids（各组重心的函数值）

-3.683

1.863

.905

-3.124

25.881

2.909

Unstandardizedcanonicaldiscriminantfunctionsevaluatedatgroupmeans

CasewiseStatistics（各数据统计量）

ActualGroup

HighestGroup

SecondHighestGroup

DiscriminantScores

PredictedGroup

P（G=g|D=d）

SquaredMahalanobisDistancetoCentroid

Group

Function1

Function2

p

北京

0.442

1.000

1.633

0.000

64.846

-4.499

2.846

天津

0.611

0.985

55.535

-3.554

2.847

河北

0.471

1.508

63.486

1.943

-3.779

山西

0.037

6.572

28.774

-1.120

1.844

内蒙古

0.259

2.706

65.223

-5.321

2.021

辽宁

0.172

3.521

64.332

2.768

-2.903

吉林

0.103

4.549

22.193

-0.182

-1.288

黑龙江

0.916

0.176

47.917

-4.067

1.693

上海

0.663

0.823

44.687

-4.239

1.146

江苏

0.811

0.420

641.159

25.636

2.309

浙江

0.845

0.336

54.099

1.323

-3.526

安徽

0.299

2.418

50.309

-0.136

-4.279

福建

0.075

5.168

27.786

0.835

-0.852

江西

0.904

0.201

50.556

1.352

-3.157

山东

680.141

26.127

3.508

河南

0.890

0.234

52.690

1.205

-3.503

湖北

0.262

2.678

36.668

-0.707

-3.410

湖南

0.497

1.397

52.011

0.308

-4.144

广东

0.700

0.713

57.953

1.381

-3.821

广西

0.010

0.999

9.307

0.001

23.235

-3.508

-1.183

海南

0.910

0.189

40.215

-3.382

1.549

重庆

0.439

1.647

59.197

-3.563

3.140

四川

0.947

0.109

41.756

0.764

-2.825

贵州

0.987

0.027

45.991

-3.566

1.976

云南

0.867

0.284

51.776

-4.212

1.936

西藏

0.809

0.424

44.567

-3.126

2.198

陕西

0.572

1.116

35.345

-2.651

1.641

甘肃

0.313

2.323

39.717

-2.236

2.340

青海

0.757

0.556

56.449

-4.269

2.325

宁夏

0.875

0.268

53.157

-3.991

2.279

新疆

0.192

3.297

56.296

-5.317

1.070

根据此图可以大概看出各类的分布，便于粗略的观察。

ClassificationResults（a）（判别结果）

ClusterNumberofCase

PredictedGroupMembership

Total

1

2

Original

Count

17

12

%

.0

a100.0%oforiginalgroupedcasescorrectlyclassified.

预测分组恰好与实际分组是一致的，判对率为100%

分析

第一类：

北京天津山西内蒙古黑龙江上海广西海南重庆贵州云南西藏陕西甘肃青海宁夏新疆在主要行业分的全社会固定资产投资数额比较少，原因有：

第一像北京天津上海重庆这些发达的地区，尽管经济较发达，但由于这些区域面积较小，固定投资数额较小，第二：

像其它省市都是中国经济落后地区，固定投资额就比较少，但这些地区的矿产资源较丰富采矿业投资数额和其它类差不多。

大部分的省市处于中国的西北，西南地区，经济落后，需要加强各个行业的投资。

第二类：

河北辽宁吉林浙江安徽福建江西河南湖北湖南广东四川这些省在主要行业分的全社会固定资产投资数额相对比较多，原因有以下三点：

第一，这些省大部分处于中部和沿海地区，经济较发达。

第二，国家在十一五计划中实施中部崛起战略，促进了中部省的投资数额，第三：

国家为保持沿海地区的经济发达，加强了投资。

特别是房地产与制造业这两个产业投资数额非常大，主要因为这两个行业与国家的政策和人民的生活密切相关。

第三类：

江苏山东属于沿海地区，在主要行业分的全社会固定资产投资数额相当大，总投资额分别为18949.8746亿元和19034.53亿元占全国总投资的比率分别为0.086601和0.086988，大力促进经济的发展。

因子分析：

（1）是否可进行因子分析的判断

在进行因子分析前，作KMOandBartlett'

sTest，

KMOandBartlett'

sTest

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

.778

Bartlett'

sTestofSphericity

Approx.Chi-Square

728.572

Df

171

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy值为0.778。

渐近的x^2=728.572较大，适合进行因子分析。

（2）因子分析的步骤

1.打开spss软件

2.按Analyze→DataReduction→Factor顺序单击菜单项，打开因子分析主对话框。

3.选择分析变量送到右边的Variables栏中。

4.单击Descriptives按钮，在对话框Statistics栏内选择Initialsolution选项，在CorrelationMatrix选项选择Coefficients,KMOandBartlett'

sTestofsphericity选项。

5.在主对话框中单击Extraction按钮，相应的对话框中：

a）Method菜单中选择Principlecomponents项，使用主成分分析方法。

b）Analyze栏中选择Correlationmatrix项，分析相关矩阵。

c）Extract栏中选择Numberoffactors4。

d）Display栏中选择Unrotatedfactorsolution，显示未旋转的因子结果。

同样选择Screeplot，要求作出特征值的散点图。

e）Maximumiterationconvagence25，结束迭代的判据为到达最大迭代次数25.

6.主对话框中单击Score按钮。

在相应的对话框中选择Saveasvariables，并在Method栏中选择Rregression，要求通过回归方法计算因子得分并把因子得分作为变量保存到数据文件中。

同时选择Displayfactorscorecoefficientmatrix显示因子得分系数阵。

7.主对话框中单击Rotation按钮。

在相应对话框中选择Method,并在Method栏中选择Varimax,在Display中选择Rotatedsolution和Loadingplots选项。

8.主对话框中单击Options按钮。

在相应对话框中选择MissingValues,并在MissingValues栏中选择Excludecaseslistwise选项。

9.在主对话框中单击OK按钮执行运算。

（3）因子分析的结果及其分析

总方差

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 多元统计分析课程设计

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：多元统计分析课程设计Word文档格式.docx
链接地址：https://www.bdocx.com/doc/17947759.html

多元统计分析课程设计Word文档格式.docx

热门标签