书签分享收藏举报版权申诉 / 16

立即下载加入VIP,免费下载

当前位置：首页 > 外语学习 > 日语学习 > 聚类分析及判别分析实验报告范例文档格式.docx

聚类分析及判别分析实验报告范例文档格式.docx

文档编号：15233925
上传时间：2022-10-28
格式：DOCX
页数：16
大小：34.22KB

《聚类分析及判别分析实验报告范例文档格式.docx》由会员分享，可在线阅读，更多相关《聚类分析及判别分析实验报告范例文档格式.docx（16页珍藏版）》请在冰豆网上搜索。

聚类分析及判别分析实验报告范例文档格式.docx

与国际贸易交流往来

频率咼，经济发展水平较咼，西部地区受到政策的大力扶持,

r"

1-f,、r—1-|—*、、—1-|—*■rr、、、/■—/、、■八、）—r[—,~•-k―,»

、十、，_»

“、、rrri•-

表现出了强劲的增

—、r、宀rr»

r\~-r、」一门、i—r

的水平已经落到了最后。

显然，通过研究不同城市的经济发展状况和经济类型,

指出其发展差异所在，可以为政府在出台相关政策来平衡区域经济发展，缩小不同地区人民生活水平的差异提供一定的指导意见，也为我们深刻理解相关政策提供了扎实的基础。

2，相关统计基础理论

2.1,聚类分析

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。

聚类分析的目标就是在相似的基础上收集数据来分类。

从统计学的观点看，聚类分析是通过数据建模简化数据的一种法。

传统的统计聚类分析法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。

采用k-均值、k-中心点等算法的聚类分析工具已被加入到多著名的统计分析软件包中，如SPSSSAS等。

本文使用统计软件SPSS对所收集的数据进行快速聚类，其特点是：

在确定类别数量基础上，先给定一个粗糙的初始分类，然后按照某种原则进行反复修改,直至分类较为合理。

在选定类中心作为凝聚点的基础上进行分类和修正的法有很多，本文使用的是K-Means算法。

K-Means算法接受输入量k；

然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足：

同一聚类中的对象相似度较高；

而不同聚类中的对象相似度较小。

聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。

K-Means算法的工作过程说明如下：

首先从n个数据对象任意选择k个对象作为初始聚类中心；

而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；

然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；

不断重复这

一过程直到标准测度函数开始收敛为止。

一般都采用均差作为标准测度函数。

一般而言，k个聚类具有以下特点：

各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

2.2，判别分析

判别分析是市场研究的重要分析技术，也是多变量分析技术。

它可以就一定数量的个体的一个分类变量和相应的其它多元变量的已知信息，确定分类变量与

其它多元变量之间的数量关系，建立判别函数，并利用判别函数构建Biplot二

元判别图（概念图）。

同时，利用这一数量关系对其他已知多元变量的信息、但未知分组的子类型的个体进行判别分组。

判别分析属于监督类分析法，例如：

市场细分研究中，常涉及判别个体所属类型的问题，也常涉及不同品牌在一组产品属性之间的消费者偏好和认知概念，判别分析可以很好地对这种差异进行鉴别。

并在低维度空间表现这种差异。

判别分析主要有距离判别、贝叶斯（Bayes）判别、费舍尔（Fisher）判别等几种常用法。

距离判别的基本原理是：

首先对样本到总体G之间的距离进行合理规定,

然后依照“就近”原则判定样本的归属，常用马氏距离（Mahalanobis）规定为:

d2（x,G）（xu）'

1（xu）

式中为p元总体G的协差阵，x是取自G的样品，则该式即为样品x到总体G的马氏距离。

贝叶斯判别既考虑了先验分布产生的影响，也考虑到误判损失产生的影响，是衡量一个判别优劣的比较合理的准则。

费舍尔判别的基本思想与主成分分析十分相似，当总体是高维向量时，先把

其综合成一个一维变量，然后在对一维变量进行距离判别，费舍尔判别实际上是一种降维处理，降维压缩后，样品y到各个总体Gj*的距离可以用欧式距离度量，即：

m

2**22

d（y,Gj）||yUjII（ai'

xa,Uj）

i1

由此导出Fisher判别规则为：

d（y,Gj）minkd（y,Gj），则xGi

1jk

本文及使用Fisher判别建立线性判别函数进行距离判别。

3，模型建立

3.1设置变量

本文综合考虑了评价城市发展指数衡量因素，选取衡量一个城市经济发展水平的主要因素，城市化进程总是伴随着工业化发展，发达的服务业水平是衡量现代新兴城市的主要指标，此外，综合考虑了固定资产投资总额与社会消费品零售总额以及货物进出口总额作为类别分析的主要经济指标：

X1：

城市第二产业产值（亿元）

X2:

城市第三产业产值（亿元）

X3:

城市固定资产投资总额（亿元）

X4:

城市社会消费品零售总额（亿元）

X5:

货物进出口总额（亿元）

从区域发展角度从上面5个经济指标将城市经济发展水平划分为三大类：

G1:

发达城市

G2:

中度发达城市

G3:

欠发达城市

3.2数据收集和整理

本文所有数据来源于《中国统计年鉴（2012）»

，选取2011年度36个城市主要经济发展水平做模型建立及分析。

其中前32个城市相关经济指标水平作为初始样本用于划分类别，建立类别总体G;

最后四个城市（、、、）及其相关经济发展水平用作待判样品，利用判别函数进行判别分析。

所有相关数据经过量纲统一规则化处理见表1所示。

表1我国部分城市相关经济发展水平（2011年）

第二产业

第三产业

固定资产投资

社会消费品零售

货物进出口总

丿丁号

城市

（亿元）

总额（亿元）

额（亿元）

1

北京

3752.5

12363.2

5851.5201

6900.3246

23374.9884

2

天津

5928.3

5219.2

7483.6973

3395.06

6203.4642

3

家庄

2031.9

1635.8

3026.9778

1662.9864

850.1112

4

太原

949.2

1097.1

1024.1444

973.2937

513.6306

5

呼和浩特

790.0

1277.8

1031.6781

890.0478

121.4736

6

阳

3026.9

2609.8

4577.094

2426.8655

637.215

7

大连

3204.2

2550.7

4580.0585

1924.794

3630.5874

8

长春

2092.7

1620.2

2356.6189

1515.8537

1040.9322

9

哈尔滨

1647.2

2147.8

3011.971

2070.4129

307.0548

10

上海

7927.9

11142.9

5064.2624

6814.8

26246.151

11

南京

2760.8

3220.4

3757.2517

2697.0997

3440.6358

12

宁波

3349.5

2454.5

2385.5072

2018.8617

5891.2092

13

合肥

2002.2

1426.2

3376.9652

1111.1188

1207.719

14

福州

1711.2

1700.1

2720.2827

1947.8102

2083.4856

15

厦门

1297.1

1217.5

1128.0872

800.2779

4210.0002

16

南昌

1579.3

974.7

2022.3297

928.3438

473.0226

17

济南

1829.0

2339.5

1934.3389

2114.2868

624.123

18

青岛

3150.7

3158.5

3502.5382

2302.3703

4329.1302

19

州

2874.2

1974.0

3002.5

1987.1147

959.7354

20

武汉

3254.0

3309.5

4255.1621

3031.7885

1367.3748

21

长沙

3151.7

2224.3

3510.2425

2201.6112

449.3604

22

广州

4577.0

7641.9

3412.2

5243

6970.26

23

深圳

5343.3

6155.7

2136.3882

3520.8736

24845.982

24

海口

177.9

487.7

395.0408

387.1804

236.1756

25

重庆

5543.0

3623.8

7579.4454

3487.807

1753.0716

26

成都

3143.8

3383.4

4944.0157

2861.2835

2274.3798

27

贵阳

586.8

733.7

1600.5898

584.3292

392.9796

28

拉萨

75.2

137.2

220.5031

102.5948

78.4452

29

西安

1697.2

1993.9

3352.12

1965.9774

754.74

30

兰州

656.5

663.5

950.5758

639.7231

112.7658

31

西宁

411.3

332.0

528.

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 聚类分析判别分析实验报告范例

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：聚类分析及判别分析实验报告范例文档格式.docx
链接地址：https://www.bdocx.com/doc/15233925.html

聚类分析及判别分析实验报告范例文档格式.docx

热门标签