应用多元统计分析实验报告Word文档下载推荐.docx
- 文档编号:13083552
- 上传时间:2022-10-04
- 格式:DOCX
- 页数:53
- 大小:524.45KB
应用多元统计分析实验报告Word文档下载推荐.docx
《应用多元统计分析实验报告Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析实验报告Word文档下载推荐.docx(53页珍藏版)》请在冰豆网上搜索。
27000
18750
12000
21000
144
36
381
190
138
26
设职工总体的以上变量服从多元正态分布,根据样本资料利用SPSS软件求出均值向量和协方差矩阵的最大似然估计。
注1:
最大似然估计公式为:
,;
一.SPSS操作步骤:
第一步:
利用spss建立数据集
第二步:
分析--描述统计--描述计算样本均值向量
第三步:
分析--相关--双变量计算样本协方差阵与样本相关系数
二.输出结果:
描述性统计量
均值
标准差
N
29650.00
18763.475
12.33
3.615
37125.00
46827.276
152.50
129.210
相关性
Pearson相关性
.184
-.126
.042
显著性(双侧)
.727
.812
.937
平方与叉积的和
.000
62500.000
-.000
协方差
12500.000
-.510
-.077
.302
.885
65.333
-179.000
13.067
-86250.000
-35.800
.114
.829
83475.500
16695.100
三.实验结果分析:
样本均值为
样本的协方差
如此就可以按照极大似然估计方程:
,
得出均值向量与协方差向量的最大似然估计结果。
第三章聚类分析
3.1下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法利用SPSS软件分别对这些公司进行聚类,并对结果进行比较分析。
公司
编号
净资产收益率
每股净利润
总资产周转率
资产负债率
流动负债比率
每股净资产
净利润增长率
总资产增长率
11.09
0.21
0.05
96.98
70.53
1.86
-44.04
81.99
11.96
0.59
0.74
51.78
90.73
4.95
7.02
16.11
0.03
181.99
100
-2.98
103.33
21.18
11.58
0.13
0.17
46.07
92.18
1.14
6.55
-56.32
-6.19
-0.09
43.3
82.24
1.52
-1713.5
-3.36
10
0.47
0.48
68.4
86
4.7
-11.56
0.85
7
10.49
0.11
0.35
82.98
99.87
1.02
100.23
30.32
11.12
-1.69
0.12
132.14
-0.66
-4454.39
-62.75
9
3.41
0.04
0.2
67.86
98.51
1.25
-11.25
-11.43
1.16
0.01
0.54
43.7
1.03
-87.18
-7.41
11
30.22
0.16
0.4
87.36
94.88
0.53
729.41
-9.97
8.19
0.22
0.38
30.31
2.73
-12.31
-2.77
13
95.79
-5.2
0.5
252.34
99.34
-5.42
-9816.52
-46.82
14
16.55
0.93
72.31
84.05
2.14
115.95
123.41
-24.18
-1.16
0.79
56.26
97.8
4.81
-533.89
-27.74
一、实验原理:
1.系统聚类的基本思想是:
首先,每个样品(或变量)先聚成一类,然后,选择距离公式计算类与类之间的距离,把距离相近的样品(或变量)先聚成类,距离相远的后聚成类,该过程一直进行下去,每个样品(或变量)总能聚到合适的类中,最后,所有的样品(或变量)聚成一类。
打开SPSS软件,在数据窗口依次定义变量,并输入以上数据。
2.K-均值聚类法:
K-均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的,但是两者的不同之处也是明显的:
系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。
具体类数的确定,离不开实践经验的积累;
有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
二.SPSS操作步骤:
(一)系统聚类基本操作步骤如下:
1.点击分析——分类——系统聚类,进入系统聚类对话框。
2.将净资产收益率、每股净利润、总资产周转率、资产负债率、流动负债比率、每股净资产、净利润增长率、总资产增长率8个变量选入变量框中,将公司编号选入标注个案框中。
输出框中保持默认选项,选中统计量和图。
3.统计量部分保持默认选项,点击继续按钮;
点击绘制按钮,进入系统聚类-绘制对话框,选中树状图,其他部分保持默认,点击继续按钮;
点击方法按钮,进入聚类分析-方法对话框,转换值框中标准化选择Z得分,其他部分保持默认选项,点击继续按钮;
保存部分保持默认选项,点击继续按钮。
4.最后点击确定按钮,得系统聚类结果。
(二)K-均值法基本操作步骤如下:
1.点击分析——分类——K-均值聚类,进入K-均值聚类对话框。
根据系统聚类的结果,聚类数改为3,其他部分保持默认选项。
3.迭代部分保持默认选项,点击继续按钮;
点击保存按钮,选中聚类成员、与聚类中心的距离,点击继续按钮;
选项部分中保持默认选项,点击继续。
4.最后点击确定按钮,得K-均值聚类结果。
三.输出结果:
系统聚类法:
表1案例处理汇总a,b
案例
有效
缺失
总计
百分比
100.0
.0
a.平方Euclidean距离已使用
b.平均联结(组之间)
表2聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
363.280
1189.697
1492.532
3976.328
7995.874
9315.360
13588.434
28034.879
.989
.326
.861
K均值法:
表3初始聚类中心
聚类
-5.20
.16
.50
.12
.40
流动负债率
100.00
-.66
.53
表4迭代历史记录a
迭代
聚类中心内的更改
834.134
a.由于聚类中心内没有改动或改动较小而达到收敛。
任何中心的最大绝对坐标更改为.000。
当前迭代为2。
初始中心间的最小距离为5184.300。
表5最终聚类中心
6.48
.08
.39
71.48
92.06
1.90
-103.94
11.91
表6每个聚类中的案例数
1.000
13.000
15.000
四,实验结果分析:
(一)系统聚类法:
表2聚类表是对每一阶段聚类结果的反应。
图1冰状图,图2树状图,是反应样品聚类情况的图,从图中可以由分类个数得到分类情况。
如果选择分为2类,分类结果为:
13号公司单独一类,1-12号公司为一类;
如果选择分为3类,分类结果为:
{13}、{1、14}、{2、3、4、5、6、7、8、9、10、11、12、15}。
由表中数据可以发现,13号公司资产负债率最高,净利润增长率最低,1号和14号公司的主要财务指标都比较好,可以认为系统聚类根据经营情况对公司进行分类的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 实验 报告