应用多元统计分析实验报告.docx
- 文档编号:151832
- 上传时间:2022-10-04
- 格式:DOCX
- 页数:53
- 大小:524.45KB
应用多元统计分析实验报告.docx
《应用多元统计分析实验报告.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析实验报告.docx(53页珍藏版)》请在冰豆网上搜索。
多元统计分析实验报告
学院名称 理学院
专业班级 应用统计学14-2
学生姓名
学号
第一章多元正态分布
1.1从某企业全部职工中随机抽取一容量为6的样本,该样本中个职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示:
职工编号
目前工资
(美元)
受教育年限
(年)
初始工资
(美元)
工作经验
(月)
1
2
3
4
5
6
57000
4200
21450
21900
45000
28350
15
16
12
8
15
8
27000
18750
12000
21000
12000
144
36
381
190
138
26
设职工总体的以上变量服从多元正态分布,根据样本资料利用SPSS软件求出均值向量和协方差矩阵的最大似然估计。
注1:
最大似然估计公式为:
,;
一.SPSS操作步骤:
第一步:
利用spss建立数据集
第二步:
分析--描述统计--描述计算样本均值向量
第三步:
分析--相关--双变量计算样本协方差阵与样本相关系数
二.输出结果:
描述性统计量
均值
标准差
N
目前工资
29650.00
18763.475
6
受教育年限
12.33
3.615
6
初始工资
37125.00
46827.276
6
工作经验
152.50
129.210
6
相关性
目前工资
受教育年限
初始工资
工作经验
目前工资
Pearson相关性
1
.184
-.126
.042
显著性(双侧)
.727
.812
.937
平方与叉积的和
.000
62500.000
-.000
.000
协方差
.000
12500.000
-.000
.000
N
6
6
6
6
受教育年限
Pearson相关性
.184
1
-.510
-.077
显著性(双侧)
.727
.302
.885
平方与叉积的和
62500.000
65.333
-.000
-179.000
协方差
12500.000
13.067
-86250.000
-35.800
N
6
6
6
6
初始工资
Pearson相关性
-.126
-.510
1
.114
显著性(双侧)
.812
.302
.829
平方与叉积的和
-.000
-.000
.000
.000
协方差
-.000
-86250.000
.000
.000
N
6
6
6
6
工作经验
Pearson相关性
.042
-.077
.114
1
显著性(双侧)
.937
.885
.829
平方与叉积的和
.000
-179.000
.000
83475.500
协方差
.000
-35.800
.000
16695.100
N
6
6
6
6
三.实验结果分析:
样本均值为
样本的协方差
如此就可以按照极大似然估计方程:
,
得出均值向量与协方差向量的最大似然估计结果。
第三章聚类分析
3.1下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法利用SPSS软件分别对这些公司进行聚类,并对结果进行比较分析。
公司
编号
净资产收益率
每股净利润
总资产周转率
资产负债率
流动负债比率
每股净资产
净利润增长率
总资产增长率
1
11.09
0.21
0.05
96.98
70.53
1.86
-44.04
81.99
2
11.96
0.59
0.74
51.78
90.73
4.95
7.02
16.11
3
0
0.03
0.03
181.99
100
-2.98
103.33
21.18
4
11.58
0.13
0.17
46.07
92.18
1.14
6.55
-56.32
5
-6.19
-0.09
0.03
43.3
82.24
1.52
-1713.5
-3.36
6
10
0.47
0.48
68.4
86
4.7
-11.56
0.85
7
10.49
0.11
0.35
82.98
99.87
1.02
100.23
30.32
8
11.12
-1.69
0.12
132.14
100
-0.66
-4454.39
-62.75
9
3.41
0.04
0.2
67.86
98.51
1.25
-11.25
-11.43
10
1.16
0.01
0.54
43.7
100
1.03
-87.18
-7.41
11
30.22
0.16
0.4
87.36
94.88
0.53
729.41
-9.97
12
8.19
0.22
0.38
30.31
100
2.73
-12.31
-2.77
13
95.79
-5.2
0.5
252.34
99.34
-5.42
-9816.52
-46.82
14
16.55
0.35
0.93
72.31
84.05
2.14
115.95
123.41
15
-24.18
-1.16
0.79
56.26
97.8
4.81
-533.89
-27.74
一、实验原理:
1.系统聚类的基本思想是:
首先,每个样品(或变量)先聚成一类,然后,选择距离公式计算类与类之间的距离,把距离相近的样品(或变量)先聚成类,距离相远的后聚成类,该过程一直进行下去,每个样品(或变量)总能聚到合适的类中,最后,所有的样品(或变量)聚成一类。
打开SPSS软件,在数据窗口依次定义变量,并输入以上数据。
2.K-均值聚类法:
K-均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的,但是两者的不同之处也是明显的:
系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。
具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
二.SPSS操作步骤:
(一)系统聚类基本操作步骤如下:
1.点击分析——分类——系统聚类,进入系统聚类对话框。
2.将净资产收益率、每股净利润、总资产周转率、资产负债率、流动负债比率、每股净资产、净利润增长率、总资产增长率8个变量选入变量框中,将公司编号选入标注个案框中。
输出框中保持默认选项,选中统计量和图。
3.统计量部分保持默认选项,点击继续按钮;点击绘制按钮,进入系统聚类-绘制对话框,选中树状图,其他部分保持默认,点击继续按钮;点击方法按钮,进入聚类分析-方法对话框,转换值框中标准化选择Z得分,其他部分保持默认选项,点击继续按钮;保存部分保持默认选项,点击继续按钮。
4.最后点击确定按钮,得系统聚类结果。
(二)K-均值法基本操作步骤如下:
1.点击分析——分类——K-均值聚类,进入K-均值聚类对话框。
2.将净资产收益率、每股净利润、总资产周转率、资产负债率、流动负债比率、每股净资产、净利润增长率、总资产增长率8个变量选入变量框中,将公司编号选入标注个案框中。
根据系统聚类的结果,聚类数改为3,其他部分保持默认选项。
3.迭代部分保持默认选项,点击继续按钮;点击保存按钮,选中聚类成员、与聚类中心的距离,点击继续按钮;选项部分中保持默认选项,点击继续。
4.最后点击确定按钮,得K-均值聚类结果。
三.输出结果:
系统聚类法:
表1案例处理汇总a,b
案例
有效
缺失
总计
N
百分比
N
百分比
N
百分比
12
100.0
0
.0
12
100.0
a.平方Euclidean距离已使用
b.平均联结(组之间)
表2聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
6
9
363.280
0
0
2
2
2
6
1189.697
0
1
3
3
2
12
1492.532
2
0
4
4
2
4
3976.328
3
0
5
5
2
10
7995.874
4
0
7
6
7
14
9315.360
0
0
8
7
1
2
13588.434
0
5
8
8
1
7
28034.879
7
6
9
9
1
11
.989
8
0
10
10
1
8
.326
9
0
11
11
1
13
.861
10
0
0
K均值法:
表3初始聚类中心
聚类
1
2
3
净资产收益率
95.79
11.12
30.22
每股净利润
-5.20
-1.69
.16
总资产周转率
.50
.12
.40
资产负债率
252.34
132.14
87.36
流动负债率
99.34
100.00
94.88
每股净资产
-5.42
-.66
.53
净利润增长率
-9816.52
-4454.39
729.41
总资产增长率
-46.82
-62.75
-9.97
表4迭代历史记录a
迭代
聚类中心内的更改
1
2
3
1
.000
.000
834.134
2
.000
.000
.000
a.由于聚类中心内没有改动或改动较小而达到收敛。
任何中心的最大绝对坐标更改为.000。
当前迭代为2。
初始中心间的最小距离为5184.300。
表5最终聚类中心
聚类
1
2
3
净资产收益率
95.79
11.12
6.48
每股净利润
-5.20
-1.69
.08
总资产周转率
.50
.12
.39
资产负债率
252.34
132.14
71.48
流动负债率
99.34
100.00
92.06
每股净资产
-5.42
-.66
1.90
净利润增长率
-9816.52
-4454.39
-103.94
总资产增长率
-46.82
-62.75
11.91
表6每个聚类中的案例数
聚类
1
1.000
2
1.000
3
13.000
有效
15.000
缺失
.000
四,实验结果分析:
(一)系统聚类法:
表2聚类表是对每一阶段聚类结果的反应。
图1冰状图,图2树状图,是反应样品聚类情况的图,从图中可以由分类个数得到分类情况。
如果选择分为2类,分类结果为:
13号公司单独一类,1-12号公司为一类;
如果选择分为3类,分类结果为:
{13}、{1、14}、{2、3、4、5、6、7、8、9、10、11、12、15}。
由表中数据可以发现,13号公司资产负债率最高,净利润增长率最低,1号和14号公司的主要财务指标都比较好,可以认为系统聚类根据经营情况对公司进行分类的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 实验 报告
![提示](https://static.bdocx.com/images/bang_tan.gif)