《多元统计分析》第三版例题习题数.docx
- 文档编号:4688605
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:64
- 大小:643.39KB
《多元统计分析》第三版例题习题数.docx
《《多元统计分析》第三版例题习题数.docx》由会员分享,可在线阅读,更多相关《《多元统计分析》第三版例题习题数.docx(64页珍藏版)》请在冰豆网上搜索。
《多元统计分析》第三版例题习题数
何晓群《多元统计分析》第三版(2012)数据下载
第2章
[例2-1]1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。
其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:
净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。
下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。
表2-1
行业
公司简称
股票代码
净资产收益率
总资产报酬率
资产负债率
总资产周转率
流动资产周转率
已获利息倍数
销售增长率
资本积累率
电力、煤气及水的生产和供应业
深圳能源
000027
9.17
4.92
53.45
.39
1.57
3.56
2.76
33.00
深南电A
000037
.61
1.23
61.17
.60
1.74
1.41
-12.81
-.01
富龙热电
000426
-11.30
-5.56
48.89
.13
.76
-.34
-40.10
-9.93
穗恒运A
000531
-7.70
-1.53
70.25
.57
2.70
.61
-29.45
-7.15
粤电力A
000539
.34
-1.15
54.84
.48
2.42
.52
11.78
-7.72
韶能股份
000601
-2.95
-1.29
61.79
.27
2.52
.53
15.77
-4.67
ST惠天
000692
-1.86
-.81
63.34
.40
1.09
.43
8.08
-1.82
城投控股
600649
12.28
8.46
39.92
.25
.57
40.20
29.21
-2.19
大连热电
600719
1.58
.96
60.53
.32
.70
1.31
-3.44
.75
华电能源
600726
.43
.33
77.63
.40
2.39
1.08
12.66
-6.04
国电电力
600795
1.26
.20
71.65
.26
1.68
1.10
-5.88
5.68
房地行业
长春经开
600215
.09
.21
29.10
.05
.08
1.23
9.07
.09
大龙地产
600159
1.21
.09
61.63
.04
.05
1.84
-57.90
-.08
金丰投资
600606
9.78
6.51
46.07
.20
.31
6.22
-51.99
-8.40
新黄浦
600638
6.81
5.96
31.91
.12
.31
5.57
-18.48
4.99
浦东金桥
600639
9.02
6.16
42.74
.20
.86
4.51
40.62
4.75
外高桥
600648
6.90
2.09
78.11
.70
2.47
7.04
19.88
5.21
中华企业
600675
14.31
6.82
63.67
.37
.44
5.89
33.93
11.82
渝开发A
000514
6.53
5.14
31.61
.14
.40
4.42
-15.56
6.64
莱茵置业
000558
21.22
7.95
73.67
.44
.52
1.04
-13.15
28.42
粤宏远A
000573
-8.47
-4.84
44.12
.14
.24
-3.90
-26.72
-7.81
中国国贸
600007
8.40
6.21
48.06
.12
3.04
1.10
1.20
5.06
万科A
000002
12.65
5.77
67.44
.37
.39
10.62
15.38
8.93
三木集团
000632
1.96
1.05
80.12
.88
.95
1.74
-11.30
-9.55
国兴地产
000838
2.97
2.21
44.34
.17
.17
30.65
-74.76
3.06
中关村
000931
9.69
1.72
80.11
.47
.57
2.03
-7.90
1.59
信息技术业
中兴通讯
000063
11.65
5.02
70.15
.98
1.21
4.28
27.36
17.40
长城电脑
000066
1.01
.39
53.93
1.35
3.57
1.22
-6.99
-30.87
南天信息
000948
9.48
6.61
45.43
1.06
1.41
4.62
15.13
110.72
同方股份
600100
3.57
2.63
53.32
.78
.00
2.79
-4.77
26.72
永鼎股份
600105
2.54
1.69
71.91
.42
.63
1.87
27.49
2.63
宏图高科
600122
10.71
5.42
57.49
1.77
2.12
3.21
33.03
11.23
新大陆
000997
4.54
3.74
31.88
.86
1.09
7.49
18.42
-6.27
方正科技
600601
4.42
3.16
43.95
1.40
4.67
3.06
-13.58
4.73
复旦复华
600624
4.44
3.68
49.44
.53
.85
3.19
13.57
2.60
习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。
选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。
验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。
边远及少数民族聚居区的社会经济水平发展的指标数据:
地区
人均GDP
三产比重
人均消费
人口增长
文盲半文盲
内蒙古
5068
31.1
2141
8.23
15,83
广西
4076
34.2
2040
9.01
13.32
贵州
2342
29.8
1551
14.26
28.98
云南
4355
31.1
2059
12.1
25.48
西藏
3716
43.5
1551
15.9
57.97
宁夏
4270
37.3
1947
13.08
25.56
新疆
6229
35.4
2745
12.81
11.44
甘肃
3456
32.8
1612
10..04
28.65
青海
4367
40.9
2047
14.48
42.92
数据来源:
《中国统计年鉴》(1998)。
5项指标的全国平均水平
μ0=(6212.0132.8729729.515.78)/
第3章
例3-1若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。
在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。
若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。
表3-1某市2001年城镇居民户主个人收入数据
X1职工标准工资收入X5单位得到的其他收入
X2职工奖金收入X6其他收入
X3职工津贴收入X7性别
X4其他工资性收入X8就业身份
X1
X2
X3
X4
X5
X6
X7
X8
540.00
0.0
0.0
0.0
0.0
6.00
男
国有
1137.00
125.00
96.00
0.0
109.00
812.00
女
集体
1236.00
300.00
270.00
0.0
102.00
318.00
女
国有
1008.00
0.0
96.00
0.0
86.0
246.00
男
集体
1723.00
419.00
400.00
0.0
122.00
312.00
男
国有
1080.00
569.00
147.00
156.00
210.00
318.00
男
集体
1326.00
0.0
300.00
0.0
148.00
312.00
女
国有
1110.00
110.00
96.00
0.0
80.00
193.00
女
集体
1012.00
88.00
298.00
0.0
79.00
278.00
女
国有
1209.00
102.00
179.00
67.00
198.00
514.00
男
集体
1101.00
215.00
201.00
39.00
146.00
477.00
男
集体
例3-3
English
Norwegian
Danish
Dutch
German
French
One
En
en
een
ein
un
Two
To
to
twee
zwei
deux
Three
Tre
tre
drie
drei
trois
Four
Fire
fire
vier
vier
quatre
Five
Fem
fem
vijf
funf
einq
Six
Seks
seks
zes
sechs
six
seven
Sju
syv
zeven
siebcn
sept
Eight
Ate
otte
acht
acht
huit
Nine
Ni
ni
negen
neun
neuf
Ten
Ti
ti
tien
zehn
dix
Spanish
Italian
Polish
Hungarian
Finnish
Uno
uno
jeden
egy
yksi
Dos
due
dwa
ketto
kaksi
Tres
tre
trzy
harom
kolme
cuatro
quattro
cztery
negy
neua
Cinco
cinque
piec
ot
viisi
Seix
sei
szesc
hat
kuusi
Siete
sette
siedem
het
seitseman
Ocho
otto
osiem
nyolc
kahdeksau
nueve
nove
dziewiec
kilenc
yhdeksan
Diez
dieci
dziesiec
tiz
kymmenen
例3-4
X1食品支出(元/人)X5交通和通讯支出(元/人)
X2衣着支出(元/人)X6娱乐、教育和文化服务支出(元/人)
X3家庭设备、用品及服务支出(元/人)X7居住支出(元/人)
X4医疗保健支出(元/人)X8杂项商品和服务支出(元/人)
X1
X2
X3
X4
X5
X6
X7
X8
辽宁
1772.14
568.25
298.66
352.20
307.21
490.83
364.28
202.50
浙江
2752.25
569.95
662.31
541.06
623.05
917.23
599.98
354.39
河南
1386.76
460.99
312.97
280.78
246.24
407.26
547.19
188.52
甘肃
1552.77
517.16
402.03
272.44
265.29
563.10
302.27
251.41
青海
1711.03
458.57
334.91
307.24
297.72
495.34
274.48
306.45
例3-5
x1人均粮食支出(元/人)x5人均衣着支出(元/人)
x2人均副食支出(元/人)x6人均日用杂品支出(元/人)
x3人均烟、酒、饮料支出(元/人)x7人均水电燃料支出(元/人)
x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)
x1
x2
x3
x4
x5
x6
x7
x8
北京
21.30
124.89
35.43
73.98
93.01
20.58
43.97
433.73
天津
21.50
122.39
29.08
51.64
55.04
11.30
54.88
288.13
河北
18.25
90.21
24.45
32.44
62.48
7.45
47.50
178.84
山西
21.84
66.38
18.05
31.32
74.48
8.19
34.97
177.45
内蒙古
21.37
67.08
20.28
35.27
81.07
10.94
39.46
182.20
辽宁
22.74
115.88
28.21
42.44
58.07
9.63
48.65
194.85
吉林
20.22
88.94
18.54
35.63
65.72
8.81
50.29
186.52
黑龙江
21.33
75.50
14.00
29.56
69.29
8.24
42.08
165.90
上海
21.13
168.69
40.81
70.12
74.32
15.46
50.90
422.74
江苏
18.61
122.51
27.07
42.50
63.47
15.38
36.14
240.92
浙江
19.96
142.24
43.33
50.74
101.77
12.92
53.44
394.55
安徽
19.61
107.13
32.85
35.77
61.34
7.53
34.60
142.23
福建
25.56
171.65
22.30
40.53
57.13
12.60
54.03
225.08
江西
18.75
104.68
15.55
35.61
51.80
11.18
36.27
142.72
山东
18.27
88.34
19.07
43.19
72.98
12.59
42.16
200.18
河南
19.07
73.18
18.01
29.38
64.51
8.91
38.14
155.45
湖北
18.76
102.67
21.87
30.47
64.33
11.99
42.14
168.17
湖南
20.25
104.45
20.72
38.15
62.98
12.67
39.16
213.56
广东
23.68
173.30
17.43
43.59
53.66
16.86
65.02
385.94
广西
18.70
131.35
11.69
32.06
41.54
10.84
42.77
178.51
海南
16.16
139.92
12.98
23.58
24.87
10.76
32.35
144.21
重庆
18.18
120.39
26.18
37.94
68.16
11.64
38.48
246.37
四川
18.53
109.95
21.49
33.04
50.98
10.88
33.96
183.85
贵州
18.33
92.43
25.38
32.19
56.32
14.00
38.57
144.82
云南
22.30
99.08
33.36
32.01
52.06
7.04
32.85
190.04
西藏
29.67
146.90
64.51
54.36
86.10
14.77
32.19
193.10
陕西
20.03
70.75
19.75
34.95
53.29
10.55
38.20
189.41
甘肃
18.68
72.74
23.72
38.69
62.41
9.65
35.26
170.12
青海
20.33
75.64
20.88
33.86
53.81
10.06
32.82
171.32
宁夏
19.75
70.24
18.67
36.71
61.75
10.08
40.26
165.22
新疆
21.03
78.55
14.35
34.33
64.98
9.83
33.87
161.67
第4章
[例4-1]判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(IrisData)。
鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。
这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。
该数据给出150个鸢尾花的萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)、花瓣宽(petalwidth)以及这些花分别属于的种类(Species)等共五个变量。
萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。
这里三种鸢尾花各有50个观测值。
数据格式如下图所示:
定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolour鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)四个变量作为解释变量。
使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。
分组变量(GroupingVariable)选择y,然后定义
的区域,最小值是1,最大值是3。
解释变量(Independents)选择sepal.length、sepal.width、petal.length和petal.width。
统计量(Statistics)选项中选择描述统计量Means,UnivariateANOVAs和Box’M,函数选择Fisher和非标准化函数,矩阵选择Within-groupscorrelation。
分类(Classify)选项中选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是50种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewiseresults),综合表(SummeryTable)和“留一个在外”(Leave-one-outclassifation)的验证原则,协方差矩阵选择Within-groups,作图选择Combined-groups。
保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。
如果采用逐步判别法,我们还可以选择判别的方法(Method)。
得到分析结果如下:
输出结果4-1
Discriminant
(1)
(2)
(3)
输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。
第1张表反映的是有效样本量及变量缺失的情况。
第2张表是各组变量的描述统计分析。
第3张表是对各组均值是否相等的检验。
由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三组的均值相等的假设,即认为变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三组的均值是有显著性差异的。
输出结果4-2
Box'sTestofEqualityofCovarianceMatrices
(1)
(2)
输出结果4-2是对各组协方差矩阵是否相等的Box’M检验。
第1张表反映协方差矩阵的秩和行列式的对数值。
由行列式值可以看出协方差矩阵不是病态矩阵。
第2张表是对各总体协方差阵是否相等的统计检验。
由
值及其显著水平,我们在0.05的显著性水平下拒绝原假设(原假设假定各总体协方差阵相等)。
因此,在分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著差异。
如果存在显著差异就应该采用Separate-groups协方差矩阵,反之,就用Within-groups协方差矩阵。
输出结果4-3
SummaryofCanonicalDiscriminantFunctions
(1)
(2)
输出结果4-3分析的是典型判别函数。
第1张表反映判别函数的特征值、解释方差的比例和典型相关系数。
第一判别函数解释了99.1%的方差,第二判别函数解释了0.9%的方差,两个判别函数解释了全部方差。
第2张表是对两个判别函数的显著性检验。
由Wilks’Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。
输出结果4-4
(1)
(2)
(3)
(4)
输出结果4-4显示的是判别函数、判别载荷和各组的重心。
第1张表是标准化的判别函数,表示为
,这里
表示标准化变量,标准化变量的系数也就是前面讲的判别权重。
第2张表是结构矩阵,即判别载荷。
由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。
第3张表是非标准化的判别函数,表示为
我们可以根据这个判别函数计算每个观测的判别Z得分。
第4张表是反映判别函数在各
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 第三 例题 习题