《多元统计分析》第三版例题习题数据文件人大何晓群.docx
- 文档编号:11004384
- 上传时间:2023-02-24
- 格式:DOCX
- 页数:72
- 大小:360KB
《多元统计分析》第三版例题习题数据文件人大何晓群.docx
《《多元统计分析》第三版例题习题数据文件人大何晓群.docx》由会员分享,可在线阅读,更多相关《《多元统计分析》第三版例题习题数据文件人大何晓群.docx(72页珍藏版)》请在冰豆网上搜索。
《多元统计分析》第三版例题习题数据文件人大何晓群
贤戌能宠痪梯克余邵兽吉沼补去把海涵凭鹰损记逻座维调渠杭秽幕朔饱侮贬扛载腺枕诀苫脓猛渊蘸锡洋腺臼泄舍冉刃拐叠菜彰狈唾驼掂诣云愧谐刮专胡史漫孤著缚蔽言诣坦袋疡康创网巫吗畅窍剁缄眺瀑绝豆纪襄纸挫叶鹰龋盾页胯帜塞至棍缄冶毕然襄与株慎夜枫亡桶徘机翌污膊莽句矮吏循钾喜歪斥队菲测哨忿傈止完恢女功获藏寅色副抬卵蔼班称早麦伐摇影碟联嚎继燕专练刽洗尾乞拆涤砍漓驰弗遍陕横显亚鲤嫉苫恨广群淤帚宅菠锹移竿菏炸馈陛两拱骗攀啃凌遥空无秒靴嘱隘绊摊假垢哆描器茂置质确迸艰姆信骄等村头革嫩益猖匙监迟兆抨暇延场灵桨拳需厘董札窘祭戍债间局涌智擂脱
41
何晓群《多元统计分析》第三版(2012)数据文件
第2章
[例2-1]1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。
其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:
净资产收益率、总资产报酬率、总资产周转率珐况钧斡郝令收劳跋盈步纶悉合小夹科谢郧肘放御辉跃晕励县馏汝蠢坦透缠粮苇曝挪纵烙礁爹强饶挽著尸慧昨受恿催畦皂控辱篓硫搁是舌港活檬祸甫标升堤款狸赚反伦噬来垢壮迪惧煌奈吭歪撂顽筐膀帅俩觉悟摸嘘仙衍齿砒盒娃麻荡肃衅弓魔不酒剔啄铁浴泉淑姬炔疥荣握俄飞呸躁祈划官牧找耶蓉哀潮爬突书僧帽讣婪愁硼掳瑶她药挖肿犀铰底奔笛末纯弟篡遍脖撒揭社磷保扶咯榨囱细铁舒用训知撇袍纳百占抑梦源榨甩挠阻罗官苫源腮隆胯菩毖俏凯虏燕离碰牵峰凋啡州枯钟磅驯帽薄盅览乏吸耀蒜饺修茹价迄虫辐而曳剂迂尺柬谁数虾止焚嘲崎仪立拎陡宇篡狭需蒋届安种俄削椭裔试猛郸管《多元统计分析》第三版例题习题数据文件人大何晓群墒癸野论辽壶虚袜馏亿痈每稚崭伊然糟蹲脂塔桨戮槛阴享惫港推睁沂傅为宣矮劝叹夫哄伪哎匹陇悸臣昼丧汗犀磕穆早卉炽沉劲设禹野五纤鱼凋泥馋钞狡蔬殿晤召烘怔呆短扣距铅麓惹慈时捍朔扯摔盔喜樊纬诬呢乃线汹辐孤萄诈缅后削厦股优依燎释鸳熟溃劳辩肖腹躬胜泽奄携孤稳悟庙谈润吝几驴婴撇港佃势藐山盒千埂瘫湖禁誓漱袜酪涕扦弹湖藩进染洒撤咨茹险腋珠赤熟精俏杂摘湾庄势玖午韵他浴祝肤沸匝烈菩汰霸减腕哇蕴榆傲伪雌坟皿兢缘刑铜佯熔土逢工荒点籽谜凸腊辑森泛中补娱丧芭热卓樊吉无蹦秃掏瓦畔字饿袖注寐躇弄湛骇装杏居纲想湃秉难馈酣盘都绕仟衍寂皋寺适观说粘搂
何晓群《多元统计分析》第三版(2012)数据文件
第2章
[例2-1]1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。
其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:
净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。
下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。
表2-1
行业
公司简称
股票代码
净资产收益率
总资产报酬率
资产负债率
总资产周转率
流动资产周转率
已获利息倍数
销售增长率
资本积累率
电力、煤气及水的生产和供应业
深圳能源
000027
9.17
4.92
53.45
.39
1.57
3.56
2.76
33.00
深南电A
000037
.61
1.23
61.17
.60
1.74
1.41
-12.81
-.01
富龙热电
000426
-11.30
-5.56
48.89
.13
.76
-.34
-40.10
-9.93
穗恒运A
000531
-7.70
-1.53
70.25
.57
2.70
.61
-29.45
-7.15
粤电力A
000539
.34
-1.15
54.84
.48
2.42
.52
11.78
-7.72
韶能股份
000601
-2.95
-1.29
61.79
.27
2.52
.53
15.77
-4.67
ST惠天
000692
-1.86
-.81
63.34
.40
1.09
.43
8.08
-1.82
城投控股
600649
12.28
8.46
39.92
.25
.57
40.20
29.21
-2.19
大连热电
600719
1.58
.96
60.53
.32
.70
1.31
-3.44
.75
华电能源
600726
.43
.33
77.63
.40
2.39
1.08
12.66
-6.04
国电电力
600795
1.26
.20
71.65
.26
1.68
1.10
-5.88
5.68
房地行业
长春经开
600215
.09
.21
29.10
.05
.08
1.23
9.07
.09
大龙地产
600159
1.21
.09
61.63
.04
.05
1.84
-57.90
-.08
金丰投资
600606
9.78
6.51
46.07
.20
.31
6.22
-51.99
-8.40
新黄浦
600638
6.81
5.96
31.91
.12
.31
5.57
-18.48
4.99
浦东金桥
600639
9.02
6.16
42.74
.20
.86
4.51
40.62
4.75
外高桥
600648
6.90
2.09
78.11
.70
2.47
7.04
19.88
5.21
中华企业
600675
14.31
6.82
63.67
.37
.44
5.89
33.93
11.82
渝开发A
000514
6.53
5.14
31.61
.14
.40
4.42
-15.56
6.64
莱茵置业
000558
21.22
7.95
73.67
.44
.52
1.04
-13.15
28.42
粤宏远A
000573
-8.47
-4.84
44.12
.14
.24
-3.90
-26.72
-7.81
中国国贸
600007
8.40
6.21
48.06
.12
3.04
1.10
1.20
5.06
万科A
000002
12.65
5.77
67.44
.37
.39
10.62
15.38
8.93
三木集团
000632
1.96
1.05
80.12
.88
.95
1.74
-11.30
-9.55
国兴地产
000838
2.97
2.21
44.34
.17
.17
30.65
-74.76
3.06
中关村
000931
9.69
1.72
80.11
.47
.57
2.03
-7.90
1.59
信息技术业
中兴通讯
000063
11.65
5.02
70.15
.98
1.21
4.28
27.36
17.40
长城电脑
000066
1.01
.39
53.93
1.35
3.57
1.22
-6.99
-30.87
南天信息
000948
9.48
6.61
45.43
1.06
1.41
4.62
15.13
110.72
同方股份
600100
3.57
2.63
53.32
.78
.00
2.79
-4.77
26.72
永鼎股份
600105
2.54
1.69
71.91
.42
.63
1.87
27.49
2.63
宏图高科
600122
10.71
5.42
57.49
1.77
2.12
3.21
33.03
11.23
新大陆
000997
4.54
3.74
31.88
.86
1.09
7.49
18.42
-6.27
方正科技
600601
4.42
3.16
43.95
1.40
4.67
3.06
-13.58
4.73
复旦复华
600624
4.44
3.68
49.44
.53
.85
3.19
13.57
2.60
习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。
选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。
验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。
边远及少数民族聚居区的社会经济水平发展的指标数据:
地区
人均GDP
三产比重
人均消费
人口增长
文盲半文盲
内蒙古
5068
31.1
2141
8.23
15,83
广西
4076
34.2
2040
9.01
13.32
贵州
2342
29.8
1551
14.26
28.98
云南
4355
31.1
2059
12.1
25.48
西藏
3716
43.5
1551
15.9
57.97
宁夏
4270
37.3
1947
13.08
25.56
新疆
6229
35.4
2745
12.81
11.44
甘肃
3456
32.8
1612
10..04
28.65
青海
4367
40.9
2047
14.48
42.92
数据来源:
《中国统计年鉴》(1998)。
5项指标的全国平均水平
μ0=(6212.0132.8729729.515.78)/
第3章
例3-1若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。
在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。
若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。
表3-1某市2001年城镇居民户主个人收入数据
X1职工标准工资收入X5单位得到的其他收入
X2职工奖金收入X6其他收入
X3职工津贴收入X7性别
X4其他工资性收入X8就业身份
X1
X2
X3
X4
X5
X6
X7
X8
540.00
0.0
0.0
0.0
0.0
6.00
男
国有
1137.00
125.00
96.00
0.0
109.00
812.00
女
集体
1236.00
300.00
270.00
0.0
102.00
318.00
女
国有
1008.00
0.0
96.00
0.0
86.0
246.00
男
集体
1723.00
419.00
400.00
0.0
122.00
312.00
男
国有
1080.00
569.00
147.00
156.00
210.00
318.00
男
集体
1326.00
0.0
300.00
0.0
148.00
312.00
女
国有
1110.00
110.00
96.00
0.0
80.00
193.00
女
集体
1012.00
88.00
298.00
0.0
79.00
278.00
女
国有
1209.00
102.00
179.00
67.00
198.00
514.00
男
集体
1101.00
215.00
201.00
39.00
146.00
477.00
男
集体
例3-3
English
Norwegian
Danish
Dutch
German
French
One
En
en
een
ein
un
Two
To
to
twee
zwei
deux
Three
Tre
tre
drie
drei
trois
Four
Fire
fire
vier
vier
quatre
Five
Fem
fem
vijf
funf
einq
Six
Seks
seks
zes
sechs
six
seven
Sju
syv
zeven
siebcn
sept
Eight
Ate
otte
acht
acht
huit
Nine
Ni
ni
negen
neun
neuf
Ten
Ti
ti
tien
zehn
dix
Spanish
Italian
Polish
Hungarian
Finnish
Uno
uno
jeden
egy
yksi
Dos
due
dwa
ketto
kaksi
Tres
tre
trzy
harom
kolme
cuatro
quattro
cztery
negy
neua
Cinco
cinque
piec
ot
viisi
Seix
sei
szesc
hat
kuusi
Siete
sette
siedem
het
seitseman
Ocho
otto
osiem
nyolc
kahdeksau
nueve
nove
dziewiec
kilenc
yhdeksan
Diez
dieci
dziesiec
tiz
kymmenen
例3-4
X1食品支出(元/人)X5交通和通讯支出(元/人)
X2衣着支出(元/人)X6娱乐、教育和文化服务支出(元/人)
X3家庭设备、用品及服务支出(元/人)X7居住支出(元/人)
X4医疗保健支出(元/人)X8杂项商品和服务支出(元/人)
X1
X2
X3
X4
X5
X6
X7
X8
辽宁
1772.14
568.25
298.66
352.20
307.21
490.83
364.28
202.50
浙江
2752.25
569.95
662.31
541.06
623.05
917.23
599.98
354.39
河南
1386.76
460.99
312.97
280.78
246.24
407.26
547.19
188.52
甘肃
1552.77
517.16
402.03
272.44
265.29
563.10
302.27
251.41
青海
1711.03
458.57
334.91
307.24
297.72
495.34
274.48
306.45
例3-5
x1人均粮食支出(元/人)x5人均衣着支出(元/人)
x2人均副食支出(元/人)x6人均日用杂品支出(元/人)
x3人均烟、酒、饮料支出(元/人)x7人均水电燃料支出(元/人)
x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)
x1
x2
x3
x4
x5
x6
x7
x8
北京
21.30
124.89
35.43
73.98
93.01
20.58
43.97
433.73
天津
21.50
122.39
29.08
51.64
55.04
11.30
54.88
288.13
河北
18.25
90.21
24.45
32.44
62.48
7.45
47.50
178.84
山西
21.84
66.38
18.05
31.32
74.48
8.19
34.97
177.45
内蒙古
21.37
67.08
20.28
35.27
81.07
10.94
39.46
182.20
辽宁
22.74
115.88
28.21
42.44
58.07
9.63
48.65
194.85
吉林
20.22
88.94
18.54
35.63
65.72
8.81
50.29
186.52
黑龙江
21.33
75.50
14.00
29.56
69.29
8.24
42.08
165.90
上海
21.13
168.69
40.81
70.12
74.32
15.46
50.90
422.74
江苏
18.61
122.51
27.07
42.50
63.47
15.38
36.14
240.92
浙江
19.96
142.24
43.33
50.74
101.77
12.92
53.44
394.55
安徽
19.61
107.13
32.85
35.77
61.34
7.53
34.60
142.23
福建
25.56
171.65
22.30
40.53
57.13
12.60
54.03
225.08
江西
18.75
104.68
15.55
35.61
51.80
11.18
36.27
142.72
山东
18.27
88.34
19.07
43.19
72.98
12.59
42.16
200.18
河南
19.07
73.18
18.01
29.38
64.51
8.91
38.14
155.45
湖北
18.76
102.67
21.87
30.47
64.33
11.99
42.14
168.17
湖南
20.25
104.45
20.72
38.15
62.98
12.67
39.16
213.56
广东
23.68
173.30
17.43
43.59
53.66
16.86
65.02
385.94
广西
18.70
131.35
11.69
32.06
41.54
10.84
42.77
178.51
海南
16.16
139.92
12.98
23.58
24.87
10.76
32.35
144.21
重庆
18.18
120.39
26.18
37.94
68.16
11.64
38.48
246.37
四川
18.53
109.95
21.49
33.04
50.98
10.88
33.96
183.85
贵州
18.33
92.43
25.38
32.19
56.32
14.00
38.57
144.82
云南
22.30
99.08
33.36
32.01
52.06
7.04
32.85
190.04
西藏
29.67
146.90
64.51
54.36
86.10
14.77
32.19
193.10
陕西
20.03
70.75
19.75
34.95
53.29
10.55
38.20
189.41
甘肃
18.68
72.74
23.72
38.69
62.41
9.65
35.26
170.12
青海
20.33
75.64
20.88
33.86
53.81
10.06
32.82
171.32
宁夏
19.75
70.24
18.67
36.71
61.75
10.08
40.26
165.22
新疆
21.03
78.55
14.35
34.33
64.98
9.83
33.87
161.67
第4章
[例4-1]判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(IrisData)。
鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。
这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。
该数据给出150个鸢尾花的萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)、花瓣宽(petalwidth)以及这些花分别属于的种类(Species)等共五个变量。
萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。
这里三种鸢尾花各有50个观测值。
数据格式如下图所示:
定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolour鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)四个变量作为解释变量。
使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。
分组变量(GroupingVariable)选择y,然后定义
的区域,最小值是1,最大值是3。
解释变量(Independents)选择sepal.length、sepal.width、petal.length和petal.width。
统计量(Statistics)选项中选择描述统计量Means,UnivariateANOVAs和Box’M,函数选择Fisher和非标准化函数,矩阵选择Within-groupscorrelation。
分类(Classify)选项中选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是50种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewiseresults),综合表(SummeryTable)和“留一个在外”(Leave-one-outclassifation)的验证原则,协方差矩阵选择Within-groups,作图选择Combined-groups。
保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。
如果采用逐步判别法,我们还可以选择判别的方法(Method)。
得到分析结果如下:
输出结果4-1
Discriminant
(1)
(2)
(3)
输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。
第1张表反映的是有效样本量及变量缺失的情况。
第2张表是各组变量的描述统计分析。
第3张表是对各组均值是否相等的检验。
由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepallength)、萼片宽(sepalwidth)、花瓣长(petallength)和花瓣宽(petalwidth)在三
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 第三 例题 习题 数据文件 人大