应用多元统计分析习题解答主成分分析Word格式.docx
- 文档编号:20349857
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:14
- 大小:43.85KB
应用多元统计分析习题解答主成分分析Word格式.docx
《应用多元统计分析习题解答主成分分析Word格式.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析习题解答主成分分析Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
易知[■■■■■..■^.-相互正交
・¥
—TfYV—Tf¥
V—TCV
-
综上所述,
第一主成分为Yi=tXi+;
X2+^X3岖)=12
244
第二主成分为Y疔壮+汎+押叫=8
翻I
第三主成分为号=一;
沧+;
*3IXVa)二△
6.7设X=(%f屈,;
)’的协方差阵(p囂鬥为
0<
p<
1
证明:
「十:
-:
「为最大特征根,其对应的主成分为
a3-Xpu2…pcf
pa2a:
-A.“pa:
pa
pa3ma3-Al
(p-l)pa2+a5-2ptf…pCFZ(p-l)pa3+a:
-1as-1・per3
■I■«
:
■ME"
■■■贰
(p-l)pa2lu3-Apa2・》(J3-(p-l)pa:
+(js-Apaz"
-per
0护(1一p)—X
•<
n
7()<
L
钉-內-环「卜J血―』
_:
:
-:
为最大特征根
当5二一一----.:
时,
/^p(l-p)
IT-l.FUPff:
pa£
pa*1
jsp(l-p)a2p(l-p)
*p『
/pfi-p)p+
tIQp(i-P)
9•Hi
I:
■■
\ppE
cti={144/-'
■■■
p(pP\
P
K
I
•
p(l-p)/M)
(J2p(l-p)
/o
I0
PQ、
_pp>
«
0
■o
1•**0\
0“0
所以,-
6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。
单位:
(亿元)
行业名称
资产
固定资产净
产品销
利润
总计
值平均余额
售收入
总额
煤炭开采和选业
6917.2
3032.7
683.3
61.6
石油和天然气开采业
5675.9
3926.2
717.5
33877
黑色金属矿采选业
768.1
221.2
96.5
13.8
有色金属矿采选业
622.4
248
116.4
21.6
非金属矿采选业
699.9
291.5
84.9
6.2
其它采矿业
1.6
0.5
0.3
令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,
用SPSS寸这六个行业进行主成分分析的方法如下:
1.在SPSS窗口中选择Analyze^DataReduction^Factor菜单项,调出因子分析主界
面,并将变量X^X5移入Variables框中,其他均保持系统默认选项,单击0K按
钮,执行因子分析过程(关于因子分子在SPSS中实现的详细过程,参见7.7)。
得
到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。
第一个因子就可以解释86.5%
表6.1特征根和方差贡献率表
解秤的总育差
EW
初皓特征值
桿取平有和载入
台计
肓弟的%
累執隔
合计
君差的%
3.460
86.499
96.499
08.499
2
.537
13.434
99.S33
3
.002
.060
99.993
4
.000
.007
100.000
表6.2因子载荷阵
成棉
泊
.047
.999
X3
.686
则
769
2.将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为al。
点击菜单项
中的TransformsCompute,调出Computevariable对话框,在对话框中输入等式:
z1=a1/SQRT3.46),计算第一个特征向量。
点击OK按钮,即可在数据编辑窗口中
得到以z1为变量名的第一特征向量。
表6.3特征向量矩阵
z1
x1
0.509
x2
0.537
x3
0.530
x4
0.413
根据表6.3得主成分的表达式:
Y1=0.509X10.537X20.530X30.413X4
3.再次使用Compute命令,调出Computevariable对话框,在对话框中输入等式:
y1=0.509*x10.537*x20.53*x30.413*x4
根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采
和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。
6.9下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对
各主要食品和地区进行分类。
地区
粮食
蔬菜
食油
猪牛羊肉
家禽
蛋类及其制品
水产品
食糠
酒
北京
134.05
92.78
9.15
14.6
2.17
10.13
4.25
2.92
14.42
天津
150.2
69.99
10
11.07
0.84
10.8
8.35
0.72
10.14
河北
216.72
55.97
6.59
7.1
0.54
6.36
2.25
0.65
7.29
山西
218.91
80.87
5.72
5.36
0.24
6.15
0.47
1.15
2.59
内蒙
207.3
70.77
2.79
21.18
1.41
3.82
1.45
1.34
10.77
辽宁
194.39
178.59
5.9
16.45
2.51
9.59
4.49
0.73
吉林
255.99
115.2
6.27
11.42
3.23
8.64
3.6
0.75
13.64
黑龙江
195.08
111.7
7.62
7.85
2.61
6.26
3.35
0.9
15.09
上海
189.44
76.6
8.59
16.37
7.4
7.51
16.11
2.12
16.77
江苏
251.98
109.12
8.27
12.05
4.5
6.72
9.09
1.3
8.82
浙江
208.46
83.91
5.81
16.42
6.03
5.33
14.64
2.13
24.15
安徽
228.35
80.97
6.87
9.07
4.27
5.04
5.43
1.42
10.61
福建
198.27
99.92
5.19
16.51
5.14
3.55
13.3
2.35
16.84
江西
264.8
144.22
8.77
13.24
3.31
3.5
1.13
7.31
山东
229.06
118.19
6.96
8.09
2.7
11.61
4.01
10.81
河南
236.97
100.11
4.22
6.48
1.23
8.01
1.35
4.23
湖南
227.39
159.76
9.4
19.86
2.74
3.86
8.1
0.92
湖北
247.21
149.44
17.51
3.89
3.28
6.89
4.02
广东
233.75
130.22
6.73
22.27
10.4
2.83
2.16
3.33
广西
205.65
108.94
4.92
14.44
7.33
1.12
3.57
1.18
6.14
海南
236.31
86.61
5.7
15.4
9.77
1.31
14.75
1.24
3.88
令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPSSS行主成分分析的具体方法参见6.8,分析结果如下:
表6.4特征根和方差贡献率表
解齋她总肓差
初始特征值
提取平方和载入
舍计
累镇監
育差的俯
累與%
2.927
32.521
2.220
24.671
57192
57192
1.344
14.936
72.120
14936
72.128
801
8905
31.033
.654
7.253
38296
6
.396
4.399
92,694
335
3727
96.422
E
222
2472
99.894
e
.100
1.105
表6.5因子载荷阵
XI
.G20
-006
.093
-.477
.715
009
.276
SOS
X4
780
-.113
.194
-.212
■064
-.503
.608
312
灯
.857
177
130
.664
.496
-.151
.241
.735
-.023
表6.6特征向量矩阵
z2
z3
0.001169
-0.55035
-0.00518
0.054359
-0.32014
0.616746
0.005261
0.185239
0.697829
0.455914
-0.07584
0.167341
x5
0.509689
-0.14229
-0.05521
x6
-0.32908
0.408063
0.269126
x7
0.500921
0.118795
0.112136
x8
0.388112
0.332893
-0.13025
x9
0.140866
0.4933
-0.01984
根据表6.6得主成分的表达式:
Y1=0.001X10.054X20.005X30.456X40.51X5-0.329X60.501X70.388X80.141X9
Y2=-0.55X1-0.32X20.185X3-0.076X4-0.142X50.408X60.119X70.333X80.493X9
如下表:
Y3=-0.005X10.617X20.698X30.167X4—0.055X50.269X60.112X7—0.130X8—0.02X9
y1
y2
y3
y
14.92
-90.42
67.81
-10.16
11.80
-93.48
54.76
-15.31
24.39
-115.46
57.85
-16.51
24.55
-129.93
68.56
-19.17
25.14
-126.00
59.51
-19.43
19.55
-154.56
118.72
-19.47
13.27
-131.90
76.07
-23.38
23.53
-169.91
108.84
-24.97
29.80
-167.06
88.93
-25.29
19.18
-144.89
72.06
-25.99
分别计算出以上三项后,利用公式八宀丫1•宀丫2•^丫3得到综合得分并排序
15.93
-130.47
48.84
-27.33
24.93
-154.57
60.04
-29.19
11.81
-152.64
81.06
-30.09
21.71
-179.61
100.93
-30.74
14.06
-143.12
56.46
-30.92
18.07
-164.93
76.08
-32.51
7.10
-129.83
40.94
-32.73
6.20
-141.44
55.18
-34.15
14.54
-166.90
78.26
-34.32
18.74
-185.62
97.04
-34.94
8.32
-156.36
66.62
-35.93
最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。
6.10根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。
解:
用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:
表6.7特征根和方差贡献率表
解齋的总育差
提取平育和载入
启差的%
累和%
育差的隔
累頼%
5.058
56.199
5B.199
56.199
56139
2390
26.551
82750
2.390
82.750
.814
9.041
91.790
.341
3.784
95.575
.248
2.769
9B.333
100
1.10B
99.441
7
.027
.304
9S.744
G
.020
21S
99.964
g
003
.036
表6.8因子载荷阵
X1
B55
722
X2
.629
.736
.315
-444
.694
-.571
90S
-.302
一曲4
-.419
.687
.607
.683
180
y9
.882
-.370
0.29
0.28
0.48
0.14
-0.29
0.31
-0.37
0.40
-0.20
-0.27
0.39
0.12
-0.24
青岛
35237.27
14552.46
28597.44
大连
31830.56
17629.53
27272.03
济南
25149.73
16499.39
22372.97
福州
22734.16
16326.97
20677.45
乌鲁木齐
22284.54
15284.68
20037.59
沈阳
23184.99
12310.22
19694.19
武汉
23909.27
9770.56
19370.75
长春
21524.95
14179.21
19166.96
成都
33808.79
-17638.73
17294.14
太原
19445.42
9809.99
16352.45
郑州
18561.81
9822.90
15756.62
兰州
16568.97
13769.80
15670.44
海口
17666.70
11325.77
15631.26
昆明
18494.34
8579.72
15311.75
呼和浩特
16128.60
13359.10
15239.59
长沙
18845.23
6252.54
14802.98
石家庄
18229.33
7399.62
14752.99
西安
16764.15
4871.97
12946.76
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 习题 解答 成分 分析