R作主成分分析主成分分类和主成分回归.docx
- 文档编号:2460690
- 上传时间:2022-10-29
- 格式:DOCX
- 页数:17
- 大小:209.42KB
R作主成分分析主成分分类和主成分回归.docx
《R作主成分分析主成分分类和主成分回归.docx》由会员分享,可在线阅读,更多相关《R作主成分分析主成分分类和主成分回归.docx(17页珍藏版)》请在冰豆网上搜索。
R作主成分分析主成分分类和主成分回归
9.1.3相关的R函数以及实例
卜•面介绍与主成分分析有关的函数.
i.princomp函数作主成分分析最主要的函数是pnncompO函数,其使用格式为
princomp(formula,data=NULL,subset,na.action,••・)
其中formula是没有响应变飒的公式(类似冋归分析、方差分析,但无响应变僦)・data是数据框(类似于冋归分析、方差分析).或者
princomp(x,cor=FALSE,scores=TRUE,co\nnat=NULL,subset=rep(TRUE,nrow(as.niaXrix(x))),•••)
其中X是用于主成分分析的数据,以数值矩阵或数据框的形式给出.cor是逻辑变ht,当cor=TRUE表示用样本的相关矩阵R作主成分分析,当cor=FALSE{缺省值)表示用样本的协方差阵S作主成分分析.covmat是协方差阵,如果数据不用x提供,可由协方差阵提供.其他参数的意义见在线帮助.
prcompO函数的意义与使用方法与princomp0函数相同.
2.summary函数
summary()与冋归分析中的用法相同,其目的是提取主成分的信息,其作用格式为
summary(object,loadings=FALSE,cutoff=0.1,...)其中object是由princomp()得至lj的对象.loadings是逻辑变ht,当loadings=TRUE表示显示loadings的内容具体含义在|、•面的loadings()函数].当loadings=FALSE则不显示.
3・loadings函数
loadings()函数是显示主成分分析或因子分析中loadings载荷,见因子分析)的内容.在主成分分析中,该内容实际上是主成分对应的各列,即前面分
的使用格式为
loadings(x)
其中x是由函数princomp()或factanal()(JSL因子分析得到的对象.
4.predict函数
P"di“()函数是预测主成分的ff[(类似于冋归分析中的使用方法).苴使用格式为
predict(object,newdata,•••)其中object是由princompO得到的对象.newdata是曲预测值构成的数据框,当newdata缺省时,预测已有数据的主成分值.
5.screeplot函数
screeplorO函数是画出主成分的碎石图,其使用格式为
screeplot(x,npcs=minClO,length(x$sdev)),
type=c(l,barplotM,MlinesH),
main=deparse(substitute(x))f…)比中X是由princompO得到的对象.npcs是画出的主成分的个数.type是描述画出的碎石图的类型,-barplof是直方图类型,-lines-是直线图类型.
6.biplot函数
biplot()是画出数据关于主成分的散点图和原坐标在主成分卜•的方向,其使用格式为
biplot(x,choices=1:
2,scale=1,pc.biplot=FALSE,...)其中x是由princompO得至lj的对象.choices是选择的主成分,缺省值是第1、第2主成分.pc.biplot是逻辑变肚:
缺省值为FALSE),当pc.biplot=TRUE.用Gabriel(1971)提出的画图方法.
7.实例
I、•面用一个例子说明前面介绍的网数的使用方法.
例9.1(中学生身体四项指标的主成分分析)
在某中学随机抽取某年级%名学生,測量其身高(XJ、体重(XJ、胸围(X3)和坐高(X4),数据如表9.1所示.试对这30名中学生身体四项指标数据做主成分分析.
解:
用数据框的形式输入数据.用princompO作主成分分析,由前面的分析,选择相关矩阵作主成分分析更合理,因此这里选择的参数是cor=TRUE.最后用summary()列出主成分分析的值,这里选择loadings=TRUE.U|、•是相应的
表9・1:
30名中学丰身体四呗指标数据
序号
&
X2
%3
X4
序号
XiX2
X3
X4
1
148
41
72
78
16
152
35
73
79
2
139
34
71
76
17
149
47
82
79
3
160
49
■■
((
86
18
145
35
70
■■
4
149
36
67
79
19
160
47
74
87
■
0
159
45
80
86
20
156
44
78
85
6
142
31
66
76
21
151
42
73
82
••
153
43
76
83
22
147
38
73
78
8
150
43
Ml■
((
79
23
157
39
68
80
9
151
42
■■
1(
80
24
147
30
65
75
10
139
31
68
71
25
157
48
80
88
11
140
29
64
74
26
151
36
74
80
12
161
47
78
84
27
144
36
68
76
13
158
■19
78
83
28
141
30
67
76
14
140
33
67
■■«
29
139
32
68
73
15
137
31
66
73
30
148
38
70
78
>student<-data•:
frame(
Xl=c(148
139,160,
149,
140
161,158,
140,
151
147,157,
147,
X2=c(41,
34,
49,36,
45,
29,
47,
49,33,
31,
42,
38,
39,30,
48,
X3=c(72,
71,
77,67,
80,
64,
78,
78,67,
66,
73,
73,
68,65,
80,
X4=c(78,
76,
86,79,
86,
74,
84,
83,77,
73,
82,
78,
80,75,
88,
####用数据框形式输入数据
)
159
142,11
53,150,
151,139,
137
152,1-
49,145,
160,156,
157
151,1<
44,141,
139,148)
31,
43,43,
42,31,
35,
47,35,
47,44,
36,
36,30,
32,38),
66,
76,77,
77,68,
73,
82,70,
74,78,
74,
68,67,
68,70),
76,
83,79,
80,74,
79,
79,77,
87,85,
80,
76,76,
73,78)
####作主成分分析,并显示分析结果
>student.pr<・princomp(student,cor=TRUE)
>summary(student.pr,loadings=TRUE)
Importanceofcomponents:
Comp・1Comp•2Comp・3Comp•4
Loadings:
在上述程序中,语句studenr.pr<-princomp(srudenr,cor=TRUE)可以student.pr<-princomp(*X1*X2*X3*X4,data=student,cor二TRUE).两者是等价的.
summary()函数列出了主成分分析的重要倍息,Standarddeviation行表示的是主成分的标准差,即主成分的方差的开方,也就是相就的持征值入1.A2.入3.A4的开方.ProportionofVariance行表示的是方差的贡献率.
emulativeProportion行表示的是方差的累积贡献率.
由TtEsummarypfq数的参数中选取了loadings=TRUE.因此列出了loadings
:
载荷;的内容,它实际上是主成分对应于原始变Ift的系数,即前
面介绍的矩阵Q.因此,得到
Z:
=-0.497Xf-0.515X;-0.481X"-0.507X;,
=0.543X:
-0.210X;-0.725X;+0.368X;.
由干前两个主成分的累积贡献率已达到96%另外二个主成分可以舍去,达到降维的目的.
第1主成分对应系数的符号都相同,其值在0.5左右,它反映了中学生身材魁梧程度:
身体高人的学生,他的4个部分的尺寸都比较大,因此第1主成分的值就较小(因为系数均为负值);而身材矮小的学生,他的1部分的尺寸都比校小因此,第1主成分绝对值就较人.我们称第1主成分为人小因子.第2主成
分是高度与围度的差,第2主成分值人的学生表明该学生叱[0高••而第2主成分值越小的学生表明该学生••矮胖S因此,祢笫2主成分为体形因子.
我们看一下各样本的主成分的值(用predict0函数).
####作预测
>predict(student.pr)
Comp.1
Comp.2
Comp.3
Comp.4
1
0.06990950
-0.23813701
-0.35509248
-0.266120139
2
1.59526340
-0.71847399
0.32813232
-0.118056646
3
-2.84793151
0.38956679
-0.09731731
-0.279482487
4
0.75996988
0.80604335
-0.04945722
-0.162949298
5
-2.73966777
0.01718087
0.36012615
0.358653044
6
2.10583168
0.32284393
0.18600422
-0.036456084
7
-1.42105591
-0.06053165
0.21093321
-0.044223092
8
-0.82583977
-0.78102576
-0.27557798
0.057288572
9
-0.93464402
-0.58469242
-0.08814136
0.181037746
10
2.36463820
-0.36532199
0.08840476
0.045520127
11
2.83741916
0.34875841
0.03310423
-0.031146930
12
-2.60851224
0.21278728
-0.33398037
0.210157574
13
-2.44253342
-0.16769496
-0.46918095
-0.162987830
14
1.86630669
0.05021384
0.3772
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 作主 成分 分析 分类 回归