多元统计实验报告.docx
- 文档编号:5133660
- 上传时间:2022-12-13
- 格式:DOCX
- 页数:10
- 大小:257.05KB
多元统计实验报告.docx
《多元统计实验报告.docx》由会员分享,可在线阅读,更多相关《多元统计实验报告.docx(10页珍藏版)》请在冰豆网上搜索。
多元统计实验报告
数学1001李倩1010810122
在某年级44名学生的期末成绩中,有的课程采用闭卷,有的课程采用开卷(成绩如下),其中X1,X2,X3,X4,X5分别表示力学(闭),物理(闭),代数(开),分析(开),统计(开)。
(1)试用因子分析分析这组数据。
(2)试对闭卷(X1,X2)和开卷(X3,X4,X5)两组变量进行典型相关分析.
(1)首先我们明确因子分析是一种降维的方法,它将多个变量综合为少数几个因子。
首先建立数学模型:
对这道题的具体解法如下:
先将数据写入excel中保存成文本格式,而后用read.table读取数据。
>chengji<-read.table("F:
/chengji.txt",header=T)
>fact1<-factanal(x=chengji,factors=2,scores="Bartlett")
>fact1
Call:
factanal(x=chengji,factors=2,scores="Bartlett")
Uniquenesses:
X1X2X3X4X5
0.5210.5820.3630.4820.005
Loadings:
Factor1Factor2
X10.691
X20.1350.633
X30.4760.640
X40.5450.470
X50.997
Factor1Factor2
SSloadings1.5371.510
ProportionVar0.3070.302方差贡献率
CumulativeVar0.3070.609累积方差贡献率
Testofthehypothesisthat2factorsaresufficient.
Thechisquarestatisticis0.11on1degreeoffreedom.
Thep-valueis0.739
Testofthehypothesisthat2factorsaresufficient.
由此可知两个主成分是足够的
载荷矩阵是用“Bartlett”方法得到的,根据结果得到这六门课程与两个潜在因子的关系为:
X1=0.691F2
X2=0.135F1+0.633F2
X3=0.476F1+0.640F2
X4=0.545F1+0.470F2
X5=0.997F1
根据F1和F2的系数知道两个因子与五门课程都有正相关性,第一个因子主要和统计(开)有很强的正相关,相关系数为0.997;而第二个因子主要与力学(闭)、物理(闭)有很强的正相关性分别为0.691、0.633、同时第一个因子和第二个因子与代数(开)、分析(开)均有差不多的正相关性,因此可以讲第一个因子解释为计算因子而将第二个因子解释为理论因子,这样便很好的解释了结果:
统计偏向于计算,而力学和物理偏向于理论,代数和分析则于两个因子均有差不多的关系。
如果用promax方法进行正交旋转则得到下面的结果:
>chengji<-read.table("F:
/chengji.txt",header=T)
>fact1<-factanal(x=chengji,factors=2,rotation="promax")
>fact1
Call:
factanal(x=chengji,factors=2,rotation="promax")
Uniquenesses:
X1X2X3X4X5
0.5210.5820.3630.4820.005
Loadings:
Factor1Factor2
X10.775-0.240
X20.694-0.114
X30.6490.247
X40.4450.390
X5-0.1141.048
Factor1Factor2
SSloadings1.7151.381
ProportionVar0.3430.276
CumulativeVar0.3430.619
Testofthehypothesisthat2factorsaresufficient.
Thechisquarestatisticis0.11on1degreeoffreedom.
Thep-valueis0.739
这时五门课程与两个潜在因子之间的关系变为:
X1=0.775F1-0.240F2
X2=0.694F1-0.114F2
X3=0.649F1+0.247F2
X4=0.445F1+0.390F2
X5=-0.114F1+1.048F2
这样的话第一个因子与力学(闭)、物理(闭)、代数(开)有很强的正相关性,相关系数分别为0.775、0.694、0.649,而第二个因子主要与统计(开)有很强的正相关性,相关系数为1.048,分析(开)与两个因子相关性没有太大的区别,同样的我们称第一个因子为“理论因子”称第二个因子为“计算因子”。
显然第二种方法比较好。
(2)数学模型如下:
>###读取数据
>chengji<-read.table("F:
/chengji.txt",header=T)
>###做典型相关分析
>chengji<-scale(chengji)
>ca<-cancor(chengji[,1:
2],chengji[,3:
5]);ca
$cor
[1]0.629912550.09592154
$xcoef
[,1][,2]
X10.095537600.1391077
X20.08479416-0.1459052
$ycoef
[,1][,2][,3]
X30.131144620.052123370.1268583
X40.07651773-0.01824329-0.1823259
X5-0.07715853-0.162441970.0667433
$xcenter
X1X2
1.892426e-16-5.724587e-17
$ycenter
X3X4X5
3.521489e-16-4.522897e-16-2.996341e-18
>###计算因子得分
>U<-as.matrix(chengji[,1:
2])%*%ca$xcoef;U
[,1][,2]
[1,]0.386196021-0.015394649
[2,]0.3055182860.079553680
[3,]0.1483564230.086739285
[4,]0.095209644-0.085053774
[5,]0.1191620280.115037164
[6,]0.079826145-0.036646512
[7,]-0.0379998340.122222768
[8,]-0.132055100-0.132737321
[9,]0.061730807-0.181004995
[10,]0.0151469450.294015827
[11,]0.002293616-0.078731473
[12,]-0.240969662-0.362129030
[13,]-0.0178076920.175225724
[14,]-0.034854628-0.014810522
[15,]-0.0507623280.056435622
[16,]-0.034945463-0.321770676
[17,]-0.2779362370.315712228
[18,]-0.067809265-0.133600625
[19,]-0.0210437330.005298861
[20,]-0.018946929-0.086056666
[21,]-0.187298682-0.213174853
[22,]-0.003563430-0.134463928
[23,]0.259801156-0.105023569
[24,]0.159979680-0.108755959
[25,]0.0644426470.011760750
[26,]0.172742173-0.042968813
[27,]0.222128710-0.018263736
[28,]0.122831435-0.044835008
[29,]0.1621673190.106848667
[30,]0.1350697280.043791020
[31,]0.047919911-0.201114378
[32,]-0.176632993-0.056032180
[33,]-0.1117721220.227225788
[34,]-0.0226163360.073815506
[35,]0.0119109040.124088963
[36,]-0.303552059-0.122822218
[37,]-0.1994461400.005159272
[38,]-0.0730512750.094788192
[39,]-0.2286405350.033457151
[40,]-0.0708636360.310392819
[41,]-0.1319642650.174222832
[42,]-0.010468878-0.144518620
[43,]-0.0666700280.127681765
[44,]-0.0507623280.056435622
>V<-as.matrix(chengji[,3:
5])%*%ca$ycoef;V
[,1][,2][,3]
[1,]0.130913472-0.25365062840.0285497642
[2,]0.192506357-0.22219857490.1248618323
[3,]0.216507338-0.0885843063-0.1618898620
[4,]0.136968404-0.1275490453-0.0098790666
[5,]-0.032787111-0.1909871285-0.0457739647
[6,]0.093548574-0.0126687962-0.1052233512
[7,]0.033900391-0.05658156810.2124558555
[8,]-0.066160788-0.19471872360.1327777664
[9,]-0.138128648-0.02658655950.0289367388
[10,]0.0903904030.10388942510.0305958954
[11,]-0.0229844750.0155263033-0.2536771482
[12,]0.047425280-0.1407515604-0.0320887077
.010*******
[14,]0.0699018630.1438398347-0.2176716859
[15,]0.1356290500.25509731890.2409047172
[16,]-0.1639649570.0376559223-0.0317846562
[17,]-0.071819488-0.1235470277-0.1283178526
[18,]-0.2522368360.00072185970.1943009251
[19,]-0.0056204000.23125694120.1138309830
[20,]-0.0649817240.19922141640.0654675543
[21,]0.0151969610.11033415820.0957315082
[22,]-0.1935152630.16060938150.0603896045
[23,]0.399618514-0.16776987730.1782755697
[24,]0.155512242-0.1550387365-0.1756027601
[25,]0.228262932-0.12650403960.1604525053
[26,]0.2178122900.02680697230.0698266635
[27,]0.1270735880.0836092104-0.1175813176
[28,]0.1138775200.0868068294-0.1394038105
[29,]0.0645540940.1681319069-0.0301254996
[30,]-0.0084834560.1277199630-0.0001381297
[31,]0.0684613900.10911772040.0828481885
[32,]0.090281028-0.0815066068-0.0359222900
[33,]-0.091247972-0.07293220700.3208493060
[34,]-0.082345799-0.0165092215-0.3020405768
[35,]-0.1548275220.0009260784-0.2891296160
[36,]-0.287100508-0.3500702518-0.0084789371
[37,]-0.221204094-0.1803591057-0.0987176308
[38,]0.0067508740.1242420817-0.1962363411
[39,]-0.292010082-0.2213545210-0.0207816215
[40,]0.0162329450.1797554402-0.0215181924
[41,]-0.0046937900.1152821912-0.0699369031
[42,]0.0112477030.2621979652-0.1169177590
[43,]-0.1535225700.1163173570-0.0574130905
[44,]-0.2054400850.14007545300.2868623340
>###找对数
>corcoef.chengji<-function(r,n,p,q,alpha=0.1){
+m<-length(r);Q<-rep(0,m);lambda<-1
+for(kinm:
1){
+lambda<-lambda*(1-r[k]^2);
+Q[k]<--log(lambda)
+}
+s<-0;i<-m
+for(kin1:
m){
+Q[k]<-(n-k+1-1/2*(p+q+3)+s)*Q[k]
+chi<-1-pchisq(Q[k],(p-k+1)*(q-k+1))
+if(chi>alpha){
+i<-k-1;break
+}
+s<-s+1/r[k]^2
+}
+i
+}
>corcoef.chengji(r=ca$cor,n=44,p=2,q=3)
[1]1
由结果可知只需选一对典型变量就可以了。
U1=0.09553760X1*+0.08479416X2*
V1=0.13114462X3*+0.07651773X4*-0.07715853X5*
U1、V1的相关系数为0.62991255,具有正相关关系,但是相关性不高。
U1中都是闭卷,权系数都不大,V1中都是开卷,权系数最大的是代数(开)为0.13114462,其次是分析(开)为0.07651773,学好了分析和代数对力学和物理有促进作用,于是(U1、V1)这对典型变量主要反映了基础课--专业课的关系。
体现的是考试方法的特点。
0.62991255为第一对典型变量的相关系数,所以比较分散。
0.09592154为第二对典型变量的相关系数,距1更远,所以点更为分散。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 实验 报告