实验报告9典型相关分析.docx
- 文档编号:6674748
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:20
- 大小:107.48KB
实验报告9典型相关分析.docx
《实验报告9典型相关分析.docx》由会员分享,可在线阅读,更多相关《实验报告9典型相关分析.docx(20页珍藏版)》请在冰豆网上搜索。
实验报告9典型相关分析
实验九典型相关分析
实验目的和要求
能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量.
实验要求:
编写程序,结果分析.
实验内容:
4.8SAS实现
dataexamp4_8(type=corr);
input_name_$x1-x2y1-y2;
_type_=’corr’;
cards;
x11.000.630.240.06
x20.631.00-0.060.07
y10.24-0.061.000.42
y20.060.070.421.00
;
run;
proccancorrdata=examp4_8corr;
varx1-x2;
withy1-y2;
run;
TheSASSystem20:
05Thursday,November18,20131
TheCANCORRProcedure
CorrelationsAmongtheOriginalVariables
1、变量x1-x2的相关系数矩阵
:
CorrelationsAmongtheVARVariables
x1x2
x11.00000.6300
x20.63001.0000
2、变量y1-y2的相关系数矩阵
:
CorrelationsAmongtheWITHVariables
y1y2
y11.00000.4200
y20.42001.0000
3、变量x1-x2与y1-y2的相关系数矩阵
:
CorrelationsBetweentheVARVariablesandtheWITHVariables
y1y2
x10.24000.0600
x2-0.06000.0700
变量间高度相关。
TheSASSystem20:
05Thursday,November18,20132
TheCANCORRProcedure
4典型相关分析的一般结果
CanonicalCorrelationAnalysis
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
CorrelationCorrelationErrorCorrelation
典型相关系数
校正的典型相关系数近似的标准误典型相关系数平方
10.3971120.3969100.0084230.157698
20.072889.0.0099470.005313
5、检验各对典型变量是否显著相关
TestofH0:
Thecanonicalcorrelationsinthe
EigenvaluesofInv(E)*Hcurrentrowandallthatfollowarezero
=CanRsq/(1-CanRsq)
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>F
各对相关系相邻两特特征值占特征值占方差似然比
值
数特征值征值之差方差比例比例累计值
10.18720.18190.97230.97230.83782737462.33419992<.0001
20.00530.02771.00000.9946871253.4019997<.0001
第一对典型变量贡献率97.23%。
充分反映了两组变量的相互关系。
检验假设
检验统计量
,
为第一、第二自由度.由检验结果可知,
,.故两对典型变量显著相关.取两对进行分析即可.
另外,从对典型变量
进行分析求得特征值在方差占比例的累计值(贡献率)为0.9947也可看出,两对变量即可。
以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验
6、求出典型变量及典型相关系数,并解释
典型变量的系数和典型结构
MultivariateStatisticsandFApproximations
S=2M=-0.5N=4997
StatisticValueFValueNumDFDenDFPr>F
Wilks'Lambda0.83782737462.33419992<.0001
Pillai'sTrace0.16301046443.56419994<.0001
Hotelling-LawleyTrace0.19256330481.20411994<.0001
Roy'sGreatestRoot0.18722205935.8329997<.0001
NOTE:
FStatisticforRoy'sGreatestRootisanupperbound.
NOTE:
FStatisticforWilks'Lambdaisexact.
TheSASSystem20:
05Thursday,November18,20133
TheCANCORRProcedure
CanonicalCorrelationAnalysis
RawCanonicalCoefficientsfortheVARVariables
第一组变量x1-x3的典型变量的系数(原始变量未标准化)
第一典型变量
第二典型变量
V1V2
x11.2477984840.3179603133
x2-1.0330394770.7687192318
RawCanonicalCoefficientsfortheWITHVariables
第二组变量y1-y3的典型变量的系数(原始变量为标准化)
第一典型变量
第二典型变量
W1W2
y11.1018762969-0.007089979
y2-0.4563537171.0029570909
数据未标准化结果,即利用协方差矩阵分析的结果。
TheSASSystem20:
05Thursday,November18,20134
TheCANCORRProcedure
CanonicalCorrelationAnalysis
第一组变量x1-x2的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheVARVariables
第一典型变量
第二典型变量
V1V2
x11.24780.3180
x2-1.03300.7687
第二组变量y1-y2的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheWITHVariables
第一典型变量
第一典型变量
W1W2
y11.1019-0.0071
y2-0.45641.0030
给出
的三个特征值
第一对典型变量
主要阅读速度,阅读理解力的影响。
主要计算速度,计算正确程度影响。
第一对典型变量主要表现阅读和计算的相关性。
第一对典型相关系数为
第二对典型变量及典型相关系数
输出原变量和典型变量间的相关系数
TheSASSystem20:
05Thursday,November18,20135
TheCANCORRProcedure
CanonicalStructure
第一组变量x1-x2和典型变量
的相关系数
CorrelationsBetweentheVARVariablesandTheirCanonicalVariables
V1V2
x10.59700.8023
x2-0.24690.9690
第二组变量y1-y2和典型变量
的相关系数
CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables
W1W2
y10.91020.4142
y20.00641.0000
第一组变量x1-x2和第二组典型变量
的相关系数
CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables
W1W2
x10.23710.0585
x2-0.09810.0706
第二组变量y1-y2和第一组典型变量
的相关系数
CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables
V1V2
y10.36150.0302
y20.00260.0729
由数据分析得:
原变量和第一对变量相关程度高,第二组提取的信息很少,与典型对系数一致。
4.8Matlab实现
(1)可以用matlab求出各样本典型相关变量和样本的典型相关系数
程序如下:
>>R11=[10.63;0.631];
>>R12=[0.240.06;-0.060.07];
>>R21=[0.24-0.06;0.060.07];
>>R22=[10.42;0.421];
>>[v1,d1]=eig(R11);
>>[v2,d2]=eig(R22);
>>p1=inv(v1*sqrt(d1)*v1');
>>p2=inv(v2*sqrt(d2)*v2');
>>T1=p1*R12*inv(R22)*R21*p1;
>>T2=p2*R21*inv(R11)*R12*p2;
结果:
有上求出的结果可以得到:
典型相关系数为:
r1=0.0729r2=0.3971
典型变量:
,
,
(2)检验各对典型变量的显著相关
程序如下:
>>p=2;
>>q=2;
>>n=140;
>>k=1:
2;
>>d1k=(p-k+1).*(q-k+1);
>>d=[0.07290.3971];
>>D=1-d.^2;
>>Ak=[D
(1)*D
(2),D
(2)];
>>Tk=-[n-0.5*(p+q+3)].*log(Ak);
>>pk=1-chi2cdf(Tk,d1k)
结果:
可以看出,第一、第二典型变量都是显著性相关的。
即一名学生的阅读速度和阅读理解能力越强,他的技术速度和计算正确程度就越好。
4.9SAS实现
dataexamp4_9;
inputx1-x2y1-y2;
cards;
1191155179145
2195149201152
3181148185149
4183153188149
5176144171142
6208157192152
7189150190149
8197159189152
9188152197159
10192150187151
11179158186148
12183147174147
13174150185152
14190159195157
15188151187158
16163137161130
17195155183158
18186153173148
19181145182146
20175140165137
21192154185152
22174143178147
23176139176143
24197167200158
25190163187150
;
run;
proccancorrdata=examp4_9corr;
varx1-x2;
withy1-y2;
run;
由SASproccancorr过程求得
样本相关系数矩阵
TheSASSystem20:
20Thursday,November18,20131
TheCANCORRProcedure
CorrelationsAmongtheOriginalVariables
1、变量x1-x2的相关系数矩阵
:
CorrelationsAmongtheVARVariables
x1x2
x11.0000-0.2094
x2-0.20941.0000
2、变量y1-y2的相关系数矩阵
:
CorrelationsAmongtheWITHVariables
y1y2
y11.00000.6932
y20.69321.0000
3、变量x1-x2与y1-y2的相关系数矩阵
:
CorrelationsBetweentheVARVariablesandtheWITHVariables
y1y2
x1-0.0108-0.2318
x20.73460.7108
变量间高度相关。
TheSASSystem14:
21Saturday,October30,20124
TheCANCORRProcedure
4典型相关分析的一般结果
CanonicalCorrelationAnalysis
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
CorrelationCorrelationErrorCorrelation
典型相关系数
校正的典型相关系数近似的标准误典型相关系数平方
10.7874780.7723830.0775430.620121
20.292947.0.1866070.085818
5、检验各对典型变量是否显著相关
TestofH0:
Thecanonicalcorrelationsinthe
EigenvaluesofInv(E)*Hcurrentrowandallthatfollowarezero
=CanRsq/(1-CanRsq)
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>F
各对相关系相邻两特特征值占特征值占方差似然比
值
数特征值征值之差方差比例比例累计值
11.63241.53850.94560.94560.347278677.324420.0001
20.09390.05441.00000.914181972.071220.1648
第一对典型变量贡献率94.56%。
充分反映了两组变量的相互关系。
检验假设
检验统计量
,
为第一、第二自由度.由检验结果可知,
,.故两对典型变量显著相关.取两对进行分析即可.
另外,从对典型变量
进行分析求得特征值在方差占比例的累计值(贡献率)为0.9141也可看出,只需要两对变量即可。
以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验。
6、求出典型变量及典型相关系数,并解释
典型变量的系数和典型结构
MultivariateStatisticsandFApproximations
S=2M=-0.5N=9.5
StatisticValueFValueNumDFDenDFPr>F
Wilks'Lambda0.347278677.324420.0001
Pillai'sTrace0.705938886.004440.0006
Hotelling-LawleyTrace1.726290238.94424.1980.0001
Roy'sGreatestRoot1.6324161017.96222<.0001
NOTE:
FStatisticforRoy'sGreatestRootisanupperbound.
NOTE:
FStatisticforWilks'Lambdaisexact.
TheCANCORRProcedure
CanonicalCorrelationAnalysis
RawCanonicalCoefficientsfortheVARVariables
第一组变量x1-x3的典型变量的系数(原始变量未标准化)
第一典型变量
第二典型变量
V1V2
x10.00917257220.1386496154
x20.10366421780.0151230041
第二组变量y1-y3的典型变量的系数(原始变量为标准化)
RawCanonicalCoefficientsfortheWITHVariables
第一典型变量
第二典型变量
W1W2
y10.08450520960.168128993
y20.0459765801-0.130308033
数据未标准化结果,即利用协方差矩阵分析的结果。
TheSASSystem20:
20Thursday,November18,20134
TheCANCORRProcedure
CanonicalCorrelationAnalysis
第一组变量x1-x3的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheVARVariables
第一典型变量
第二典型变量
V1V2
x10.06751.0204
x21.01200.1476
第二组变量y1-y3的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheWITHVariables
第一典型变量
第一典型变量
W1W2
y10.62311.2396
y20.4616-1.3083
给出
的三个特征值
第一对典型变量
主要成年长子的头长、头宽加权
主要次子头宽影响
第一对典型变量主要表现头宽和头长的相关性。
第一对典型相关系数为
第二对典型变量及典型相关系数
输出原变量和典型变量间的相关系数
TheCANCORRProcedure
CanonicalStructure
第一组变量x1-x3和典型变量
的相关系数
CorrelationsBetweentheVARVariablesandTheirCanonicalVariables
V1V2
x1-0.14440.9895
x20.9978-0.0660
第二组变量y1-y3和典型变量
的相关系数
CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables
W1W2
y10.94300.3327
y20.8935-0.4491
第一组变量x1-x3和第二组典型变量
的相关系数
CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables
W1W2
x1-0.11370.2899
x20.7858-0.0193
第二组变量y1-y3和第一组典型变量
的相关系数
CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables
V1V2
y10.74260.0975
y20.7036-0.1316
由数据分析得:
原变量和第一对变量相关程度高,第二组提取的信息很少,与典型对系数一致。
4.9MATLAB实现
建立data.txt,并导入数据。
>>a=[data];
[n,m]=size(a);
b=a./(ones(n,1)*std(a));
R=cov(b);
X=b(:
1:
2);
Y=b(:
3:
4);
[A,B,r,U,V,ststs]=canoncorr(X,Y)
A=
0.0675-1.0204
1.0120-0.1476
B=
0.6231-1.2396
0.46161.3083
r=
0.78750.2929
U=
0.43731.5839
0.86111.3848
-0.58101.4579
-0.36451.2890
-1.08101.2562
2.24540.6336
0.28500.7823
1.12350.5227
0.19970.5201
0.62350.3210
-0.71500.3789
-0.29110.1798
-1.21490.1772
0.4529-0.2034
0.2547-0.3118
-2.3277-0.0724
0.9987-0.6949
0.0749-0.6975
-0.4343-0.7605
-1.0471-0.8084
0.7244-1.2042
-1.1324-1.0706
-0.9159-1.2395
1.2702-1.6957
0.5538-1.7285
V=
0.1054-1.2830
0.60982.5925
-0.21030.6757
0.35010.2260
-1.1920-0.4761
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验报告9 典型相关分析 实验 报告 典型 相关 分析