实验九典型相关分析Word下载.docx
- 文档编号:17446277
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:22
- 大小:137.88KB
实验九典型相关分析Word下载.docx
《实验九典型相关分析Word下载.docx》由会员分享,可在线阅读,更多相关《实验九典型相关分析Word下载.docx(22页珍藏版)》请在冰豆网上搜索。
<
OUT=SAS数据集>
OUTSTAT=SAS数据集>
<
CORR>
NCAN=m>
EDF=n-1>
;
VARvariables;
WITHvariables;
RUN;
说明:
此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.
(1)proccancorr语句的<
选项列表>
:
OUT=SAS数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.
OUTSTAT=SAS数据集——创建含原始变量的样本均值、样本标准差、样本相关系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集.
CORR(或C)——打印原始变量的样本相关系数矩阵.
NCAN=m——规定要求输出的典型变量对个数,默认为两组变量个数较小者.
EDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.
all——所有输出项.
noprint——不输出分析结果.
short——只输出典型相关系数和多元分析统计数.
simple——简单统计数.
vname=变量名——为var语句的变量定义名称.
vprefix=前缀名——为var语句的典型变量定义前缀.
wname=变量名——为with语句的变量定义名称.
wprefix=前缀名——为with语句的典型变量定义前缀.
(2)VARvariables——VAR后列出进行相关分析的第一组变量名称.
(3)WITHvariables——WITH后列出进行相关分析的第二组变量名称
var与with语句经常同proccancorr语句一起使用.其他语句类似corr过程.
2.典型相关分析步骤
两组随机变量
,
取值
组观测数据
,
标准化样本
样本相关系数矩阵
为总体
相关系数矩阵
的估计.
样本典型相关分析步骤:
(1)求
(
)的特征值
(2)求
和
对应的正交单位化特征向量
(3)第k对典型相关变量为
其中
样本典型相关系数为
(4)典型相关系数的显著性检验
统计量
检验
值为
若
,拒绝
.
依次就
进行检验,若对某个
,检验
值首次满足
,则认为只有前
对典型变量显著相关,选取前
对即可.
注意:
利用样本协方差矩阵,分析方法一样.不需要对数据标准化处理.
3.实例分析
例为研究空气温度与土壤温度的关系,考虑六个变量
日最高土壤温度;
日最低土壤温度;
日土壤温度积分值;
日最高气温;
日最低气温;
日气温曲线积分值.
观测了
天,数据如表.
做典型相关分析.
解:
(1)建立输入数据集,程序如下:
dataexamp4_6;
inputx1-x3y1-y3;
cards;
85591518465147
86611598465149
83641527966142
83651588167147
88691808468167
77671477466131
78691597366131
84681597567134
89711958468161
91762068672169
91762068873176
94762119074187
94752118872171
92702015872171
87681678169154
83681627968149
87661738469160
87681778470160
88701698470168
83661707767147
92671968767166
92721998969171
94722048972180
92732019372186
93722069374188
94722089475199
95732149374193
95702109374196
95712079675198
95692029576202
96691738473173
91691689171170
89701898872179
95712108972179
96732089172182
97752159274196
96691989475192
95671969675195
94752119376198
92731988874188
90741978874178
94702059172175
95712099272190
96722089273189
95712089475194
96712089676202
run;
(2)调用典型相关分析cancorr过程
菜单操作方法为,选择Globals/SAS/Assist/Dataanalysis/multivariate/canonicalcorrelationanalysis(典型相关分析)菜单命令.
编程方法如下:
proccancorrdata=examp4_6corr;
/*调用相关分析过程,打印样本相关系数矩阵*/
varx1-x3;
/*第一组变量x1-x3*/
withy1-y3;
/*第二组变量y1-y3*/
由SASproccancorr过程求得
SAS系统10:
24Sunday,November2,200814
TheCANCORRProcedure
CorrelationsAmongtheOriginalVariables
CorrelationsAmongtheVARVariables(变量x1-x3的相关系数矩阵
)
x1x2x3
x1
x2
x3
CorrelationsAmongtheWITHVariables(变量y1-y3的相关系数矩阵
y1y2y3
y1
y2
y3
CorrelationsBetweentheVARVariablesandtheWITHVariables
变量x1-x3与y1-y3的相关系数矩阵
变量间高度相关。
SAS系统10:
24Sunday,November2,200815
CanonicalCorrelationAnalysis
典型相关分析的一般结果
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
CorrelationCorrelationErrorCorrelation
典型相关系数
校正的典型相关系数近似的标准误典型相关系数平方
1
=
=
2
=
3
=.
(3)检验各对典型变量是否显著相关
表各对典型变量相关性检验结果
EigenvaluesofInv(E)*HTestofH0:
Thecanonicalcorrelationsinthe
=CanRsq/(1-CanRsq)即
currentrowandallthatfollowarezero
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>
F
各对相关系相邻两特特征值占特征值占方差似然比
值
数特征值征值之差方差比例比例累计值
19<
.0001
20.482
30.142
检验假设
检验统计量
为第一、第二自由度.由检验结果可知,
.故只有前两对典型变量显著相关.取前两对进行分析即可.
另外,从对典型变量
进行分析求得特征值在方差占比例的累计值(贡献率)为也可看出,只需要前两对变量即可.
以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验
MultivariateStatisticsandFApproximations
S=3M=N=19
StatisticValueFValueNumDFDenDFPr>
统计方法F值检验p值
Wilks'
Lambda9<
Pillai'
sTrace1.9126<
Hotelling-LawleyTrace6.9<
Roy'
sGreatestRoot6.342<
NOTE:
FStatisticforRoy'
sGreatestRootisanupperbound.
(4)求出典型变量及典型相关系数,并解释
典型变量的系数和典型结构
24Sunday,November2,200816
RawCanonicalCoefficientsfortheVARVariables
第一组变量x1-x3的典型变量的系数(原始变量未标准化)
第一典型变量
第二典型变量
V1V2V3
第二组变量y1-y3的典型变量的系数(原始变量为标准化)
RawCanonicalCoefficientsfortheWITHVariables
W1W2W3
数据未标准化结果,即利用协方差矩阵分析的结果
其余略
24Sunday,November2,200817
第一组变量x1-x3的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheVARVariables
第一典型变量
V1V2V3
x1(即
)
x2(即
x3(即
第二组变量y1-y3的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheWITHVariables
W1W2W3
y1
y2
给出
的三个特征值
.
第一对典型变量
主要日最高、日均土壤温度加权
主要受日均气温影响
第一对典型变量主要表现日均气温与日均、最高土壤温度相关性。
气温高,则土壤温度高。
第一对典型相关系数为
第二、第三对典型变量及典型相关系数
主要日最低土壤温度和日均土壤温度差异
主要最低气温和日均气温的差异
第二对变量主要表现日均温差与土壤温差的关系。
温差大,则土壤温度差异大。
(5)以下输出原变量和典型变量间的相关系数(可不要求)
24Sunday,November2,200818
CanonicalStructure
第一组变量x1-x3和它们的典型变量
的相关系数
CorrelationsBetweentheVARVariablesandTheirCanonicalVariables
第二组变量y1-y3和它们的典型变量
CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables
第一组变量x1-x3和第二组典型变量
CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables
第二组变量y1-y3和第一组典型变量
CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables
y3
原变量和第一对变量相关程度高,后两组提取的信息很少,与典型对系数一致。
练习:
评委打分问题
dataexamp1;
864385439371
997499789989
372210272433
51956131138
454355395458
213221343532
367848754278
693185327052
409836996486
26144082521
516838684872
638679877695
398057805568
784072427558
564954485261
398071765281
65553116741
281131122335
503268234958
699869978199
559978976090
3611515265
771861276854
673395345961
458746856780
617263636275
416374555076
65135513
285335513159
662079186755
proccancorrdata=ex5corr;
SAS系统2008年08月01日星期五下午09时25分34秒1
CorrelationsAmongtheVARVariables
CorrelationsAmongtheWITHVariables
CorrelationsBetweentheVARVariablesandtheWITHVariables
SAS系统2008年08月01日星期五下午09时25分34秒2
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
CorrelationCorrelationErrorCorrelation
1
2
3.
TestofH0:
Thecanonicalcorrelationsin
EigenvaluesofInv(E)*Hthecurrentrowandallthatfollowarezero
=CanRsq/(1-CanRsq)
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>
19<
2450<
30.126
S=3M=N=11
StatisticValueFValueNumDFDenDFPr>
Wilks'
sTrace2.978<
Hotelling-LawleyTrace119.9<
sGreatestRoot108.326<
SAS系统2008年08月01日星期五下午09时25分34秒3
RawCanonicalCoefficientsfortheWITHVariables
SAS系统2008年08月01日星期五下午09时25分34秒4
TheCANCORRProcedure标准化数据典型相关分析
第一特征根贡献率
选一对就可以。
也说明,两组变量高度相关。
主要高学历、低学历加权与网络调查差异。
主要艺术家、部门主管、发行部门加权。
第一对典型变量主要表现高低学历打分与艺术家部门主管打分的关系。
网络调查占比例小。
第一组(高学历)打分高,则第二组打分也高。
说明二者具有高度的一致性。
特别是高学历的打分和专家打分高度一致,第一对典型相关系数为
主要低学历、网络和高学历打分差异
主要发行部门、部门主管和艺术家打分的差异。
第二对变量主要表现低学历与发行部门打分的关系。
低学历打分高,则发行部门打分高。
低学历占人群比例高,发行部门打分主要看是否符合大众口味。
SAS系统2008年08月01日星期五下午09时25分34秒5
CorrelationsBetweentheVARVariablesandth
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 典型 相关 分析