典型相关分析.docx
- 文档编号:28099476
- 上传时间:2023-07-08
- 格式:DOCX
- 页数:16
- 大小:28.50KB
典型相关分析.docx
《典型相关分析.docx》由会员分享,可在线阅读,更多相关《典型相关分析.docx(16页珍藏版)》请在冰豆网上搜索。
典型相关分析
武夷学院实验报告
课程名称:
多元统计分析
项目名称:
典型相关分析
姓名:
专业:
14信计班级:
1班学号:
同组成员:
无
-、实验目的
1.对典型相关分析问题的思路、理论和方法认识;
2.SPSS软件相应计算结果确认与应用;
3.SPSS软件相应过程命令。
二、实验内容
这里通过典型相关分析来反映我国财政收入与财政支出之间的关系。
第一组反映财政收入的指标有国内增值税、营业税、企业所得税、个人所得税、专项收入及行政事业性收费收入等,分别用X1-X6来表示。
第二
组反映财政支出的指标有一般公共服务、国防、公共安全、教育、科学技术、社会保障和就业、医疗卫生与计划生育及节能环保等,分别用Y1-Y8来表示。
原始数据如下:
jts
10^?
9
6K!
1?
痼84
96.66
41H9
29?
12
9.06
M.82
0HW
2348?
225.0B
425.1'
2W.39
tU.31
236.12 144咼 仁 1A.U 461.X 92.91 线北 2応.Jb Bi2in 231EJ S4.EO 94.00 1SB.9E 52^U 10.9G 243.0S S37.BJ 4B7B iL古 314,65 are.oe 2C2加 4937 320.47 吳7E 如口 5.5E: 156.D5 54244 62OS 4 由蓋芒 353.02 15526 44ar 154.S2 1243? 33010 5.26 175.7? 4f6ffT 316+ 24841 657.(1 ^063 S415 107.12 Bl34 -'9S 24457 66948 11B99 11 245.09 121衍 2305 51.W 2眉31 6W 1-17,77 41203 37.ZZ 151.73 25T.99 a.Bi 北田 71.61 27000 s.se 173.35 soia ».ei 上癌 B4847 35522 11-5.6S 10041 3GD10 G.E? RED 6T954 257BE SIS B5926 BF2.41 76386 2uee 193.11 36663 冃69ii 2254 462.99 145J鮒 302® 651.CT 106&.9? 6G6M 193.» 121. 3^71 530IB 丄53 3477D fflUDG 191ti? 1S0.4G 43.44 1*b.M 4H15 4.3ti 163.7B 59 1DS.6J 23431 55141 271OS 7B37 79.TO W.34 327.D& 7.GI 10S.44 57J.91 &D.£2 2- 146.43 423.50 13EZ1 2B77 62.® 1EE29 337DI 5.95 16292 66』53 站32 lift 409,fi6 TO33 1匚4田 163.68 ⑹112 F臼孙 15,26 341.33 139? 6? 149.14 202G6 ^1.? 9 血丽 酊S3 90.25 2».7B ? 33.21 6.51 XI.22 1171.52 90.00 ; 225.6E 21533 57.71 sa.73 2EB69 g«J9 227.Qfl KC&3 77.21 175.11 451IE IS17 5D5C 63.0P 17E0I eae 14.70 m.as sra 5546 广床 ID5B.S6 1KK.20 S7JB3 3i303 233.00 450110 SMiS 17.83 B50.3I 忡3射 3ii54 ra 9B76 3CM20 377* 叩4 1X22 4132D 磁 178.61 hrn S436 Jl.bt 190.96 5G.46 1td 11.1? tr.1l Iib.+J W.1E wsr 13.92 11 lEJRX 424.31 135.B2 37.54 砧.00 27E.U 0.7$ 141.22 43? .23 30.6£ 43 nauli JUC atrna ■TCCC 口口in ■mFc£r 1TDrt"l 匚indq 1ECT sysnde imcj-1 ELD CKj 三、实验步骤 在SPSS中没有提供典型相关分析的专门菜单项,必须采用canonicalcorrelation.sps宏来实现。 把canonical correlation.sps安装在SPSS子目录下。 (1)按文件-新建-语法打开语法窗口,输入下图中的语句: LC®C 圈怕.4 工內印屮JH内窗0DGJV)取f □二甘上 •%%阴■ S*-■ 甘•*%匚]阳语: ca~crizfllcair-dflr«iDrQGtrviedc£ia仃 豊佶p-$pss沁加 Ip1B\^~ S产EWWiFiy址耳岳厂".嘻 h1rri5h INCLUDFCersVkdrrihlstraloND龄p\Slatsikcsl7\Cartamcalcottelailan.sp皆- cancetTbull-<1QX3>4适超 _/*? =V173YiV5VE¥7 (2)点击语句窗口“运行”菜单中的“全部”子菜单项。 运行典型相关宏命令,得出结果。 四、实验结果 Correlations forSet-1 XI X2 X3 X4 XI 1.0000 .9344 .9779 .9452 .5377 .5256 X2 .9344 1.X00 .9151 .3400 +5470 ・6392 X3 .9779 .9151 .3514 .4657 .4717 X4 .9452 .@460 .9814 1.0000 41TB ’3000 K5 .5377 .5470 .4S57 .4175 1.0000 .3703 XE .5256 .6502 .4717 3600 .3703 1.0000 X0 表1(第一组变量的自相关系数阵) Sc-t-2 76 Y6 ¥7 YL Y2 TL L0000 .S'9? .flCiSl .78'? 一防起 .B24B 72 -8O0T 1.0X0 .6351 saoo .05130 ,TO43 7011 T9 .3361 1.00M /嘲 .3573 G6K Y4 .9200 L.COOO 汽畑 77H .8EB3 T5 .6021 .obW .症d .F;403 1.1XCO .sum 哪 .7B7T .7M0 .7T44 1. .S2d: .7471 T7 .拠1 .阿8 .9GM .㈤因 .8241 J.OOOO T8 .9348 .8576 .96S3 •641G .BISO L0000 表2(第二组变量的自相关系数阵) 表1和表2分别为两组变量的自相关系数阵。 反映了各组内变量间的相关系数。 TL ¥5 YE Y2 TJ n yi .6103 -6? 45 ■昶旨 .0T6& *4395 .£191 血歹 .76M .8248 .3106 .aeoi .9843 .3046 皿34 : VfE ■B4B8 .S>74 .3030 .10ST .5747 .4514 .0264 H4 .4356 .5966 .9446 .3S36 ^6TG .5253 .4ae4 .4441 .5333 •BBBO h43>4 M90T ”DBL8 .-173 .5727 5595 .1340 .5414 &421 .0820 .7M2 表3(两组变量间的相关系数阵) 表3为两组变量间的相关系数。 从表中可以看出,第一组变量中的X1,X2,X3与第二组变量中的Y3, Y4,Y5之间相关系数较高,这进一步说明需要提取典型变量来代表这种相关性。 值得注意的是,由于变量间的交互作用,这个简单相关系数阵只能作为参考,不能真正反映两组变量间的实质联系。 CaiiftiiiealCorielaticas 1.991 2・83B 3,635 4.492 5・39G 6,218 表4(典型相关系数) 表4为典型相关系数。 从表中可以看出,第一对典型变量相关系数为0.991,第二对典型变量相关系数为 0.838,以此类推共有6对典型变量的典型相关系数。 由于此处的典型相关系数是从样本数据算得的,和简单相关系数一样,有必要进行总体系数是否为0的检验(见表5)。 Test that工書朮么iniiiEcorrelations arezero: bilk's Chi-SQ DF Sig 1 .002 142.S14 48.000 .000 2 _097 5S.404 35.000 .030 3 .328 25.no 24.000 ・400 4 10.875 15.000 .761 5 _S03 4.932 S_000 .765 6 .953 1,095 3-000 .778 表5(典型相关系数的显著性检验) 表5为典型相关系数的显著性检验。 该表从左至右分别为Wilks统计量、卡方统计量、自由度和伴随概率。 从表中伴随概率可以看出,第一对和第二对典型变量的典型相关系数显著不为0;从第三对典型变量开始, 典型相关系数的p值都比较大,均相关性不显著。 因此需要第一对和第二对典型变量。 StajiiiariiseilCajipnlcaLCoetffax5&t_l 12 4 XL -»,289 499 2.384 4099 -L.60A -1.032 X2 s361 -1.670 -2.fli64 .ad/ .27? 1.4L6 X3 .506 Z501 -8.604 一乩512 -,946 X4 h027 .960 -3.664 3.463 6.116 747 X5 -.004 191 .573 221 65D .870 溜 OSG 233 .44D 151 1.0? 0 -.994 表6(第一组典型变量的标准化系数 ) Faw Canonical' Coeffiiientsfot 1 Set-] J 7 4 Hl -.001 .002 .009 .^18 -.006 -.004 J{2 -.oci -.0C4 00? .002 .001 •M3 K3 -.001 .002 .010 -.033 -.021 -.004 X4 .OOC .010 -02G .034 .o&o .007 鬲 -.00: 3 *008 '003 013 -.001 -.002 .004 -.002 .000 -,oos 表7(第一组典型变量的为标准化系数) Standordi.zcdC=mciiicalCoe^fic: ieiitsftHSet-2 123 45 6 .2EL -.6.24 571 L.333 .106 -3.135 一一也d -.B38 -1.529 .3M .341 .5^5 V3 10& ・BS" .27E 931 占19 3,D12 .251 -1.G0O 5.050 000 -1.444 E*05G T5 -.Ml .992 -.5餌 -.311 .016 -1.785 料 .C32 0? 3 .需1 -.402 1.143 .HO 严 -.饷门 .8L6 -2.277 -2.471 -1.217 -.223 -.0S3 -.273 .剧 -.ESO .£甜 -1.0^ 表8(第二组典型变量的标准系数) Raw CisnctnicalCoei£icientsifoz 1 Set-2 z aq Y1 OOL -,D03 -.002 .009 .001 -.014 T2 -013 104 -.©5 .筛£ .117 Y3 二001 .DO? .0D2 .003 .006 .024 ¥4 001 004 .001 -.OOd .MB 一*UQ3 *OIL -+3O7 -*讥4 +Q00 Y6 000 .000 .003 -.002 .C06 .001 T7 *Ooo Oos -*01B -,QO9 -,C02 花 「001 -.004 .011 -,ocs +oio -.01? 表9(第二组典型变量的未标准系数) 6和表8中第一列和第二列数据可以得到第 表6-表9为各典型变量标准化与未标准化的系数列表。 从表对典型变量的线性函数,分别为 Canonical Loarfir.es forSet-1 1 2 3 4 5 11 -.98d .124 .031 .091 -.034 .CIS 12 -bS7SI 二173 -033 010 二.021 r03S 13 -.Q74 .21^ -.009 -.071 .004 .028 X4 *.S26 -.001 .C88 .砌 15 -.272 -.056 .224 一575 第 -.61^ -.B6B ・172 -.077 .265 467 表 10(第 '组的典型载荷系数) CxosgLqadlngsloi Sei-L 1 2 C 4 3 G XI ^.976 .104 .056 .044 -.013 ■004 X2 一曲 -.150 -.067 .00S -.008 一(K迫 X3 -,SS5 *173 -.m -.004 .001 +006 X4 -.916 ”302 -045 -.01(. .010 X5 -.E37 .228 .342 -.OCT .0S9 .12S 丽 一冋9 46E .117 -,<>37 .105 -w 表 11(第一 组的交叉载荷系数) Canonical Leadings forSet-2 1 2 S 4 & 6 yi -.ess -.629 .023 .055 -,C69 -.120 Y2 -..47 -.532 -.321 .033 .300 .116 Y3 -.wd -.31P .0® .083 .027 .110 Y4 -.ass .501 .102 •.077 -.IM .025 Y5 -.see 139 -,00(3 .036 -.072 驚 -.563 -.625 .033 -.344 .339 -.033 V7 -.£S9 -.66S -.014 25S -■166 =.01S 73 -.73B -.505 .155 -.13B *2E4 -.052 表12(第二组的典型载荷系数) Crrss Lio^dings farSet—2 12 34 Y1 -.082 &2? .016 .027 -027 -.026 T2 -.740 -■虫& -.220 h016 ■册 .OSE Y3 -,386 2S3 .040 011 .024 T4 -,318 .070 -.037 -.054 .005 Y5 --97T .Ilf -.(J02 <001 -016 T6 -,548 -.440 057 -.166 .134 -.007 T7 -.093 -.(174 -.010 -.123 -.062 -.003 TB -.731 42S .107 -.0S6 .0C9 -.011 表13(第二组的交叉载荷系数) 表10-表13为典型载荷系数与交叉载荷系数的输出结果。 其中,典型载荷系数是典型变量与本组观测变量之间的两两简单相关系数。 交叉载荷系数是指某一典型变量与另外一组中的观测量之间的两两简单相关。 PrcporticnofVarianceofSet-1ExplainedbyItsOimCan.Vai. PropVar CV1-1 CV1-2 CV1-5 CV1-4 CV1-5 CV1-6 .733 .101 050 .004 ・022 ・091 rzoportionofVariance CV2-1 CV2-2 CV2-3 CV2-4 CV2-5 CV2-6 PropoxtionofVariance CV2-1 cva-2 CV2-3 CV2-4 cva-e CV2-6 表14 cfSet_lExpla.ined PropVar 720 .071 .023 001 .003 表15 ofExplained Frap7ax ・503 23S .019 ・02S ・O32 -006 byOppositeCan,Vaz. byIteOwnCan.Yaii 表16 Proportiono£Variance□£Set^2Esplamed,byOpposrieCan.Vax・PafopVar CV1-1 CV1-2 .167 CV1-3 CV1-4 .006 CV1-5 CV1-5 ■QW 表17 表14-表17为冗余分析的输出结果。 它说明了各典型变量对各变量组方差解释的比例。 冗余分析包括组内代表比例和交叉解释比例,是典型相关分析中很重要的部分。 (1)组内代表比例是指本组所有观测变量的总标准方差中由本组形成的各个典型变量所分别代表的比 例。 从表中可以看到第一组变量被自身的第一个变量揭示了73.3%,被自身的第二个典型变量揭示 了10.1%,以此类推;第二组变量被自身的第一个典型变量揭示了72%,自身的第二个典型变量揭 示了7.1%。 (2)交叉解释比例是指一组变量形成的典型变量对另一组观测变量的总标准方差所解释的比例,是一种 组间交叉共享比例。 从表中可以看到第一组变量被第二组变量的第一个典型变量揭示了60.3%,被 第二个典型变量揭示了23.8%;第二组变量被第一组变量的第一个典型变量揭示了59.2%,被第二 个典型变量揭示了16.7%。 五、实验总结 典型相关分析是一种采用类似主成分分析的做法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),通过研究两组的综合指标之间的关系来反映两组变量之间的相关关系•在实际中, 只须着重研究相关关系较大的那几对典型相关变量•通过实例分析,我们进一步明确了典型相关分析是研究 两组变量之间相关性的一种降维技术的统计分析方法•而复相关是典型相关的一个特例,简单相关是复相关 的一个特例•第一对典型相关包含有最多的有关两组变量间相关的信息,第二对其次,其他对依次递减•各对 典型相关变量所含的信息互不重复•并且经标准化的两组变量之间的典型相关系数与原始的两组变量间的 相应典型相关系数是相同的•通过实验,能够进一步对SPSS软件更熟悉应用。 实验报告成绩(百分制) 实验指导教师签字:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型 相关 分析