实验报告主成分分析.docx
- 文档编号:6536104
- 上传时间:2023-01-07
- 格式:DOCX
- 页数:8
- 大小:21.19KB
实验报告主成分分析.docx
《实验报告主成分分析.docx》由会员分享,可在线阅读,更多相关《实验报告主成分分析.docx(8页珍藏版)》请在冰豆网上搜索。
实验报告主成分分析
黑龙江八一农垦大学
多元统计分析实验报告
实验项目主成分分析
专业信息与计算科学专业
年级2011级
姓名
学号
黑龙江八一农垦大学文理学院数学实验室
学生实验守则
1、参加实验的学生必须按时到实验室上实验课,按指定的席位操作,不得迟到早退。
迟到10分钟,禁止实验。
2、遵守实验室的一切规章制度,不喧哗,不吸烟,保持室内安静、整洁。
3、学生实验前要认真预习实验内容,接受指导教师的提问和检查。
4、严格遵守操作规程。
5、应认真记录原始数据,填写实验报告,及时送交实验报告。
6、不准动用与本实验无关的仪器设备和室内的其它设施。
7、实验中发生事故时,要保持镇静,并立即采取抢救措施,及时向指导教师报告。
8、损坏实验设备应主动向指导教师报告,由指导教师根据情况进行处理,需要赔偿的应写出书面报告,填写赔偿单。
9、实验结束,将实验结果交实验教师检查,合格后,经指导教师同意后,方可离开实验室。
10、实验完毕后,应按时写出实验报告,及时交指导教师审阅,不交者,该实验无成绩。
实验报告
实验项目名称
主成分分析
实验日期
2013.4.25
理论内容
主成分分析
实验地点
理学203
实验目的及要求:
掌握主成分分析的基本理论,熟练掌握利用SPSS软件系统进行主成分分析的步骤,会找出合理的主成分,建立主成分模型和综合评价模型,进行主成分得分排序。
实验内容:
1、熟悉掌握SPSS软件进行主成分分析的基本操作;
2、掌握主成分分析的基本原理;
3、根据下列某地区11年数据
X1(总产值)
X2(存储量)
X3(总消费)
y(进口额)
1
2
3
4
5
6
7
8
9
10
11
149.3
161.2
171.5
175.5
180.8
190.7
202.1
212.4
226.1
231.9
239.0
4.2
4.1
3.1
3.1
1.1
2.2
2.1
5.6
5.0
5.1
0.7
108.1
114.8
123.2
126.9
132.1
137.7
146.0
154.1
162.3
164.3
167.6
15.9
16.4
19.0
19.1
18.8
20.4
22.7
26.5
28.1
27.6
26.3
(1)计算地区总产值、存储量和总消费的相关系数矩阵;
(2)求特征根及其对应的特征向量;(3)求出主成分及每个主成分的方差贡献率;(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。
主成分分析基本原理:
设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。
操作步骤及运行结果:
(1)先进行如下步骤:
分析——>降维——>因子分析.然后,把X1,X2,X3移入变量列表。
接下来,点击“描述”,在描述统计框中的相关矩阵框中勾选系数。
即出如下结果:
相关矩阵
X1(总产值)
X2(存储量)
X3(总消费)
相关
X1(总产值)
1.000
.026
.997
X2(存储量)
.026
1.000
.036
X3(总消费)
.997
.036
1.000
(2)解释的总方差表中的合计栏即为特征根
,主成分中的系数
即为特征向量。
所以,首先得出解释的总方差和成分矩阵如下:
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
1.999
66.638
66.638
1.999
66.638
66.638
2
.998
33.272
99.910
.998
33.272
99.910
3
.003
.090
100.000
.003
.090
100.000
提取方法:
主成份分析。
所以特征根为:
1=1.999
2=0.998
3=0.003
成份矩阵a
成份
1
2
3
X1(总产值)
.999
-.036
.037
X2(存储量)
.062
.998
.000
X3(总消费)
.999
-.026
-.037
提取方法:
主成份。
a.已提取了3个成份。
由主成分系数计算公式:
成分矩阵中主成分对应的数值/
,得特征根
1、
2、
3对应特征向量为:
(0.7070.0440.707)(-0.0360.999-0.026)(0.6760.000-0.676)
(3)先进行如下步骤:
分析——>降维——>因子分析.然后,把X1,X2,X3移入变量列表。
接下来,点击“描述”,在选择描述中统计量栏的原始分析结果前打勾。
即出如下结果:
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
1.999
66.638
66.638
1.999
66.638
66.638
2
.998
33.272
99.910
.998
33.272
99.910
3
.003
.090
100.000
提取方法:
主成份分析。
从上表我们可知,主成分主要是第一,第二主成分。
两者累积贡献率达99.910%。
第一主成分方差贡献率为66.638%,第二主成分方差贡献率为33.272%。
分析——>降维——>因子分析.然后,把X1,X2,X3移入变量列表。
通过做成分矩阵,出如下结果:
成份矩阵a
成份
1
2
X1(总产值)
.999
-.036
X2(存储量)
.062
.998
X3(总消费)
.999
-.026
提取方法:
主成份。
a.已提取了2个成份。
由主成分系数计算公式:
成分矩阵中主成分对应的数值/
,得出主成分一的系数(0.7070.0440.707)主成分二的系数(-0.0360.999-0.026)。
所以,主成分一得分公式:
F1=0.707*X1+0.044*X2+0.707*X3
主成分二得分公式:
F2=(-0.036)*X1+0.998*X2+(-0.026)*X3
(4)分析——>降维——>因子分析.然后,把X1,X2,X3移入变量列表。
接下来,点击“得分”,在得分栏中勾选保存为变量。
然后以主成分得分FAC1_1,FAC2_1为自变量,y为因变量,在回归下做逐步线性回归方程。
如下表:
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
21.891
.317
69.011
.000
REGRfactorscore1foranalysis1
4.433
.333
.976
13.324
.000
2
(常量)
21.891
.166
132.006
.000
REGRfactorscore1foranalysis1
4.433
.174
.976
25.486
.000
REGRfactorscore2foranalysis1
.868
.174
.191
4.993
.001
a.因变量:
y(进口额)
由上表得回归方程:
y=21.891+4.433*F1+0.868*F2
把主成分F1、F2的表达式代入得
y=21.891+4.433(0.707*X1+0.044*X2+0.707*X3)+0.868[(-0.036)*X1+0.998*X2+(-0.026)*X3]
=21.891+3.103X1+1.061X2+3.112X3
即y=21.891+3.103X1+1.061X2+3.112X3
结果分析与讨论:
通过主成分分析,将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计,得到所需要的回归方程。
实验报告评分标准
评分项目
满分
得分
评分项目
满分
得分
基本原理
3
操作步骤与运行结果
7
结果分析与讨论
5
合计
15
授课教师
田宏
批阅日期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 报告 成分 分析