应用多元统计分析课程设计Word文件下载.docx
- 文档编号:20731683
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:12
- 大小:53.16KB
应用多元统计分析课程设计Word文件下载.docx
《应用多元统计分析课程设计Word文件下载.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析课程设计Word文件下载.docx(12页珍藏版)》请在冰豆网上搜索。
指导教师:
201年月日
专业负责人:
201年月日
学院教学副院长:
摘要
随着经济的飞速发展,居民的住房问题日益突出,就各地区农村居民的住房情况进行调查,为了更好的将我们学过的知识运用到实际中所以我们可以运用学过的应用多元统计分析和SPSS软件对各地区农村居民住房进行因子分析。
关键词:
住房问题,因子分析
1.设计问题
随着我国社会经济的发展,人口的增多,居民的住房问题逐渐凸现出来,就我国各地区的农村居民住房问题的研究来说明各地区的经济发展和农村人口数等关系?
2.设计原理
因子分析根据变量之间相关性的大小,对变量进行分组,使得组内的变量之间相关性较高,而组间变量的相关性较低。
每组变量代表一个基本结构,即公共因子。
从而将众多变量转换为少数几个公共因子。
计算样本在各个公共因子上的得分,可以挖掘出样本的问题所在。
通过计算样本的加权公共因子得分,可以对样本进行综合评价。
因子分析的一般模型如下:
(1)
一般而言,m远少于p,m的选取一般根据相关系数矩阵特征根大于1的个数来确定。
其中因子分析的出发点是相关系数矩阵,上述因子载荷系数
可以基于主成分法、主轴因子法、极大似然法、综合最小平方法或a因子法等方法进行估计。
通过回归法或Bartlett法等建立公共因子与原始变量的线性组合,从而求得各因子的得分。
3.设计分析
1.在spss中输入数据,如下图:
表_3.1各地区农村居民家庭住房情况(2011年)
地区
住房面积
住房价值
住房结构(平方米/人)
(平方米/人)
(元/平方米)
钢筋混凝土结构
砖木结构
全国
36.24
654.37
16.48
15.92
北京
38.08
2101.58
10.48
27.44
天津
30.22
1600.45
5.70
24.50
河北
34.11
684.38
9.66
22.96
山西
29.92
547.44
7.30
18.95
内蒙古
24.25
479.53
1.23
16.72
辽宁
28.86
813.82
6.61
21.70
吉林
24.44
585.09
0.16
22.72
黑龙江
24.82
813.15
0.82
20.38
上海
58.90
2372.36
21.91
36.97
江苏
49.34
833.19
26.20
23.00
浙江
61.38
1280.05
43.04
16.87
安徽
34.59
591.84
20.13
13.95
福建
49.82
791.05
36.42
10.32
江西
46.02
469.12
37.03
7.29
山东
36.31
552.19
11.19
24.45
河南
36.45
493.11
19.29
16.61
湖北
44.24
538.02
24.90
15.00
湖南
46.40
431.89
20.71
23.89
广东
30.73
832.44
23.75
4.75
广西
34.90
454.41
27.57
5.52
海南
24.22
842.09
11.07
13.07
重庆
39.73
454.11
18.54
17.06
四川
37.71
489.55
16.65
14.62
贵州
29.41
519.81
10.79
14.70
云南
30.88
573.20
8.80
7.09
西藏
28.47
314.52
0.76
14.07
陕西
35.76
613.65
17.83
11.04
甘肃
23.65
537.26
4.12
9.30
青海
26.81
461.27
2.48
11.48
宁夏
24.38
480.91
1.73
16.59
新疆
26.14
452.36
2.30
13.47
2.再打开分析菜单找出因子分析,如下图:
在spss中的分析菜单中找到因子分析,并将住房价值,住房面积,住房结构(混泥土结构,木质结构)设为变量。
3.调整各项指标如(描述,抽取,旋转,得分,选项),并进行分析。
4.设计结果
4.1得出以下结果
在SPSS中得到表4_1到4_5.
因子分析
表4_1公因子方差
初始
提取
1.000
.950
.798
混泥土结构
.981
木架结构
.873
提取方法:
主成份分析。
表4_1是从住房面积,住房价值,住房结构(混泥土结构,木架结构)4个变量中提取
公因子如表4_1所示。
表4_2解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
1
2.130
53.255
1.877
46.923
2
1.471
36.787
90.041
1.725
43.119
3
.356
8.910
98.952
4
.042
1.048
100.000
从表4_2可以看出,选取两个因子运算后,累计方差达到90.041%>
85%,符合了一般性选取公
共因子的要求。
表4_3成份矩阵a
.922
-.315
.724
.524
.700
-.701
木质结构
.515
.779
提取方法:
主成分分析法。
a.已提取了2个成份。
根据表4_3可以写出每个原始变量的因子表达式:
从成份矩阵表4_3中可以看出,每个因子在不同的原始变量上的载荷没有明显的差
别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得到表4_4.
表4_4旋转成份矩阵a
.919
.325
.243
.860
.984
-.116
-.079
.931
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛。
从旋转成分矩阵可以看出,旋转后的载荷系数已经明显地两级分化了。
第一个公因子
在指标
上有较大载荷,说明这两项指标有较强的相关性,可以归为一类属于住房
各地区农村人口和农村面积的指标。
第二个公因子在指标
上有较大载荷,同理可
以将这两个指标归为一类,属于各地区农村经济水平的指标。
表4_5成份得分系数矩阵
.472
.101
.046
.490
.553
-.170
-.139
.566
构成得分。
根据表4_5的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分
数,并可以据此对观测量进行进一步的分析。
下面得出旋转后的因子得分表达式写出:
比较直观的得出每个观测值的碎石图和成分图如图所示:
地区F1F2
全国36.24654.3716.4815.920.01288-0.22072
北京38.082101.5810.4827.441.367881.96012
天津30.221600.455.7024.500.426571.72249
河北34.11684.389.6622.96-0.008300.66390
山西29.92547.447.3018.95-0.495210.44326
内蒙古24.25479.531.2316.72-1.040570.59500
辽宁28.86813.826.6121.70-0.272850.90490
吉林24.44585.090.1622.72-0.778491.16981
黑龙江24.82813.150.8220.38-0.658971.13015
上海58.902372.3621.9136.973.121631.97093
江苏49.34833.1926.2023.001.23190-0.22920
浙江61.381280.0543.0416.872.34438-1.30945
安徽34.59591.8420.1313.95-0.06813-0.53286
福建49.82791.0536.4210.321.07417-1.65630
江西46.02469.1237.037.290.58941-2.07408
山东36.31552.1911.1924.450.086500.56675
河南36.45493.1119.2916.610.00910-0.41114
湖北44.24538.0224.9015.000.48314-0.89721
湖南46.40431.8920.7123.890.68788-0.17651
广东30.73832.4423.754.75-0.27652-1.11571
广西34.90454.4127.575.52-0.23417-1.59110
海南24.22842.0911.0713.07-0.624940.18650
重庆39.73454.1118.5417.060.11688-0.44540
四川37.71489.5516.6514.62-0.08345-0.48222
贵州29.41519.8110.7914.70-0.58507-0.03404
云南30.88573.208.807.09-0.80329-0.51933
西藏28.47314.520.7614.07-1.082060.19766
陕西35.76613.6517.8311.04-0.16791-0.66717
甘肃23.65537.264.129.30-1.19898-0.03142
青海26.81461.272.4811.48-1.088620.07710
宁夏24.38480.911.7316.59-1.024490.56218
新疆26.14452.362.3013.47-1.060310.24312
2.对以上结果进行分析
由以上表格可以得出;
排第一的是上海,第二是北京……
可以看出来,农村的住房面积跟所在地区的农村人口成反比,跟所在地区的经济呈线性关系
农村的住房价格跟所在地区的经济水平呈正相关。
5.设计总结
通过这次课程设计,我知道了因子分析在解决实际问题中有很重要的意义,有些实际问
题解决起来很复杂麻烦,但通过因子以及SPSS软件的结合应用,就能很清楚的得到解决
,给我们带来了很大的方便。
我也更加熟悉了因子分析相关知识以及SPSS软件的应用,
并能很好的运用到实际中去。
通过这次的设计我更加熟悉了用计算机软件来解决数学问题,很多的数学问解决起来很
复杂,但是应用计算机软件就可以轻松的解决这些问题,用SPSS中自带的软件非常方便。
而
且通过本次的设计我彻底的了解了因子分析的意义以及应用,我也会学习更多的数学相关知识
,并运用到学习和生活中,相信这对我今后的学习和生活都会有很大的帮助。
参考文献
(1)《应用多元统计分析》<
第二版>
朱建平
(2)中国统计局年鉴
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 课程设计