项目二相关与回归分析案例及练习要求.docx
- 文档编号:24954158
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:14
- 大小:29.26KB
项目二相关与回归分析案例及练习要求.docx
《项目二相关与回归分析案例及练习要求.docx》由会员分享,可在线阅读,更多相关《项目二相关与回归分析案例及练习要求.docx(14页珍藏版)》请在冰豆网上搜索。
项目二相关与回归分析案例及练习要求
项目二-相关与回归分析案例及练习要求
项目二:
相关与回归分析
一、实验目的
1、掌握Pearson简单相关分析方法,并根据相关系数判断两变量的相关程度。
2、熟悉偏相关系数、Kendalltau-b和Spearman等级相关系数的计算方法,理解其区别与联系。
3、掌握一元与多元回归分析方法,对回归模型估计和检验,并对结果进行分析。
4、了解曲线回归分析方法。
并对回归结果进行分析。
二、实验内容和要求
1、现有杭州市区1978-2014年的GDP、城镇居民年人均可支配收入和年人均消费支出的数据资料(example1.sav),如下:
表5-1杭州市区GDP、年人均可支配收入、人均消费支出和CPI指数
年份
GDP(亿元)
人均可支配收入(元)
人均消费支出(元)
定基CPI指数(%)
1978
14.1995
338
301
100.1
1979
16.7206
396
365
100.5
1980
20.8220
521
491
101.3
1981
22.9243
540
513
103.3
1982
24.8297
532
532
105.4
1983
28.2171
578
535
107.6
1984
35.3781
729
679
110.9
1985
44.8574
1026
908
130.0
1986
51.3639
1169
1072
137.8
1987
60.5234
1260
1118
152.3
1988
70.8474
1565
1515
185.7
1989
77.2208
1764
1615
218.7
1990
89.6496
1985
1685
228.8
1991
109.6628
2128
1894
245.9
1992
141.3287
2580
2296
271.5
1993
208.6571
3525
3183
329.6
1994
278.8314
5249
4559
400.5
1995
369.7794
6301
5559
466.5
1996
472.7377
7206
6095
515.5
1997
541.4265
7896
6766
550.1
1998
590.5726
8465
7235
560.0
1999
631.7335
9085
7424
562.2
2000
711.1586
9668
7790
566.7
2001
1226.0891
10896
8968
563.9
2002
1404.2278
11778
9215
557.1
2003
1664.7332
12898
9949.76
554.3
2004
2036.2738
14565
11212.78
568.2
2005
2349.5459
16601
13438
577.8
2006
2748.3121
19026.86
14471.74
584.8
2007
3273.8842
21689.36
14895.75
605.2
2008
3813.9834
24103.58
16719.10
634.9
2009
4069.8687
26863.93
18594.75
626.0
2010
4740.7788
30035
20219
650.4
2011
5589.8574
34065
22642
681.6
2012
6213.2486
37511
22800
698.7
2013
6639.8609
39310
24833
716.1
2014
9201.1600
44632
32165
730.5
数据来源:
历年《杭州统计年鉴》和《2014年杭州市国民经济和社会发展统计公报》。
要求:
(1)求人均可支配收入、GDP、人均消费性支出与消费价格指数的双变量Pearson相关系数。
相关性
income
bcpi
income
Pearson相关性
1
.841**
显著性(双侧)
.000
N
37
37
bcpi
Pearson相关性
.841**
1
显著性(双侧)
.000
N
37
37
**.在.01水平(双侧)上显著相关。
相关性
gdp
bcpi
gdp
Pearson相关性
1
.751**
显著性(双侧)
.000
N
37
37
bcpi
Pearson相关性
.751**
1
显著性(双侧)
.000
N
37
37
**.在.01水平(双侧)上显著相关。
相关性
payout
bcpi
payout
Pearson相关性
1
.873**
显著性(双侧)
.000
N
37
37
bcpi
Pearson相关性
.873**
1
显著性(双侧)
.000
N
37
37
**.在.01水平(双侧)上显著相关。
(2)画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并给出方程的估计标准误差。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.994a
.989
.988
912.186
a.预测变量:
(常量),income。
(3)求人均可支配收入倚GDP的直线回归方程。
解释方程结果,并给出方程的估计标准误差。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.985a
.969
.969
2250.284
a.预测变量:
(常量),gdp。
(4)求人均消费支出倚GDP的直线回归方程。
解释方程结果,并给出方程的估计标准误差。
模型汇总和参数估计值
因变量:
payout
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
线性
.952
698.757
1
35
.000
2500.690
3.553
自变量为gdp。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.976a
.952
.951
1865.083
a.预测变量:
(常量),gdp。
(5)若将GDP的单位改为万元,再做第3和第4题,观察单位变化对回归方程的影响。
无影响
(6)求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
(7)求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
(8)以定基居民消费价格指数为控制变量,对居民年人均可支配收入和消费支出进行偏相关分析。
(9)计算居民年人均消费支出倚GDP,居民年人均可支配收入和消费价格指数的多元线性回归方程,确定最终模型并对估计结果进行解释。
*(10)求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:
一个变量Y对另一个变量X的弹性系数E定义为:
E=Y的增长率÷X的增长率)。
2、由表5-2所示的2013年浙江省各地级市GDP、第三产业就业人数数据资料(example2.sav),进行Kendalltau-b和Spearman等级相关分析。
表5-22013年浙江省11地市经济数据单位:
亿元/万人
地区
杭州
宁波
嘉兴
湖州
绍兴
舟山
GDP
8343.52
7128.87
3147.66
1803.15
3967.29
930.85
三产就业人数
288.93
200.44
101.82
63.52
114.00
30.98
地区
温州
金华
衢州
台州
丽水
--
GDP
4003.86
2958.78
1056.57
3153.34
983.08
--
三产就业人数
259.56
113.51
40.14
147.14
50.54
--
数据来源:
《2014年浙江统计年鉴》。
练习
一、请打开数据文件exercise1.sav,该数据文件是有关浙江省人均可支配收入、服务业产值等基本信息资料。
试根据文件中的数据资料,运用SPSS软件进行以下分析。
1、Pearson线性相关分析:
计算城镇居民人均可支配收入、地区生产总值、服务业产值和服务业就业人数的Pearson线性相关系数和sig值,并判断变量间的相关程度。
表1双变量间的Pearson线性相关系数
居民人均可支配收入
地区生产总值
服务业
产值
服务业就业人数
居民人均可支配收入
地区生产总值
服务业产值
服务业就业
人数
相关性
城镇居民可支配收入
地区生产总值
服务业产值
服务业城镇就业人数
城镇居民可支配收入
Pearson相关性
1
.995**
.990**
.996**
显著性(双侧)
.000
.000
.000
N
30
30
30
30
地区生产总值
Pearson相关性
.995**
1
.998**
.997**
显著性(双侧)
.000
.000
.000
N
30
30
30
30
服务业产值
Pearson相关性
.990**
.998**
1
.995**
显著性(双侧)
.000
.000
.000
N
30
30
30
30
服务业城镇就业人数
Pearson相关性
.996**
.997**
.995**
1
显著性(双侧)
.000
.000
.000
N
30
30
30
30
**.在.01水平(双侧)上显著相关。
相关程度判断:
各项Sig<0.01,表明在置信度99%下,相关系数在0.990到0.998之间,高度相关
2、偏相关分析:
以地区生产总值为控制变量,计算双变量的偏相关系数和sig值,并将计算结果填入下表。
居民人均可支配收入
服务业产值
服务业就业人数
居民人均可支配收入
服务业产值
服务业就业人数
相关性
控制变量
城镇居民可支配收入
服务业产值
服务业城镇就业人数
地区生产总值
城镇居民可支配收入
相关性
1.000
-.464
.497
显著性(双侧)
.
.011
.006
df
0
27
27
服务业产值
相关性
-.464
1.000
-.002
显著性(双侧)
.011
.
.993
df
27
0
27
服务业城镇就业人数
相关性
.497
-.002
1.000
显著性(双侧)
.006
.993
.
df
27
27
0
3、一元线性回归分析
(1)建立居民人均可支配收入倚服务业产值的直线回归方程,将计算结果填入下表:
表2居民人均可支配收入的一元线性回归
回归系数
T值
P值
常数项
3205.977
7.814
0.000
服务业产值
2.050
36.912
0.000
得到的线性回归方程:
Y=3205.977+2.050X。
(2)分析回归模型的判别系数及其含义:
P值等于0,小于0.05,表明拟合效果显著。
(3)回归方程的经济含义是,服务业产值每增加1亿元,_城镇居民可支配收入增加2.050元。
_
(4)回归方程整体显著性检验sig<0.05,整体拟合效果显著。
4、多元线性回归分析
(1)建立以居民人均可支配收入为因变量,外商直接投资和服务业就业人数
为自变量的直线回归方程,将计算结果填入下表:
表3居民人均可支配收入的多元线性回归
回归系数
T值
P值
共线性统计量
容差
VIF
常数项
-5714.828
-7.241
.000
服务业就业人数
38.607
10.826
.000
.043
23.335
外商直接投资
34.240
1.886
.070
.043
23.335
得到的线性回归方程:
居民可支配收入=-5714.828+38.607*服务业就业人数+34.240*外商直接投资。
(2)分析回归模型的判别系数及其含义:
服务业就业人数的P值小于0.05,拟合效果显著,外商直接投资的P值大于0.05,效果不显著。
(3)假设服务业就业人数不变时,外商直接投资每增加1万美元,_居民可支配收入增加34.240元。
_
(4)回归方程整体显著性检验表二中的sig小于0,。
05,整体拟合效果显著。
(5)回归方程的多重共线性诊断结果
。
(6)对模型实施逐步向后回归,请写出回归估计方程和主要诊断结果:
。
5、曲线回归分析
(1)曲线回归的系数表
表4居民人均可支配收入的二次回归
回归系数
标准误
T值
P值
常数
2037.735
320.832
6.351
.000
服务业产值
2.824
.126
22.371
.000
服务业产值2
-4.669E-5
.000
-6.389
.000
(2)以城镇人均可支配收入为因变量,服务业产值为自变量,估计的二次方程是居民人均可支配收入=2037.735+2.824*服务业产值+(-4.669E-005)*(服务业产值)^2
(3)二次方程的判定系数R2=0.992,标准误为1097.108,而对比原线性回归时,R2=0.980,标准误差为1707.499,因此,二次方程比线性回归的拟合效果更好。
(4)方差分析结果,F值为1670.577,显著性水平为0.000,方程具有统计显著性。
6、等级相关分析
请打开数据文件exercise2.sav,该数据文件是2013年浙江省各地市GDP和年末高校在校生人数的基本信息资料。
试根据文件中的数据资料,运用SPSS软件进行以下分析。
表52013年浙江省11地市的GDP和高校在校生人数单位:
亿元/人
地区
杭州
宁波
嘉兴
湖州
绍兴
舟山
GDP
8343.52
7128.87
3147.66
1803.15
3967.29
930.85
高校在校生人数
471820
148954
63731
26673
77532
23301
地区
温州
金华
衢州
台州
丽水
--
GDP
4003.86
2958.78
1056.57
3153.34
983.08
--
高校在校生人数
79158
81281
12937
32018
39750
--
数据来源:
《2014年浙江统计年鉴》。
按GDP规模排序后,结果见下表:
表62013年浙江省11地市的GDP和高校在校生人数排序表
地区
舟山
丽水
衢州
湖州
金华
嘉兴
GDP排序
1
2
3
4
5
6
高校在校生人数
2
5
1
3
9
6
地区
台州
绍兴
温州
宁波
杭州
--
GDP排序
7
8
9
10
11
--
高校在校生人数
4
7
8
10
11
--
(1)GDP与高等学校在校生人数的Pearson线性相关系数为0.845,显著性水平P=0.001,因此GDP与高等学校在校生人数的线性相关程度是不完全相关。
(2)GDP与高等学校在校生人数的Kendalltau-b等级相关系数为0.673,显著性水平为0.004,因此GDP与高等学校在校生人数的等级相关方向为正,表示。
(3)GDP与高等学校在校生人数的Spearman等级相关系数为0.809,显著性水平为P=0.003,因此GDP与高等学校在校生人数的等级相关是正向的,表示。
(4)分别使用原始数据和排序后的数据计算Kendalltau-b和Spearman等级相关系数,请问计算的结果是否一致?
原因是什么?
结果一致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 项目 相关 回归 分析 案例 练习 要求