实验五相关与回归分析Word格式.docx
- 文档编号:21723150
- 上传时间:2023-01-31
- 格式:DOCX
- 页数:16
- 大小:23.54KB
实验五相关与回归分析Word格式.docx
《实验五相关与回归分析Word格式.docx》由会员分享,可在线阅读,更多相关《实验五相关与回归分析Word格式.docx(16页珍藏版)》请在冰豆网上搜索。
5.若将GDP的单位改为亿元,再做第3和第4题,观察单位变化对回归方程的影响。
6.求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
7.求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
8.求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数。
【方案设计】
(1)根据变量的观测数据绘制散点图;
(2)计算相关系数,说明相关程度和方向;
(3)建立直线(曲线)回归方程;
(4)计算回归方程的估计标准误差和判定系数;
(5)对方程进行解释和应用等
【实验(实训)过程】
(步骤、记录、数据、程序等)
在国家统计局网站上找到浙江省GDP、浙江省城镇人均可支配收入、浙江省城镇人均消费性支出的相关数据。
(目前提供:
2002年-2012年的数据)并将其录入Spss中,如下图所示:
1.分别求人均可支配收入与GDP、人均消费性支出与GDP、人均可支配收入与人均消费支出的相关系数。
方法:
在Spss工具栏中选择:
分析-相关-双变量-加入GDP,income。
Paycome—确定,得到如下所示的图表:
2.画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并找出方程的估计标准误差。
1)在Spss工具栏中选择:
图表-散点图-选择income为x轴,payout为y轴。
(两种方法)-确定,得到如下所示的图表:
2)然后又在Spss工具栏中选择:
分析-回归-线性-将payout放起上,income放下-确定,得到如下的表格:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
incomea
.
输入
a.已输入所有请求的变量。
b.因变量:
payout
模型汇总
R
R方
调整R方
标准估计的误差
.996a
.993
.992
385.79526
a.预测变量:
(常量),income。
Anovab
平方和
df
均方
F
Sig.
回归
1.778E8
1194.728
.000a
残差
1339541.821
9
148837.980
总计
1.792E8
10
系数a
非标准化系数
标准系数
t
B
标准误差
试用版
(常量)
2525.039
367.796
6.865
.000
income
.565
.016
.996
34.565
a.因变量:
方法:
1)在Spss工具栏中:
图表-散点图-选择GDP为x轴,income为y轴。
(两种方法)-确定,得到的图像如下所示:
2)在Spss工具栏中:
分析-回归-线性-将income放起上,GDP放下-确定,得到如下所示的图表:
GDPa
income
.998a
484.24032
(常量),GDP。
5.549E8
2366.354
2110398.186
234488.687
5.570E8
5153.534
363.457
14.179
GDP
.823
.017
.998
48.645
图表-散点图-选择GDP为x轴,payout为y轴。
(两种方法)-确定,得到如下的图形:
分析-回归-线性-将payout放起上,GDP放下-确定,得到如下的图表:
.991
.990
421.65884
1.776E8
998.673
1600165.576
177796.175
5426.245
316.485
17.145
.466
.015
31.602
注:
若将GDP的单位改为亿元,再做第3和第4题,观察单位变化对回归方程的影响。
将GDP的单位变为亿元,则在Spss工具栏中:
转换-计算变量-GDP1=GDP/10000,
得到新的GDP如下所示:
此时,按照上面的方法一次做3,4,得到的图形为:
GDP1a
(常量),GDP1。
GDP1
8230.001
169.184
4655.561
147.320
图表-散点图,先观察散点图的特性,选择使用什么回归比较好。
2)通过观察,得知选择曲线回归比较好,则在Spss工具栏中:
分析-回归-曲线-income上,GDP下-选择Quadratic和displayANOVAtable-确定,得到如下所示的表格:
模型描述
模型名称
MOD_1
因变量
方程
二次
自变量
常数
包含
其值在图中标记为观测值的变量
未指定
用于在方程中输入项的容差
.0001
个案处理摘要
N
个案总数
11
已排除的个案a
已预测的个案
新创建的个案
a.从分析中排除任何变量中带有缺失值的个案。
变量处理摘要
变量
正值数
零的个数
负值数
缺失值数
用户自定义缺失
系统缺失
估计值的标准误
.995
511.125
自变量为GDP。
ANOVA
2
2.775E8
1062.022
2089989.330
8
261248.666
系数
未标准化系数
标准化系数
标准误
Beta
.795
.103
.964
7.717
GDP**2
6.675E-7
.035
.280
.787
(常数)
5403.084
971.774
5.560
.001
数据一般默认3位,修改具体为:
(1)SPSS默认显示至小数点后3位,因此当数字小于1/1000时就只能显示0.000了。
所以这种情况并不代表这个数字为0,而是表示它小于1/1000。
要想显示完整数字,可以采取如下方法:
双击输出表格,右键点击显示0.000的格子,选择“单元格属性”,在“格式值”选项卡中选择“小数”项上增加小数点位数至你所需要的位数。
注意,如果你增加的小数点位数较多,而格子又不够宽,此时就会显示×
×
。
你只需要重新双击表格,然后双击显示×
的格子,然后拖动格子的边框加宽格子的宽度就可以了
修改后的数据表格如下所示:
0.000002388
具体步骤与6一样,实验得到的表格如下所示:
415.650
8.889E7
514.509
1382119.049
172764.881
.558
.084
1.194
6.666
-2.182E-6
0.00000194
-.201
-1.123
.294
4610.559
790.253
5.834
8.求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数。
一个变量Y对另一个变量X的弹性系数E定义为:
E=Y的增长率÷
X的增长率,所以需要在SPSS中选用幂函数power。
.026
1.253
1863.628
.006
1.259
ln(GDP)
.725
43.170
16.689
2.747
6.076
因变量为ln(income)。
.027
.873
1239.774
.879
.605
35.210
37.506
6.317
5.937
因变量为ln(payout)。
【结论】
(结果、分析)
(2)标准化系数与非标准化系数
SPSS进行线性回归,得到的系数结果有标准化和非标准化,一般采用非标准化的回归系数。
两者的主要区别有:
①标准化是去除量纲的。
②标准化回归系数体现了变量间的相对重要性,而且与自变量的离散程度有关,如果其波动程度较大,那么就会显得比较重要;
否则,就显得不太重要。
标准化回归系数正是用于检测这种重要性的。
③当需要比较多个自变量对因变量相对作用大小时,可采用标准化回归系数,当只是想解释自变量对因变量的作用时,可采用非标准化的回归系数。
④标准化的常数项是没有值的,因此,标准化的回归系数不能用于回归方程。
标准化的回归系数只是用于自变量间进行比较
三、指导教师评语及成绩:
评语:
成绩:
指导教师签名:
批阅日期:
仅供个人用于学习、研究;
不得用于商业用途。
Forpersonaluseonlyinstudyandresearch;
notforcommercialuse.
Nurfü
rdenpersö
nlichenfü
rStudien,Forschung,zukommerziellenZweckenverwendetwerden.
Pourl'
é
tudeetlarechercheuniquementà
desfinspersonnelles;
pasà
desfinscommerciales.
толькодлялюдей,которыеиспользуютсядляобучения,исследованийинедолжныиспользоватьсявкоммерческихцелях.
以下无正文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 相关 回归 分析