实验五相关与回归分析.docx
- 文档编号:8586928
- 上传时间:2023-01-31
- 格式:DOCX
- 页数:16
- 大小:23.54KB
实验五相关与回归分析.docx
《实验五相关与回归分析.docx》由会员分享,可在线阅读,更多相关《实验五相关与回归分析.docx(16页珍藏版)》请在冰豆网上搜索。
实验五相关与回归分析
实验(实训)报告
项目名称相关于回归分析
所属课程名称统计学
项目类型综合
实验(实训)日期2014-06-01
班级12计算机2班
学号120104200206
姓名陈玉洁
指导教师陈雄强
浙江财经大学教务处制
一、实验(实训)概述:
【目的及要求】
实验目的:
1.掌握简单相关分析方法,并根据相关系数判断两变量的相关关系。
2.掌握回归分析方法,并对回归结果进行分析。
实验要求:
以浙江省城镇为例进行分析对人均GDP、居民年人均可支配收入和年人均消费支出的相关变量之间的关系。
【基本原理】
相关分析
回归分析
【实施环境】(使用的材料、设备、软件)
操作系统:
WindowXP编译软件SPSSStatistics17.0
二、实验(实训)内容:
【项目内容】
1.分别求人均可支配收入与GDP、人均消费性支出与GDP、人均可支配收入与人均消费支出的相关系数。
2.画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并找出方程的估计标准误差。
3.画出GDP与人均可支配收入的散点图,求人均可支配收入倚GDP的直线回归方程。
解释方程结果,并找出方程的估计标准误差。
4.画出GDP与人均消费支出的散点图,求人均消费支出倚GDP的直线回归方程。
解释方程结果,并找出方程的估计标准误差。
5.若将GDP的单位改为亿元,再做第3和第4题,观察单位变化对回归方程的影响。
6.求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
7.求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
8.求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数。
【方案设计】
(1)根据变量的观测数据绘制散点图;
(2)计算相关系数,说明相关程度和方向;
(3)建立直线(曲线)回归方程;
(4)计算回归方程的估计标准误差和判定系数;
(5)对方程进行解释和应用等
【实验(实训)过程】(步骤、记录、数据、程序等)
在国家统计局网站上找到浙江省GDP、浙江省城镇人均可支配收入、浙江省城镇人均消费性支出的相关数据。
(目前提供:
2002年-2012年的数据)并将其录入Spss中,如下图所示:
1.分别求人均可支配收入与GDP、人均消费性支出与GDP、人均可支配收入与人均消费支出的相关系数。
方法:
在Spss工具栏中选择:
分析-相关-双变量-加入GDP,income。
Paycome—确定,得到如下所示的图表:
2.画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并找出方程的估计标准误差。
方法:
1)在Spss工具栏中选择:
图表-散点图-选择income为x轴,payout为y轴。
(两种方法)-确定,得到如下所示的图表:
2)然后又在Spss工具栏中选择:
分析-回归-线性-将payout放起上,income放下-确定,得到如下的表格:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
incomea
.
输入
a.已输入所有请求的变量。
b.因变量:
payout
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.996a
.993
.992
385.79526
a.预测变量:
(常量),income。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.778E8
1
1.778E8
1194.728
.000a
残差
1339541.821
9
148837.980
总计
1.792E8
10
a.预测变量:
(常量),income。
b.因变量:
payout
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
2525.039
367.796
6.865
.000
income
.565
.016
.996
34.565
.000
a.因变量:
payout
3.画出GDP与人均可支配收入的散点图,求人均可支配收入倚GDP的直线回归方程。
解释方程结果,并找出方程的估计标准误差。
方法:
1)在Spss工具栏中:
图表-散点图-选择GDP为x轴,income为y轴。
(两种方法)-确定,得到的图像如下所示:
2)在Spss工具栏中:
分析-回归-线性-将income放起上,GDP放下-确定,得到如下所示的图表:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
GDPa
.
输入
a.已输入所有请求的变量。
b.因变量:
income
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.998a
.996
.996
484.24032
a.预测变量:
(常量),GDP。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
5.549E8
1
5.549E8
2366.354
.000a
残差
2110398.186
9
234488.687
总计
5.570E8
10
a.预测变量:
(常量),GDP。
b.因变量:
income
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
5153.534
363.457
14.179
.000
GDP
.823
.017
.998
48.645
.000
a.因变量:
income
4.画出GDP与人均消费支出的散点图,求人均消费支出倚GDP的直线回归方程。
解释方程结果,并找出方程的估计标准误差。
方法:
1)在Spss工具栏中:
图表-散点图-选择GDP为x轴,payout为y轴。
(两种方法)-确定,得到如下的图形:
2)在Spss工具栏中:
分析-回归-线性-将payout放起上,GDP放下-确定,得到如下的图表:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
GDPa
.
输入
a.已输入所有请求的变量。
b.因变量:
payout
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.996a
.991
.990
421.65884
a.预测变量:
(常量),GDP。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.776E8
1
1.776E8
998.673
.000a
残差
1600165.576
9
177796.175
总计
1.792E8
10
a.预测变量:
(常量),GDP。
b.因变量:
payout
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
5426.245
316.485
17.145
.000
GDP
.466
.015
.996
31.602
.000
a.因变量:
payout
注:
若将GDP的单位改为亿元,再做第3和第4题,观察单位变化对回归方程的影响。
方法:
将GDP的单位变为亿元,则在Spss工具栏中:
转换-计算变量-GDP1=GDP/10000,
得到新的GDP如下所示:
此时,按照上面的方法一次做3,4,得到的图形为:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
GDP1a
.
输入
a.已输入所有请求的变量。
b.因变量:
income
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.998a
.996
.996
484.24032
a.预测变量:
(常量),GDP1。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
5.549E8
1
5.549E8
2366.354
.000a
残差
2110398.186
9
234488.687
总计
5.570E8
10
a.预测变量:
(常量),GDP1。
b.因变量:
income
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
5153.534
363.457
14.179
.000
GDP1
8230.001
169.184
.998
48.645
.000
a.因变量:
income
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
GDP1a
.
输入
a.已输入所有请求的变量。
b.因变量:
payout
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.996a
.991
.990
421.65884
a.预测变量:
(常量),GDP1。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.776E8
1
1.776E8
998.673
.000a
残差
1600165.576
9
177796.175
总计
1.792E8
10
a.预测变量:
(常量),GDP1。
b.因变量:
payout
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
5426.245
316.485
17.145
.000
GDP1
4655.561
147.320
.996
31.602
.000
a.因变量:
payout
6.求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
方法:
1)在Spss工具栏中:
图表-散点图,先观察散点图的特性,选择使用什么回归比较好。
2)通过观察,得知选择曲线回归比较好,则在Spss工具栏中:
分析-回归-曲线-income上,GDP下-选择Quadratic和displayANOVAtable-确定,得到如下所示的表格:
模型描述
模型名称
MOD_1
因变量
1
income
方程
1
二次
自变量
GDP
常数
包含
其值在图中标记为观测值的变量
未指定
用于在方程中输入项的容差
.0001
个案处理摘要
N
个案总数
11
已排除的个案a
0
已预测的个案
0
新创建的个案
0
a.从分析中排除任何变量中带有缺失值的个案。
变量处理摘要
变量
因变量
自变量
income
GDP
正值数
11
11
零的个数
0
0
负值数
0
0
缺失值数
用户自定义缺失
0
0
系统缺失
0
0
模型汇总
R
R方
调整R方
估计值的标准误
.998
.996
.995
511.125
自变量为GDP。
ANOVA
平方和
df
均方
F
Sig.
回归
5.549E8
2
2.775E8
1062.022
.000
残差
2089989.330
8
261248.666
总计
5.570E8
10
自变量为GDP。
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
GDP
.795
.103
.964
7.717
.000
GDP**2
6.675E-7
.000
.035
.280
.787
(常数)
5403.084
971.774
5.560
.001
数据一般默认3位,修改具体为:
(1)SPSS默认显示至小数点后3位,因此当数字小于1/1000时就只能显示0.000了。
所以这种情况并不代表这个数字为0,而是表示它小于1/1000。
要想显示完整数字,可以采取如下方法:
双击输出表格,右键点击显示0.000的格子,选择“单元格属性”,在“格式值”选项卡中选择“小数”项上增加小数点位数至你所需要的位数。
注意,如果你增加的小数点位数较多,而格子又不够宽,此时就会显示×××××。
你只需要重新双击表格,然后双击显示×××××的格子,然后拖动格子的边框加宽格子的宽度就可以了
修改后的数据表格如下所示:
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
GDP
.795
.103
.964
7.717
.000
GDP**2
6.675E-7
0.000002388
.035
.280
.787
(常数)
5403.084
971.774
5.560
.001
7.求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
方法:
具体步骤与6一样,实验得到的表格如下所示:
模型汇总
R
R方
调整R方
估计值的标准误
.996
.992
.990
415.650
自变量为GDP。
ANOVA
平方和
df
均方
F
Sig.
回归
1.778E8
2
8.889E7
514.509
.000
残差
1382119.049
8
172764.881
总计
1.792E8
10
自变量为GDP。
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
GDP
.558
.084
1.194
6.666
.000
GDP**2
-2.182E-6
0.00000194
-.201
-1.123
.294
(常数)
4610.559
790.253
5.834
.000
8.求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数。
一个变量Y对另一个变量X的弹性系数E定义为:
E=Y的增长率÷X的增长率,所以需要在SPSS中选用幂函数power。
模型汇总
R
R方
调整R方
估计值的标准误
.998
.995
.995
.026
自变量为GDP。
ANOVA
平方和
df
均方
F
Sig.
回归
1.253
1
1.253
1863.628
.000
残差
.006
9
.001
总计
1.259
10
自变量为GDP。
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
ln(GDP)
.725
.017
.998
43.170
.000
(常数)
16.689
2.747
6.076
.000
因变量为ln(income)。
模型汇总
R
R方
调整R方
估计值的标准误
.996
.993
.992
.027
自变量为GDP。
ANOVA
平方和
df
均方
F
Sig.
回归
.873
1
.873
1239.774
.000
残差
.006
9
.001
总计
.879
10
自变量为GDP。
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
ln(GDP)
.605
.017
.996
35.210
.000
(常数)
37.506
6.317
5.937
.000
因变量为ln(payout)。
【结论】(结果、分析)
(2)标准化系数与非标准化系数
SPSS进行线性回归,得到的系数结果有标准化和非标准化,一般采用非标准化的回归系数。
两者的主要区别有:
①标准化是去除量纲的。
②标准化回归系数体现了变量间的相对重要性,而且与自变量的离散程度有关,如果其波动程度较大,那么就会显得比较重要;否则,就显得不太重要。
标准化回归系数正是用于检测这种重要性的。
③当需要比较多个自变量对因变量相对作用大小时,可采用标准化回归系数,当只是想解释自变量对因变量的作用时,可采用非标准化的回归系数。
④标准化的常数项是没有值的,因此,标准化的回归系数不能用于回归方程。
标准化的回归系数只是用于自变量间进行比较
三、指导教师评语及成绩:
评语:
成绩:
指导教师签名:
批阅日期:
仅供个人用于学习、研究;不得用于商业用途。
Forpersonaluseonlyinstudyandresearch;notforcommercialuse.
NurfürdenpersönlichenfürStudien,Forschung,zukommerziellenZweckenverwendetwerden.
Pourl'étudeetlarechercheuniquementàdesfinspersonnelles;pasàdesfinscommerciales.
толькодлялюдей,которыеиспользуютсядляобучения,исследованийинедолжныиспользоватьсявкоммерческихцелях.
以下无正文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 相关 回归 分析