相关分析与回归分析spss实现.docx
- 文档编号:11257001
- 上传时间:2023-02-26
- 格式:DOCX
- 页数:13
- 大小:246.33KB
相关分析与回归分析spss实现.docx
《相关分析与回归分析spss实现.docx》由会员分享,可在线阅读,更多相关《相关分析与回归分析spss实现.docx(13页珍藏版)》请在冰豆网上搜索。
相关分析与回归分析spss实现
相关分析与回归分析
一、实验目标与要求
本实验项目的目的是学习并利用SPSS软件进行相关分析和回归分析,具体包括:
(1)皮尔逊pearson简单相关系数的计算与分析
(2)学会在SPSS上实现一元及多元回归模型的计算与查验。
(3)学会回归模型的散点图与样本方程图形。
(4)学会对所计算结果进行统计分析说明。
(5)要求实验前,了解回归分析的如下内容。
参数α、β的估量
回归模型的查验方式:
回归系数β的显著性查验(t-查验);回归方程显著性查验(F-查验)。
二、实验原理
1.相关分析的统计学原理
相关分析利用某个指标来讲明现象之间彼此依存关系的紧密程度。
用来测度简单线性相关关系的系数是Pearson简单相关系数。
2.回归分析的统计学原理
相关关系不等于因果关系,要明确因果关系必需借助于回归分析。
回归分析是研究两个变量或多个变量之间因果关系的统计方式。
其大体思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量转变的一样关系进行测定,确立一个适合的数据模型,以便从一个已知量推断另一个未知量。
回归分析的要紧任务确实是依照样本数据估量参数,成立回归模型,对参数和模型进行查验和判定,并进行预测等。
线性回归数学模型如下:
在模型中,回归系数是未知的,能够在已有样本的基础上,利用最小二乘法对回归系数进行估量,取得如下的样本回归函数:
回归模型中的参数估量出来以后,还必需对其进行查验。
若是通过查验发觉模型有缺点,那么必需回到模型的设按时期或参数估量时期,从头选择被说明变量和说明变量及其函数形式,或对数据进行加工整理以后再次估量参数。
回归模型的查验包括一级查验和二级查验。
一级查验又叫统计学查验,它是利用统计学的抽样理论来查验样本回归方程的靠得住性,具体又能够分为拟和优度评判和显著性查验;二级查验又称为经济计量学查验,它是对线性回归模型的假定条件可否取得知足进行查验,具体包括序列相关查验、异方差查验等。
三、实验演示内容与步骤
1.持续变量简单相关系数的计算与分析
在上市公司财务分析中,常常利用资产收益率、净资产收益率、每股净收益和托宾Q值4个指标来衡量公司经营绩效。
本实验利用SPSS对这4个指标的相关性进行查验。
操作步骤与进程:
打开数据文件“上市公司财务数据(持续变量相关分析).sav”,依次选择“【分析】→【相关】→【双变量】”打开对话框如图,将待分析的4个指标移入右边的变量列表框内。
其他都可选择默许项,单击ok提交系统运行。
图BivariateCorrelations对话框
结果分析:
表给出了Pearson简单相关系数,相关查验t统计量对应的p值。
相关系数右上角有两个星号表示相关系数在的显著性水平下显著。
从表中能够看出,每股收益、净资产收益率和总资产收益率3个指标之间的相关系数都在以上,对应的p值都接近0,表示3个指标具有较强的正相关关系,而托宾Q值与其他3个变量之间的相关性较弱。
表Pearson简单相关分析
Correlations
每股收益率
净资产收益率
资产收益率
托宾Q值
每股收益率
PearsonCorrelation
1
.877(**)
.824(**)
Sig.(2-tailed)
.
.000
.000
.199
N
315
315
315
315
净资产收益率
PearsonCorrelation
.877(**)
1
.808(**)
Sig.(2-tailed)
.000
.
.000
.983
N
315
315
315
315
资产收益率
PearsonCorrelation
.824(**)
.808(**)
1
.011
Sig.(2-tailed)
.000
.000
.
.849
N
315
315
315
315
托宾Q值
PearsonCorrelation
.011
1
Sig.(2-tailed)
.199
.983
.849
.
N
315
315
315
315
**Correlationissignificantatthelevel(2-tailed).
2.一元线性回归分析
实例分析:
家庭住房支出与年收入的回归模型
在那个例子里,考虑家庭年收入对住房支出的阻碍,成立的模型如下:
其中,yi是住房支出,xi是年收入
线性回归分析的大体步骤及结果分析:
(1)绘制散点图打开数据文件,选择【图形】-【旧对话框】-【散点/点状】,如下图。
图散点图对话框
选择简单散布,单击概念,打开子对话框,选择X变量和Y变量,如下图。
单击ok提交系统运行,结果见图所示。
图SimpleScatterplot子对话框
从图上可直观地看出住房支出与年收入之间存在线性相关关系。
图散点图
(2)简单相关分析
选择【分析】—>【相关】—>【双变量】,打开对话框,将变量“住房支出”与“年收入”移入variables列表框,点击ok运行,结果如表所示。
表住房支出与年收入相关系数表
Correlations
住房支出(千美元)
年收入(千美元)
住房支出(千美元)
PearsonCorrelation
1
.966(**)
Sig.(2-tailed)
.
.000
N
20
20
年收入(千美元)
PearsonCorrelation
.966(**)
1
Sig.(2-tailed)
.000
.
N
20
20
**Correlationissignificantatthelevel(2-tailed).
从表中可取得两变量之间的皮尔逊相关系数为,双尾查验概率p值尾<,故变量之间显著相关。
依照住房支出与年收入之间的散点图与相关分析显示,住房支出与年收入之间存在显著的正相关关系。
在此前提下进一步进行回归分析,成立一元线性回归方程。
(3)线性回归分析
步骤1:
选择菜单“【分析】—>【回归】—>【线性】”,打开LinearRegression对话框。
将变量住房支出y移入Dependent列表框中,将年收入x移入Independents列表框中。
在Method框当选择Enter选项,表示所选自变量全数进入回归模型。
图LinearRegresssion对话框
步骤2:
单击Statistics按钮,如图在Statistics子对话框。
该对话框中设置要输出的统计量。
那个地址选中估量、模型拟合度复选框。
图Statistics子对话框
估量:
输出有关回归系数的统计量,包括回归系数、回归系数的标准差、标准化的回归系数、t统计量及其对应的p值等。
置信区间:
输出每一个回归系数的95%的置信度估量区间。
协方差矩阵:
输出说明变量的相关系数矩阵和协差阵。
模型拟合度:
输出可决系数、调整的可决系数、回归方程的标准误差、回归方程F查验的方差分析。
步骤3:
单击绘制按钮,在Plots子对话框中的标准化残差图选项栏当选中正态概率图复选框,以便对残差的正态性进行分析。
图plots子对话框
步骤4:
单击保留按钮,在Save子对话框中残差选项栏当选中未标准化复选框,如此能够在数据文件中生成一个变量名尾res_1的残差变量,以便对残差进行进一步分析。
图Save子对话框
其余维持Spss默许选项。
在主对话框中单击ok按钮,执行线性回归命令,其结果如下:
表给出了回归模型的拟和优度(RSquare)、调整的拟和优度(AdjustedRSquare)、估量标准差(Std.ErroroftheEstimate)和Durbin-Watson统计量。
从结果来看,回归的可决系数和调整的可决系数别离为和,即住房支出的90%以上的变更都能够被该模型所说明,拟和优度较高。
表给出了回归模型的方差分析表,能够看到,F统计量为,对应的p值为0,因此,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
表给出了回归系数、回归系数的标准差、标准化的回归系数值和各个回归系数的显著性t查验。
从表中能够看到不管是常数项仍是说明变量x,其t统计量对应的p值都小于显著性水平,因此,在的显著性水平下都通过了t查验。
变量x的回归系数为,即年收入每增加1千美元,住房支出就增加千美元。
表回归模型拟和优度评判及Durbin-Watson查验结果
ModelSummary(b)
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.966(a)
.934
.930
.37302
aPredictors:
(Constant),年收入(千美元)
bDependentVariable:
住房支出(千美元)
表方差分析表
ANOVA(b)
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
1
.000(a)
Residual
18
.139
Total
19
aPredictors:
(Constant),年收入(千美元)
bDependentVariable:
住房支出(千美元)
表回归系数估量及其显著性查验
Coefficients(a)
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.890
.204
.000
年收入(千美元)
.237
.015
.966
.000
aDependentVariable:
住房支出(千美元)
为了判定随机扰动项是不是服从正态散布,观看图所示的标准化残差的P-P图,能够发觉,各观测的散点大体上都散布在对角线上,据此能够初步判定残差服从正态散布。
为了判定随机扰动项是不是存在异方差,依照被说明变量y与说明变量x的散点图,如下图,从图中能够看到,随着说明变量x的增大,被说明变量的波动幅度明显增大,说明随机扰动项可能存在比较严峻的异方差问题,应该利用加权最小二乘法等方式对模型进行修正。
图标准化残差的P-P图
四、备择实验
现有1987~2003年湖南省全社会固定资产投资总额NINV和GDP两个指标的年度数据,见下表。
试研究全社会固定资产投资总额和GDP的数量关系,并成立全社会固定资产投资总额和GDP之间的线性回归方程。
湖南省全社会固定资产投资和GDP年度数据
年份
GDP(亿元)
NINV(亿元)
年份
GDP(亿元)
NINV(亿元)
1987
1995
523
1988
1996
1989
1997
2993
1990
1998
1991
1999
1992
2000
1993
2001
3983
1994
2002
1348
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归 spss 实现