SPSS软件分析7回归分析作业.docx
- 文档编号:23608737
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:33
- 大小:392.52KB
SPSS软件分析7回归分析作业.docx
《SPSS软件分析7回归分析作业.docx》由会员分享,可在线阅读,更多相关《SPSS软件分析7回归分析作业.docx(33页珍藏版)》请在冰豆网上搜索。
SPSS软件分析7回归分析作业
实验七SPSS线性回归分析
1*统计**班邵***201******
6、为考察某种维尼纤维的耐水性能,安排了一组试验。
测得其甲醇浓度
及相应的“缩醇化度”
的数据如下
x
18202224262830
y
26.8628.3528.7528.8729.7530.0030.36
(1)作散点图
(2)求样本相关系数,并作相应的假设检验,最后说明两个变量的相关性
(3)建立一元线性回归方程,给出具体回归方程。
(4)对建立的回归方程必要的统计检验和残差分析
。
1,
散点图
此散点图横坐标为缩醇化度,纵坐标为甲醇浓度,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。
2,
相关性
甲醇浓度
缩醇化度
甲醇浓度
Pearson相关性
1
.902**
显著性(双侧)
.005
平方与叉积的和
112.000
17.600
协方差
18.667
2.933
N
7
7
缩醇化度
Pearson相关性
.902**
1
显著性(双侧)
.005
平方与叉积的和
17.600
3.396
协方差
2.933
.566
N
7
7
**.在.01水平(双侧)上显著相关。
相关性检验-Pearson简单相关系数
原假设:
认为甲醇浓度和缩醇化度不存在线性关系。
从表中可知,甲醇浓度和缩醇化度的简单相关系数是0.902。
他们的相关系数检验的P值为0.005,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。
相关系数旁两个(**)是说明这两个变量的相关性很强。
总之,甲醇浓度和缩醇化度从在极强的正的线性相关性。
3,
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
容差
VIF
1
(常量)
25.506
.816
31.248
.000
甲醇浓度
.157
.034
.902
4.684
.005
1.000
1.000
建立一元线性模型
Y=A+BX
原假设:
变量甲醇浓度的偏回归系数与0无显著差异。
此表各数列数据项的含义依次为:
偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。
依据该表可以进行回归系数显著性检验,写出回归方程
Y=25.506+0.157X
该表还可以检验相关系数的显著性,甲醇浓度的P值为0.005,在显著水平为0.05或0.01下,都应拒绝原假设,认为变量甲醇浓度的偏回归系数与0有显著差异。
就是说,甲醇浓度和缩醇化度从在极强的正的线性相关性。
4,
描述性统计量
均值
标准偏差
N
缩醇化度
29.2771
.75232
7
甲醇浓度
24.0000
4.32049
7
此表为;两个变量的基本统计量,第二列为两变量的均值,第三列为标准误,第四列为变量的个数。
模型
R
R方
调整R方
标准估计的误差
1
.902a
.814
.777
.35503
拟合优度检验-R方变化
依据该表做拟合优度检验,由于该方程只有一个解释变量,调整后的R方明显变小了,我们可以参考R方,由于R方(0.814)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
2.766
1
2.766
21.942
.005b
残差
.630
5
.126
总计
3.396
6
a.因变量:
缩醇化度
b.预测变量:
(常量),甲醇浓度。
回归方程显著性检验
原假设:
变量甲醇浓度的偏回归系数与0无显著差异。
从表中可知,被解释变量的总离差平方和为3.396,回归平方和及均方为2.766,2.766,残差平方和及均方为0.630,0.126,F检验统计量的观测值为21.942,对应p值为0.005,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量甲醇浓度的偏回归系数与0无显著差异。
就是说,甲醇浓度和缩醇化度从在极强的正的线性相关性。
残差分析
残差数据点围绕金准先还存在一定的规律性,但我们发现标准换的残差和标准正态分布不存在显著差异,可以认为残差满足线性模型的前提条件。
单样本Kolmogorov-Smirnov检验
StandardizedResidual
N
16
正态参数a,b
均值
.0000000
标准差
.96609178
最极端差别
绝对值
.114
正
.114
负
-.114
Kolmogorov-SmirnovZ
.457
渐近显著性(双侧)
.985
a.检验分布为正态分布。
b.根据数据计算得到。
原假设H0:
该总体与正态总体分布无显著差异。
备择假设H1:
该总体与正态总体分布有显著差异。
通过进行非参数检验,可以得出渐进显著性(双侧)为0.985,在显著水平α=0.05下,这可以认为标准化残差与标准正态分布无显著差异,可以认为残差满足了线性模型的前提条件。
7、测得一组弹簧形变
(单位:
cm)和相应的外力
(单位:
N)数据如下:
y
11.21.41.61.82.02.22.42.83.0
x
3.083.764.315.025.516.256.747.408.549.24
由胡克定律知
,试估计
,并在
试给出相应的外力
的0.95预测区间。
模型汇总c,d
模型
R
R方b
调整R方
标准估计的误差
1
.989a
.978
.975
.10516
a.预测变量:
弹簧形变
b.对于通过原点的回归(无截距模型),R方可测量(由回归解释的)原点附近的因变量中的可变性比例。
对于包含截距的模型,不能将此与R方相比较。
c.因变量:
相应外力
d.通过原点的线性回归
拟合优度检验-R方变化
依据该表做拟合优度检验,由于该方程只有一个解释变量,由于R方(0.975)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.916
1
3.916
354.091
.000a
残差
.088
8
.011
总计
4.004
9
a.预测变量:
(常量),弹簧形变。
b.因变量:
相应外力
回归方程显著性检验
原假设:
变量弹簧形变的偏回归系数与0无显著差异。
从表中可知,被解释变量的总离差平方和为4.004,回归平方和及均方为3.916,3.916,残差平方和及均方为0.088,0.011,F检验统计量的观测值为354.091,对应p值为0.000,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量弹簧形变的偏回归系数与0无显著差异。
就是说,弹簧形变和相应外力从在极强的正的线性相关性。
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
.129
.102
1.272
.239
-.105
.364
弹簧形变
.308
.016
.989
18.817
.000
.270
.345
建立模型
Y=kX
原假设:
变量弹簧形变的偏回归系数与0无显著差异。
依据该表可以进行回归系数显著性检验,写出回归方程
Y=0.308X
该表还可以检验相关系数的显著性,弹簧形变的P值为0.000,在显著水平为0.05或0.01下,都应拒绝原假设,认为变量弹簧形变的偏回归系数与0有显著差异。
就是说,弹簧形变和相应外力从在极强的正的线性相关性。
在x=2.6cm时,y=0.308*2.6=0.86528,且y在x=2.6cm的95%的预测区间为:
(0.78866,0.88257)。
8、某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。
(1)画出以身高、体重为自变量,体表面积为应变量的散点图。
(2)试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的多元线形回归方程。
(3)对建立的回归方程作各种相关的统计检验、残差分析、多重共线性分析
(4)如需要修正,请提供修正后的线性模型。
1,
散点图
左图为散点图横坐标为身高,纵坐标为体表面积,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。
右图为散点图横坐标为体重,纵坐标为体表面积,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。
2,
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-2.856
6.018
-.475
.649
身高
.069
.075
.215
.919
.389
.256
3.912
体重
.184
.057
.758
3.234
.014
.256
3.912
a.因变量:
体表面积
建立一元线性模型
Y=A+BX+CY
原假设:
变量身高和体重的偏回归系数与0无显著差异。
此表各数列数据项的含义依次为:
偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。
依据该表可以进行回归系数显著性检验,写出回归方程
Y=-2.856+0.069X+0.184Y
该表还可以检验相关系数的显著性,身高的P值为0.389,在显著水平为0.05或0.01下,都应不能拒绝原假设,认为身高的偏回归系数与0没有显著差异。
就是说,身高和体表面积没有极强的正的线性相关性。
该表还可以检验相关系数的显著性,体重的P值为0.014,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。
就是说,体重和体表面积强的正的线性相关性。
3,
描述性统计量
均值
标准偏差
N
体表面积
5.73650
.403441
10
身高
89.130
1.2641
10
体重
13.440
1.6635
10
此表为;两个变量的基本统计量,第二列为两变量的均值,第三列为标准误,第四列为变量的个数。
相关性
体表面积
身高
体重
Pearson相关性
体表面积
1.000
.869
.943
身高
.869
1.000
.863
体重
.943
.863
1.000
Sig.(单侧)
体表面积
.
.001
.000
身高
.001
.
.001
体重
.000
.001
.
N
体表面积
10
10
10
身高
10
10
10
体重
10
10
10
相关性检验-Pearson简单相关系数
原假设:
认为体表面积和身高、体重不存在线性关系。
从表中可知,体表面积和身高简单相关系数是0.869。
他们的相关系数检验的P值为0.001,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。
相关系数旁两个(**)是说明这两个变量的相关性很强。
总之,体表面积和身高从在极强的线性相关性。
从表中可知,体表面积和体重简单相关系数是0.943。
他们的相关系数检验的P值为0.000,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。
相关系数旁两个(**)是说明这两个变量的相关性很强。
总之,体表面积和体重从在极强的线性相关性。
模型
R
R方
调整R方
标准估计的误差
1
.950a
.902
.874
.143346
拟合优度检验-R方变化
依据该表做拟合优度检验,由于该方程有两个解释变量,调整后的R方跟有说服力,我们可以参考调整R方,由于R方(0.874)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.321
2
.661
32.145
.000a
残差
.144
7
.021
总计
1.465
9
a.预测变量:
(常量),体重,身高。
b.因变量:
体表面积
回归方程显著性检验
原假设:
变量身高、体重的偏回归系数与0无显著差异。
从表中可知,被解释变量的总离差平方和为1.465,回归平方和及均方为1.321,0.661,残差平方和及均方为0.1440.021,F检验统计量的观测值为32.145,对应p值为0.000,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量身高体重的偏回归系数与0无显著差异。
就是说,身高体重和体表面积从在极强的线性相关性。
可以建立线性模型。
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-2.856
6.018
-.475
.649
身高
.069
.075
.215
.919
.389
.256
3.912
体重
.184
.057
.758
3.234
.014
.256
3.912
a.因变量:
体表面积
原假设:
变量身高和体重的偏回归系数与0无显著差异。
此表各数列数据项的含义依次为:
偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。
该表还可以检验相关系数的显著性,身高的P值为0.389,在显著水平为0.05或0.01下,都应不能拒绝原假设,认为身高的偏回归系数与0没有显著差异。
就是说,身高和体表面积没有极强的正的线性相关性。
该表还可以检验相关系数的显著性,体重的P值为0.014,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。
就是说,体重和体表面积强的正的线性相关性。
由于该模型中保留了一些不应保留的变量,因此该模型目前不可用,应重新建模。
同时,从容忍度和方差膨胀因子看,身高和其他变量存在严重的多重共线性很严重,再重新建模时可以考虑剔除该变量。
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
身高
体重
1
1
2.992
1.000
.00
.00
.00
2
.008
19.000
.00
.00
.28
3
2.538E-5
343.355
1.00
1.00
.72
a.因变量:
体表面积
采用多重共线性检验
从方差比来看,第3个特征根既能解释身高方差的100%,也解释体重方差的72%,因此有理由认为这些变量间存在多重共线性,再从条件指数来看,第2,3个条件指数都大于10,说明变量间确实存在多重性共线性。
残差分析
残差数据点围绕金准先还存在一定的规律性,但我们发现标准换的残差和标准正态分布不存在显著差异,可以认为残差满足线性模型的前提条件。
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
5.21050
6.34913
5.73650
.383122
10
标准预测值
-1.373
1.599
.000
1.000
10
预测值的标准误差
.048
.101
.077
.016
10
调整的预测值
5.09660
6.30703
5.73285
.394187
10
残差
-.226087
.204304
.000000
.126420
10
标准残差
-1.577
1.425
.000
.882
10
Student化残差
-1.828
1.543
.009
1.030
10
已删除的残差
-.303838
.285397
.003653
.174195
10
Student化已删除的残差
-2.342
1.759
.004
1.196
10
Mahal。
距离
.122
3.609
1.800
1.061
10
Cook的距离
.001
.527
.125
.180
10
居中杠杆值
.014
.401
.200
.118
10
a.因变量:
体表面积
4,
模型汇总b
模型
R
R方
调整R方
标准估计的误差
更改统计量
Durbin-Watson
R方更改
F更改
df1
df2
Sig.F更改
1
.943a
.890
.876
.141945
.890
64.705
1
8
.000
2.212
a.预测变量:
(常量),体重。
b.因变量:
体表面积
已排除的变量b
模型
BetaIn
t
Sig.
偏相关
共线性统计量
容差
1
身高
.215a
.919
.389
.328
.256
a.模型中的预测变量:
(常量),体重。
b.因变量:
体表面积
逐步刷选策略
由于上面的回归方程荀子啊一些不可忽视的问题,应重新建立回归方程,采用逐步刷选策略让SPSS自动完成解释变量的选择。
观测每一步的检验变化。
逐步刷选策略一步完成,即为最终模型,从方程建立过程来看,随机解释变量减少一个,方程拟合优度下降,同时说明建立回归方程并不是一味的追求高拟合优度为唯一目的。
还要重点考察解释变量是否对被解释变量有贡献。
剔除了身高。
给定显著水平位0.05,可以看到被剔除的变量身高的偏F检验的p值均大于显著性水平,因此均不能拒绝原假设,认为这些偏回归系数与0无显著差异,他们对被解释变量的线性解释没有显著贡献,不应留在方程中。
最终留在方程中的变量为体重,方程的DW检验值为2.212,残差存在一定的正自相关性
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.304
1
1.304
64.705
.000a
残差
.161
8
.020
总计
1.465
9
a.预测变量:
(常量),体重。
b.因变量:
体表面积
原假设:
被解释变量与解释变量间的线性关系不显著
给定显著性水平是,0,05,由于方程p值小于的显著水平,拒绝原假设,因此被解释变量与解释变量间的线性关系显著,建立线性模型是恰当的。
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
2.661
.385
6.915
.000
1.774
3.549
体重
.229
.028
.943
8.044
.000
.163
.294
a.因变量:
体表面积
建立一元线性模型
Y=A+BX
此表各数列数据项的含义依次为:
偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。
依据该表可以进行回归系数显著性检验,写出回归方程
Y=2.661+0.229X
该表还可以检验相关系数的显著性,体重的P值为0.00,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。
就是说,体重和体表面积强的正的线性相关性。
9、为检验X射线的杀菌作用,用200kV射线照射杀菌,每次照射6min,照射次数为
,照射后所剩细菌数为
,下表是一组试验结果
根据经验知道
关于
的曲线回归方程形如
试给出具体的回归方程,并求其对应的决定系数
和剩余标准差
。
散点图
此散点图横坐标为照射次数,纵坐标为所剩细菌数,数据点基本在一条曲线周围波动,两变量并非线性,课考虑曲线估计。
为下面分析做好基础。
模型汇总和参数估计值
因变量:
y
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
指数
.997
6418.741
1
18
.000
1051.733
-.247
自变量为x。
拟合优度检验-R方变化
依据该表做拟合优度检验,拟合优度为0.997,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。
从下面的你和回归线可以看出,散点几乎都在曲线附近波动。
ANOVA
平方和
df
均方
F
Sig.
回归
40.679
1
40.679
6418.741
.000
残差
.114
18
.006
总计
40.793
19
自变量为照射次数。
回归方程显著性检验
原假设:
照射次数和所剩细菌不存在极强的相关性。
从表中可知,被解释变量的总离差平方和为40.793,回归平方和及均方均为40.679,残差平方和及均方为0.114,0.006,F检验统计量的观测值为6418.741,对应p值为0.00,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量照射次数的偏回归系数与0无显著差异。
就是说,照射次数和所剩细菌存在极强的相关性。
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
照射次数
-.247
.003
-.999
-80.117
.000
(常数)
1051.733
38.894
27.041
.000
因变量为ln(所剩细菌数)。
建立曲线模型
依据该表可以进行回归系数显著性检验,写出回归方程
Y=1051.733e^(-0.247X)
10、请利用“cars.sav”的数据文件中的连续型变量:
mpg,engine,horse,weight,accel五个变量,自选一个因变量作其余变量的线性回归模型,比如,以accel为因变量。
请
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 软件 分析 回归 作业