一元与多元线性回归.docx
- 文档编号:8911936
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:18
- 大小:231.27KB
一元与多元线性回归.docx
《一元与多元线性回归.docx》由会员分享,可在线阅读,更多相关《一元与多元线性回归.docx(18页珍藏版)》请在冰豆网上搜索。
一元与多元线性回归
实用回归分析实验报告一
实验题目:
一元线性回归与多元线性回归
专业:
经济统计学
班级:
学号:
姓名:
一实验目的:
1、熟悉运用spss软件画散点图以及线性回归、估计、参数检验、残差分析
2、熟悉运用spss软件解决一元线性回归的问题
3、熟悉运用spss软件解决多元线性回归的问题
二实验内容:
步骤:
一.P63----3.9
(1)画出散点图
(2)x和y大致呈线性关系吗?
分析→相关→双变量
相关性
x
y
x
Pearson相关性
1
.989**
显著性(双侧)
.000
N
12
12
y
Pearson相关性
.989**
1
显著性(双侧)
.000
N
12
12
**.在.01水平(双侧)上显著相关。
(3)用最小二乘法估计出回归模型
分析—》回归—》线性
回归模型y=9.508+9.747x
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
9.508
3.057
3.110
.011
2.696
16.319
x
9.747
.460
.989
21.204
.000
8.723
10.771
a.因变量:
y
(4)求出回归标准差
回归标准差为ô4.70420
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.989a
.978
.976
4.70420
a.预测变量:
(常量),x。
b.因变量:
y
(5)给出β0与β1的置信水平为95%的区间估计;
β0(2.69616.319)
β1(8.72310.771)
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
9.508
3.057
3.110
.011
2.696
16.319
x
9.747
.460
.989
21.204
.000
8.723
10.771
a.因变量:
y
(6)计算x和y的决定系数;
R方=0.978说明回归方程拟合程度很好
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.989a
.978
.976
4.70420
a.预测变量:
(常量),x。
b.因变量:
y
(7)对方程作方差分析
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
9949.622
1
9949.622
449.610
.000a
残差
221.295
10
22.129
总计
10170.917
11
a.预测变量:
(常量),x。
b.因变量:
y
(8)作回归系数β1显著性检验
回归系数β1显著性检验P<0.05
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
9.508
3.057
3.110
.011
2.696
16.319
x
9.747
.460
.989
21.204
.000
8.723
10.771
a.因变量:
y
(9)对回归方程作残差图分析
图形——》旧对话框——》散点图——>简单散点图
(10)当广告费用为4.2万元时,销售收入将达到多少?
并给出置信水平为95%的置信区间
当广告费用为4.2万元时,销售收入:
46.923
2.00
30.00
1.00
29.00159
0.99841
23.94274
34.06044
2.00
35.00
2.00
29.00159
5.99841
23.94274
34.06044
3.00
40.00
3.00
38.74856
1.25144
34.46648
43.03063
4.00
45.00
4.00
48.49552
-3.49552
44.86531
52.12574
5.00
50.00
5.00
58.24249
-8.24249
55.06149
61.42349
4.50
55.00
6.00
53.36901
1.63099
49.99464
56.74337
5.50
66.00
7.00
63.11597
2.88403
60.05400
66.17795
7.50
75.00
8.00
82.60991
-7.60991
79.19690
86.02291
8.00
85.00
9.00
87.48339
-2.48339
83.80533
91.16145
9.00
100.00
10.00
97.23036
2.76964
92.88747
101.57324
10.00
110.00
11.00
106.97732
3.02268
101.84982
112.10483
二.P94----4.8
研究货运总量y与工业总产量x1、农业总产量x2、居民非商品支出x3的关系,其数据见表4.15试完成:
(1)计算y,x1,x2,x3的相关系数矩阵;
分析→相关→偏变量
相关性
控制变量
y
x1
x2
x3
-无-a
y
相关性
1.000
.556
.731*
.724*
x1
相关性
.556
1.000
.113
.398
x2
相关性
.731*
.113
1.000
.547
x3
相关性
.724*
.398
.547
1.000
a.单元格包含零阶(Pearson)相关。
*.在0.05水平上显著相关
(2)求y关于x1,x2,x3的三元线性回归模型;
分析—》回归—》线性
回归模型y=-348.280+3.754x1+7.101x2+12.447x3
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
-348.280
176.459
-1.974
.096
-780.060
83.500
x1
3.754
1.933
.385
1.942
.100
-.977
8.485
x2
7.101
2.880
.535
2.465
.049
.053
14.149
x3
12.447
10.569
.277
1.178
.284
-13.415
38.310
a.因变量:
y
(3)对所求方程作拟合优度检验;
R方=0.806,方程是拟合优度较好
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.898a
.806
.708
23.44188
a.预测变量:
(常量),x3,x1,x2。
b.因变量:
y
(4)对回归方程作显著性检验;
分析—》回归—》线性
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
13655.370
3
4551.790
8.283
.015a
残差
3297.130
6
549.522
总计
16952.500
9
a.预测变量:
(常量),x3,x1,x2。
b.因变量:
y
(5)对每一回归系数作显著性检验;
分析—》回归—》线性
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
-348.280
176.459
-1.974
.096
-780.060
83.500
x1
3.754
1.933
.385
1.942
.100
-.977
8.485
x2
7.101
2.880
.535
2.465
.049
.053
14.149
x3
12.447
10.569
.277
1.178
.284
-13.415
38.310
a.因变量:
y
(6)如果有回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验
X3没有通过显著性检验,P=0.284,显著,予以剔除。
再次得到回归结果
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.872a
.761
.692
24.08112
a.预测变量:
(常量),x2,x1。
b.因变量:
y
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.301
7
579.900
总计
16952.500
9
a.预测变量:
(常量),x2,x1。
b.因变量:
y
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
-459.624
153.058
-3.003
.020
-821.547
-97.700
x1
4.676
1.816
.479
2.575
.037
.381
8.970
x2
8.971
2.468
.676
3.634
.008
3.134
14.808
a.因变量:
y
三.P108----5.4
从两个回归分析中得到的残差
绘制x的残差图,得到的结论
图形——》旧对话框——》散点图——>简单散点图
图1
图2
图1为回归1的残差图,残差都落在变化幅度不大的一条带子内,也就是说回归模型满足基本假设
图2为回归2的残差图,它与回归1的残差图相差无几,也可以认为回归模型满足基本假设,其实可进一步运用其他方法诊断模型是否有异方差、序列相关等,因为残差图作回归诊断往往比较粗糙。
四.P109-----5.5
表5.6是10个啤酒品牌的广告费用和销售量
(1)以广告费作为自变量X,销售量作为因变量Y,求出估计的回归方程;
分析—》回归—》线性
回归模型y=4.068+0.196x
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
4.068
2.166
1.878
.097
广告费
.196
.036
.886
5.393
.001
a.因变量:
销售量
(2)用残差分析检验是否存在异常值和影响的观测值;
分析—》回归—》线性
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
735.490
1
735.490
29.081
.001a
残差
202.330
8
25.291
总计
937.820
9
a.预测变量:
(常量),广告费。
b.因变量:
销售量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
4.068
2.166
1.878
.007
广告费
.196
.036
.886
5.393
.001
a.因变量:
销售量
上述回归结果看,回归方程通过了t检验、F检验,只是表明变量x与y之间的线性关系是显著的,但不能保证数据拟合的很好。
残差分析可知存在有影响的观测值并且为异常值。
(3)简要概括一下你的发现
从标准残差图,y的观测值的方差不同,而是随着x的增加而增加的,异常值的原因并不是数据的随机误差,而是由于本数据存在异方差,应该采用加权最小二乘法进行回归,回归结果会较精确。
五.P123----6.7
已知我国29个省、直辖市、自治区1994年城镇居民人均生活支出y可支配收入x的截面数据
(1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图
分析—》回归—》线性
回归模型y=58.318+0.796x
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8519037.482
1
8519037.482
1875.057
.000a
残差
122670.380
27
4543.347
总计
8641707.862
28
a.预测变量:
(常量),x。
b.因变量:
y
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
58.318
49.049
1.189
.245
x
.796
.018
.993
43.302
.000
a.因变量:
y
图形——》旧对话框——》散点图——>简单散点图
从残差图看出,误差项具有明显的异方差
(2)用等级相关系数检验法检验该问题是否存在异方差;
1.先计算出残差绝对值|e|
2.分析→相关→双变量
等级相关系数r=0.425,p=0.022
相关系数
x
e
Spearman的rho
x
相关系数
1.000
.425*
Sig.(双侧)
.
.022
N
29
29
e
相关系数
.425*
1.000
Sig.(双侧)
.022
.
N
29
29
*.在置信度(双测)为0.05时,相关性是显著的。
结论:
残差绝对值|e|与自变量x显著相关,存在异方差
P
六.P124------6.8
使用电高峰每小时用电y与每月总用电量x的数据
1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图
分析—》回归—》线性
回归模型y=-0.53+0.003x
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.748a
.559
.542
1.65169
a.预测变量:
(常量),每月总用电量。
b.因变量:
每小时用电量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-.530
.688
-.770
.449
每月总用电量
.003
.001
.748
5.631
.000
a.因变量:
每小时用电量
图形——》旧对话框——》散点图——>简单散点图
(2)诊断问题是否存在异方差
从残差图看出,误差项具有明显的异方差
(3)如果存在异方差,用幂指数型的权数建立加权最小二乘回归方程
分析—》回归—》权重估计—》x为权重
回归模型y=-483+0.003x
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
试用版
标准误
(常数)
-.483
.459
-1.053
.302
x
.003
.001
.737
.135
5.454
.000
模型摘要
复相关系数
.737
R方
.543
调整R方
.525
估计的标准误
.009
对数似然函数值
-47.867
幂值数m的最优取值为m=1.5加权最小二乘r2=0.543,加权最小二乘估计的效果好于普通最小二乘估计的效果。
对于异方差问题的处理至今没有好的方法,一些方法的处理效果往往不甚明显,所以此例能有所改进就不错了。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 多元 线性 回归
![提示](https://static.bdocx.com/images/bang_tan.gif)