回归分析应用实例讲解.docx
- 文档编号:8328862
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:18
- 大小:40.44KB
回归分析应用实例讲解.docx
《回归分析应用实例讲解.docx》由会员分享,可在线阅读,更多相关《回归分析应用实例讲解.docx(18页珍藏版)》请在冰豆网上搜索。
回归分析应用实例讲解
影响成品钢材量的多元回归分析故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。
钢材的需求量设为y,作为被解释变量,而原油产量、生铁产量x1、原煤产量、发电量作为解释变量,通过建立这些经济变量的xxx432线性模型来研究影响成品钢材需求量的原因。
能源转换技术等因素。
在此,收集的数据选择与其相关的四个因素:
原油产量、生铁产量、原煤产量、发电量,1980—1997的有关数据如下表。
理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、
原始数据(中国统计年鉴)
aa
年份a
yaaa
1xaaa
2xaaa
3xaaa
4xaaaa
1980aa
2716.20a
10595.00a
3802.40a
6.20a
3006.20aaaa
1981aa
2670.10a
10122.00a
3416.60a
6.20a
3092.70aaaa
1982aa
2902.00a
10212.00a
3551.00a
6.66a
3277.00aaaa
1983aa
3072.00a
10607.00a
3738.00a
7.15a
3514.00aaaa
1984aa
3372.00a
11461.30a
4001.00a
7.89a
3770.00aaaa
1985aa
3693.00a
12489.50a
4384.00a
8.72a
4107.00aaaa
1986aa
4058.00a
13068.80a
5064.00a
8.94a
4495.00aaaa
1987aa
4356.00a
13414.00a
5503.00a
9.28a
4973.00aaaa
1988aa
4689.00a
13704.60a
5704.00a
9.80a
5452.00aaaa
1989aa
4859.00a
13764.10a
5820.00a
10.54a
5848.00aaaa
1990aa
5153.00a
13830.60a
6238.00a
10.80a
6212.00aaaa
1991aa
5638.00a
14009.20a
6765.00a
10.87a
6775.00
aaaa
1992aa
6697.00a
14209.70a
7589.00a
11.16a
7539.00aaaa
1993aa
7716.00a
14523.00a
8739.00a
11.51a
8395.00aaaa
1994aa
8482.00a
14608.20a
9741.00a
12.40a
9281.00aaaa
1995aa
8979.80a
15004.94a
10529.27a
13.61a
10070.30aaaa
1996aa
9338.02a
15733.39a
10722.50a
13.97a
10813.10aaaa
1997aa
9978.93a
16074.14a
11511.41a
13.73a
11355.53
将中国成品
一、模型的设定
设因变量y与自变量、、、的一般线性回归模型为:
xxxx4321y=+?
?
?
?
?
?
?
x?
xxx?
?
421330241是随机变量,通常满足;Var()=2?
?
?
?
0?
()?
二参数估计
aaa
系数aaa
模型aa
非标准化系数aa
标准系数a
ta
Sig.
a
Baaaa
误差标准aa
试用版
aaaaaaaaaaaa
发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨
)1常量()aaaaa
.389-17.818.554-.041170.287aaaaa
.199115.468.170.090494.572aaaaa
.438-.018.608-.031aaaaa
1.952-.1543.267-.457.344aaaaa
.073.880.006.655.736aaaaa
a.成品钢材(万吨):
因变量
再用spss做回归线性,根据系数表得出回归方程为:
1x0?
180..?
45x1?
.0?
201y?
7.87x04.5x783894123再做回归预测,得出如下截图:
故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。
三回归方程检验
描述性统计量
均值标准偏差N
成品钢材(万吨)182460.349265465.0028
)原油(万吨181875.7887313190.6372
生铁(万吨)18
2700.79676
6489.9544
原煤(万吨)9.96832.5401818
发电量(亿千瓦时)18
2768.11191
6220.8794
aa
相关性aa
a
成品钢材(万吨)aaa
)原油(万吨aa
生铁(万吨)aa
原煤(万吨)aaa
时)发电量(亿千瓦aaaaaaaaaaaaa
发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨)相关性Pearson成品钢材(万吨)aaaaa
.997.961.998.9091.000aaaaa
.920.973.9121.000.909aaaaa
.997.9621.000.912.998aaaaa
.9711.000.962.973.961aaaaa
1.000.971.997.920.997aaaaaaaaaaaaa
发电量(亿千瓦时)原煤(万吨)生铁(万吨))原油(万吨成品钢材(万吨)(单侧)Sig.aaaaa
.000.000.000.000.aaaaa
.000.000.000..000aaaaa
.000.000..000.000aaaaa
.000..000.000.000aaaa
.000.000.000.000aaaaaaaaaaa
发电量(亿千瓦时)原煤(万吨)生铁(万吨))原油(万吨N成品钢材(万吨)aaaaa
1818181818aaaaa
1818181818aaaaa
1818181818aaaaa
1818181818aaaaa
1818181818.
由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9以上,说明变量间的线性相关程度很高,适合做多元线性回归模型。
aaa
模型汇总baa
模型a
Raaa
方Raaaaa
方R调整aaaa
估计的误差标准a
1aa
.999aaa
.997a
.997a
140.71641aaaaaaaaaaaaaaaaaaa
成品钢材(万吨):
因变量
b.。
生铁(万吨),原煤(万吨)),原油(万吨,发电量(亿千瓦时)),常量:
(预测变量a.
22RR知,模型对样本观测数据的拟合度很好。
=0.997以及调整之后的=0.997由.
bAnova模型平方和均方Fdf
Sig.
a回归41296.001
1
1.026E8.0002.566E7
残差19801.108
13257414.404
总计17
1.029E8
a.预测变量:
(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。
b.因变量:
成品钢材(万吨)
?
=0.05,故拒绝原假设,认为自变量联合起来值=0.000 aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig. a Baaaa 标准误差aa 试用版 aaaaaaaaaaaa 发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨)1常量()aaaaa .389-17.818.554-.041170.287aaaaa .199115.468.170.090494.572aaaaa .438-.018.608-.031aaaaa 1.952-.1543.267-.457.344aaaaa .073.880.006.655.736aaaaa : 因变量成品钢材(万吨)a. 对因变量? ,故接受原假设,认为=0.05=-0.154P因为值=0.880远远大于xt33y没有显著影响,故应剔除。 用后退法剔除变量后,再做回归线性,x3得如下表: aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig. a Baaaa 误差标准aa 试用版 aaaaaaaa 生铁(万吨)原油(万吨)1(常量)aaa .554-.041170.287aaa .170.090494.572aaa .608-.031aaa 3.267-.457.344aaa .006.655.736 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 257414.404 1319801.108残差 1296.001141.026E8.0002.566E7回归 adfSig.F均方平方和模型Anovad发电量(亿千瓦时)原煤(万吨)aa .389-17.818aa .199115.468aa .438-.018aa 1.952-.154aa .073.880aaaaaaaaaa 发电量(亿千瓦时)生铁(万吨)原油(万吨)2(常量)aaaa .371.564-.053197.734aaaa .153.150.045445.099aaaa .417.620-.041aaaa 2.4173.760-1.172.444aaaa .030.002.261.664aaaaaaaa 发电量(亿千瓦时)生铁(万吨)3(常量)aaa .311.591-309.403aaa .147.150105.079aaa .350.649aaa 2.1253.937-2.944aaa .051.001.010aaaaa : a.因变量成品钢材(万吨) 总计171.029E8 b回归3.422E72 .00031857.513 1.026E8 残差18420.420 14257885.884 总计171.029E8 c回归5.131E7.0003 2718.023 1.026E82 残差18878.288 15283174.324 总计17 1.029E8 a.预测变量: (常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。 b.预测变量: (常量),发电量(亿千瓦时),原油(万吨),生铁(万吨)。 c.预测变量: (常量),发电量(亿千瓦时),生铁(万吨)。 d.因变量: 成品钢材(万吨) 、两个自变量,得出新的回归方程为: xx最后剔除31x0.311x? 0.591? ? y? 309.40342F=2718.023P值=0.000故拒绝原假设,通过F检验。 基本假定检验四 1、异方差检验 等级相关系数检验 做abs(e)与x的等级相关系数,得出表如下 aa 相关系数aaa aa )原油(万吨aa 生铁(万吨)aa 原煤(万吨)aaa 时)发电量(亿千瓦a abseaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa N(双侧)Sig.abse相关系数N(双侧)Sig.相关系数发电量(亿千瓦时)N(双侧)Sig.相关系数原煤(万吨)N(双侧)Sig.相关系数生铁(万吨)NSig.(双侧)rho的Spearman 相关系数)原油(万吨aaa 18.1.000aaaa 18.000.998**aaaaa 18.000.994**aaaaa 18.000.994**aaaa 18.291.263 aaaa 18.000.998**aaaa 18.1.000aaaa 18.000.989**aaaaa 18.000.988**aaaa 18.236.294 aaaa 18.000.994**aaaaa 18.000.989**aaaa 18.1.000aaaa 18.000.997**aaaa 18.365.227 aaaa 18.000.994**aaaaa 18.000.988**aaaaa 18.000.997**aaaa 18.1.000aaa 18.399.212 aaa 18.291.263aaa 18.236.294aaa 18.365.227aaa 18.399.212aaa 18.1.000aaaaaa 时,相关性是显著的。 0.01在置信度(双测)为**. 由表中P值全大于0.01,故接受原假设,模型中不存在异方差。 2、自相关检验 b模型汇总模型R方调整R方标准估计的误差Durbin-Watson R a.922 140.71641 .997 .997 .9991 a.预测变量: (常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。 b.因变量: 成品钢材(万吨) DW=0.992n=18k=5,查表得出,故DW落入无法确定1.87d? d? 0.82,ul的领域。 自相关性不明显,由此也看出DW检验的局限性。 3、多重共线性 aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig.aa 共线性统计量 a Baaaa 误差标准aa 试用版 aa 容差a VIFaaaaaaaaaaaa 发电量(亿千瓦时)原煤(万吨)生铁(万吨)原油(万吨 )1(常量)aaaaa .389-17.818.554-.041170.287aaaaa .199115.468.170.090494.572aaaaa .438-.018.608-.031aaaaa 1.952-.1543.267-.457.344aaaaa .073.880.006.655.736aaaaa .004.014.006.041aaaaa 261.48073.861180.10524.672aaaaa : 成品钢材(万吨)因变量a. aaa 共线性诊断aaaaa 维数模型aa 特征值aa 条件索引aa 方差比例 aaa )常量(aa )原油(万吨aa 生铁(万吨)aa 原煤(万吨)aaa 时)发电量(亿千瓦aaaaaa 543211aaaaa .000.001.004.1184.878aaaaa 137.10088.71837.1066.4351.000aaaaa .05.57.36.02.00aaaaa .51.46.03.00.00aaaaa .68.28.03.00.00aaaaa .70.21.09.00.00aaaaa .84.16.00.00.00aaaaa 成品钢材(万吨): 因变量a. 因为VIF中有两个远远的大于10,故模型存在严重的多重共线性。 由共线性诊断表中数据得出,、、之间存在多重共线性。 xxx423故先剔除变量,再做线性回归,得出表如下: x4. aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig.aa 共线性统计量 a Baaaa 误差标准aa 试用版 aa 容差a VIFaaaaaaaaaa 原煤(万吨)生铁(万吨)原油(万吨 )1常量()aaaa 118.233.871-.10859.520aaaa 100.887.054.092538.378aaaa .122.956-.082aaaa 1.17216.144-1.178.111aaaa .261.000.258.914aaaa .021.066.047aaaa 46.95615.17621.142aaaaa a.成品钢材(万吨): 因变量 aaa 共线性诊断aaaaa 维数模型aa 特征值aa 条件索引aa 方差比例 aaa )常量(aa )原油(万吨aa 生铁(万吨)aa 原煤(万吨)aaaaa 43211aaaa .001.003.0793.917aaaa 87.74333.6867.0421.000aaaa .64.33.02.00aaaa .96.04.00.00aaaa .28.66.06.00aaaa .87.13.00.00aaaaa 成品钢材(万吨): 因变量a. 由于模型中仍然存在多重共线性,故继续剔除VIF最大的变量,再做线性回x3归,得出表如下 aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig.aa 共线性统计量 a Baaaa 误差标准aa 试用版 aa 容差a VIFaaaaaaaa 生铁(万吨)原油(万吨)1常量()aaa .920-.017-282.131aaa .034.049458.218aaa 1.010-.013aaa 26.871-.345-.616aaa .000.735.547aaa .168.168aaa 5.9675.967aaaaa 成品钢材(万吨)因变量: a. a共线性诊断方差比例条件索引特征值维数模型 (常量) 原油(万吨) 生铁(万吨) .00.00.001 12.9221.000 .19.03.076.006.2042 .81 1.00 .002 3 .97 38.315 a.因变量: 成品钢材(万吨) aaa 系数aaa 模型aa 非标准化系数aa 标准系数a ta Sig.aa 共线性统计量 a Baaaa 标准误差aa 试用版 aa 容差a VIFaaaaaaaa 生铁(万吨)原油(万吨)1常量()aaa .920-.017-282.131aaa .034.049458.218aaa 1.010-.013aaa 26.871-.345-.616aaa .000.735.547aaa .168.168aaa 5.9675.967aaaaa 因变量a.成品钢材(万吨): 由于剔除变量后,VIF值都小于10,故多重共线性得以消除,得出x3新的回归方程: x? 0.92? 0.017x282.131y? ? 214、异常值和强影响值 aaa 残差统计量aa aa 极小值aa 极大值aa 均值aaaa 偏差标准a Naaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 距离。 Mahal已删除的残差化Student已删除的残差残差Student化残差标准残差调整的预测值预测值的标准误差预测值标准预测值aaaaaaaaaa 1.487-1.867-316.76953-1.710-1.300-182.887652770.477553.220-1.1102738.5310aaaaaaaaaa 10.9532.128292.427921.8871.714241.1956910140.2559117.7171.87010059.5371aaaaaaaaaa 3.778-.045-20.88723-.057.000.000005485.890072.288.0005465.0028aaaaaaaaaa 2.4171.070173.806821.022.874123.052932473.4477417.0571.0002457.27013aaaaaaaaaa 18181818181818181818 aaaaa 居中杠杆值的距
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 应用 实例 讲解