多元线性回归分析法文档格式.docx
- 文档编号:14521657
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:9
- 大小:134.53KB
多元线性回归分析法文档格式.docx
《多元线性回归分析法文档格式.docx》由会员分享,可在线阅读,更多相关《多元线性回归分析法文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
1.1多元线性回归的计算模型
设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:
其中,为常数项,为回归系数,为固定时,每增加一个单位对y的效应,即对y的偏回归系数;
同理b2为固定时,每增加一个单位对y的效应,即对y的偏回归系数,等等。
如果两个自变量同一个因变量y呈线相关时,可用二元线性回归模型描述为:
建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:
(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;
(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;
(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;
(4)自变量应具有完整的统计数据,其预测值容易确定。
1.2多元线性回归模型的检验
多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。
(1)拟合程度的测定。
与一元线性回归中可决系数相对应,多元线性回归中也有多重可决系数,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。
计算公式为:
其中,=
=
(2)回归方程的显著性检验
回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。
通常采用F检验,F统计量的计算公式为
根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值,若,则回归方程具有显著意义,回归效果显著;
,则回归方程无显著意义,回归效果不显著。
三、模型的假设与说明
2.1模型的假设
(1)在理想情况下,价格指数问题只与给出的因素——利率、消费水平有关,我们只选取了一小部分而与其他部分无关。
(2)社会的发展平衡稳定,排除突发事件导致数据的突变。
(3)假设因素之间的联系较小,不存在一个因素的变化导致其他因素的剧烈变化。
(4)所给数据真实据可靠,反应实际情况。
2.2数据来源说明
表1各因素统计表(数据来源:
2008中国统计年鉴)
年份
1990
1991
1992
1993
1994
1995
1996
1997
1998
年利率
9.36
7.56
10.08
8.32
5.67
4.59
消费水平
229.2
249.0
282.0
305.8
320.0
345.1
377.6
394.6
417.8
商品零售价格指数
207.7
213.7
225.2
254.9
310.2
356.1
377.8
380.8
370.9
1999
2000
2001
2002
2003
2004
2005
2006
2007
2.25
1.98
2.52
3.46
452.3
491.0
518.8
552.5
588.5
632.3
682.3
747.8
824.1
359.8
354.4
351.6
347.0
346.7
356.4
359.3
362.9
376.7
年利率——根据我国各大银行,人民银行、建设银行的随即的记录结果进行的数据处理得
到,一年中利率的调整粗略的取其均值。
商品零售价格指数——价格指数编制由国家统计局城市社会经济调查司组织实施。
资料采
用抽样调查和重点调查相结合的方法取得,即在全国选择不同经济
区域和分布合理的地区,以及有代表性的商品作为样本,对其市场
价格进行定期调查,以样本推断总体。
商品零售价格指数的计算权
数主要根据社会商品零售额资料确定。
居民消费水平——其调查按类别分,计算权数根据近12万户城乡居民家庭消费支出构成确
定。
四、模型的建立与求解
Matlab上的散点图程序如下:
>
x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,
3.46];
x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,
632.3,682.3,747.8,824.1];
y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,
356.4,359.3,362.9,376.7];
subplot(2,1,1);
plot(x1,y,'
*'
);
subplot(2,1,2);
plot(x2,y,'
+'
)
运行结果如图1所示:
图1散点图
由图可知:
y与有较明显的线性关系,而y与则难以确定,做几种尝试,用统计分析决定优劣。
设多元线性回归模型为
为1990-2007年的利率,为1990-2007年的消费水平,y为商品零售价格指数。
模型求解的MATLAB程序如下:
632.3,682.3,747.8,824.1];
x=[ones(18,1)x1'
x2'
];
[b,bint,r,rint,stats]=regress(y'
x)
b=
251.2424
-2.2754
0.1908
bint=
91.9188410.5661
-14.12359.5727
-0.03200.4136
r=
-65.9753
-67.8489
-62.6452
-31.7521
20.8385
61.9495
73.4439
67.1705
50.3865
27.3796
14.5957
6.4915
-5.1527
-12.3214
-10.3640
-17.0038
-25.2867
-23.9057
rint=
-153.091921.1412
-155.209619.5119
-153.330528.0401
-123.714160.2099
-71.7544113.4315
-23.4503147.3494
-15.1859162.0737
-25.5579159.8989
-44.8588145.6319
-64.4279119.1870
-80.7849109.9763
-90.5133103.4964
-102.432792.1274
-110.031585.3887
-108.266887.5388
-112.803378.7956
-115.303264.7298
-98.838951.0276
stats=
0.44355.97710.0123
参数回归结果为,对应的置信区间分别为[91.9188,410.5661]、[-14.1235,9.5727]和[-0.0320,0.4136]。
其中:
b为回归系数估计值;
bint为置信区间;
stats包括判定系数,显著性检验F,概率p;
r为残差;
rint为置信区间。
其中判定系数是衡量拟合优度的一个重要指标,它的取值介于0与1之间,越接近于1,拟合度越好,反之越差。
五、结果分析与预测
接上面的程序继续在Matlab中输入指令:
rcoplot(r,rint)
set(gca,'
Color'
'
w'
可得到残差图如图2所示:
图2残差图
从残差图可以看出,数据的残差基本上离零点均较近,且残差的置信区间均包含零点,这说明回归模型能较好的符合原始数据。
对于若干组具体的数据,都可算出回归系数a,b,从而得到回归方程。
至于y与x之间是否真的有如回归模型所描述的关系,或者说用所得到的回归模型去拟合实际数据是否有足够好的近似,并不知道。
所以必须对模型进行检验。
用上述拟合结果,得到F=5.9771,现在取f=n−2=16;
取显著性水平∂为0.05,查表可得相应的F分布临界值为,显然有,F检验通过,所以可以用前面的回归方程来描述年利率及消费水平与商品零售价格指数的关系,置信度为95%。
根据以下程序及图得到商品零售价格指数:
632.3,682.3,747.8,824.1];
356.4,359.3,362.9,376.7]'
;
x=[x1'
x2'
rstool(x,y,'
linear'
图3分析与预测
由此可知:
下一年的商品零售价格指数的置信区间为:
[293.5238,363.3762]
.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 分析