数学建模之统计回归模型Word下载.docx
- 文档编号:13371887
- 上传时间:2022-10-10
- 格式:DOCX
- 页数:25
- 大小:24.87KB
数学建模之统计回归模型Word下载.docx
《数学建模之统计回归模型Word下载.docx》由会员分享,可在线阅读,更多相关《数学建模之统计回归模型Word下载.docx(25页珍藏版)》请在冰豆网上搜索。
DW检验诊断随机误差项的自相
关性。
(3)
建立消除了随机误差项自相关性后的回归模型。
年
季
t
公司销售额
行业销售额
y
x
1977
1
20.96
127.3
1979
3
11
24.54
148.3
2
21.40
130.0
4
12
24.30
146.6
21.96
132.7
1980
13
25.00
150.2
21.52
129.4
14
25.64
153.1
1978
5
22.39
135.0
15
26.36
157.3
6
22.76
137.1
16
26.98
160.7
7
23.48
141.2
1981
17
27.52
164.2
8
23.66
142.8
18
27.78
165.6
9
24.10
145.5
19
28.24
168.7
10
24.01
145.3
20
28.78
171.7
二、基本假设
假设一:
模型中ε(对时间t)相互独立。
三、符号说明
公司销售额:
y(百万)
行业销售额:
x(百万)
概念介绍:
1.自相关:
自相关(autocorrelation),又称序列相关(serialcorrelation)是指总体
回归模型的随机误差项之间存在的相关关系。
即不同观测点上的误差项彼此相关。
2.置信区间:
如果P(axb)=1-α,α=0.1或0.05,则称区间[a,b]为x的置信度为
1-α的置信区间。
3.时间序列:
时间序列法是一种定量预测方法,亦称简单外延方法。
时间序列即按时间的推移或排布会对规律的变化有所影响。
四、问题分析
问题一:
表中的数据是以时间为顺序的。
由于前期的销售额对后期的投资一般有明显的影响,从而对后期的后期的销售额造成影响。
因此在此模型中应考虑到存在自相关,我们可以先建立基本的回归模型,然后再进行自相关性诊断,并建立新的回归模型。
问题二:
在问题一之后,就可以接着求出问题二,然后利用DW检验诊断随机误差项的自相关性。
问题三:
进行了自相关诊断后,将自相关加入模型中,建立消除了随机误差项自相关性的回归模型。
五、模型的建立与求解
5.1问题一
5.1.1问题一的分析
表中数据是以时间为序的,建立基本的回归模型。
5.1.2问题一模型的建立
基本回归模型:
设该公司第t时间的公司销售额为yt,行业销售额为xt。
为了大致分析yt和xt的关系,首先利用表中的数据作出yt对xt关系作出散点图,如下(见图中的“+”):
做散点图:
可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此本题用线性回归模型拟合非常合适。
5.2问题二
5.2.1问题二的分析
从问题一中的图形可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此可建立一元线性回归模型。
5.2.2问题二模型的建立
由题意建立一元线性回归模型
yt01xtt
模型
(1)中除了行业销售额和公司销售额的影响外,影响
yt的其他因素都包含在随机
误差t内,这里假设
t(对t相互独立)且服从均值为零的正态分布N(0,)。
5.2.3问题二模型的求解
根据表中的数据。
对模型(
1)直接利用MATLAB统计工具箱求解(具体算法见附录),
得到的回归系数估计值及置信区间(置信水平α=0.05)、检验统计量R,F,
p的结果见下表:
参数
参数估计值
参数置信区间
-1.4548
【-1.9047
-1.0048
】
0.1763
【0.1732
0.1793
R=1.0e+004*0.0001
F=1.0e+004*1.4888
P=1.0e+004*0.0000
将参数估计值代入
(1)得到:
yt
1.45480.1763xt
用MATLAB中rstool命令得到的交互式画面见图
(1),由此可以得出不同水平下的预测值及其置信区间。
通过左下方的Export下拉式菜单。
可以输出模型的统计结果。
图1
自相关性诊断与处理方法从表面上来看得到的基本模型
(2)拟合度(R)非常之高,接近你100%,应该很满意了,但是,这个模型并没有考虑到我们的数据是一个时间序列(将原表中
的数据打乱不影响模型
(2)的结果)。
实际上对于时间序列数据做回归分析时,模型的随机
误差t有可能存在相关性,违背模型关于t(对时间t)相互独立的基本假设,其他相关因
素对公司销售额的影响肯能也有时间上的延续,包含在随机误差t中,即随机误差t会出现
自相关性。
^
t的估计值,画出et~et1的散点图,能够从直观上判
残差et
ytyt可以作为随机误差
断t的自相关性。
模型
(2)的残差可在计算过程中得到表1,以及数据et
~et1的图见图2
e
-0.0282
-0.0642
0.0198
0.1616
0.0443
0.0441
0.0412
-0.0608
-0.0968
-0.1516
-0.1505
-0.0555
-0.0255
0.1033
0.0828
0.1034
0.0263
0.0395
-0.047
-0.0359
表1
图2
为了对ε的字相关性做定量的诊断,并在确诊后得到新的结果,我们考虑如下模型
yt01xt
,tt1ut
其中
是自相关系数,|
|
1,ut相互独立且服从均值为
0的正态分布。
若=0,则退化为普通的回归模型;
若>
0,则随机误差t存在正的自相关;
若<
0,则随
机误差t存在负的自相关。
利用D-W检验诊断自相关现象如下:
利用MATLAB算出:
y0=0.0980y1=0.1326
DW=0.7388=0.6306
(具体程序见附录)
^^^
因为DW≈2(1-
),
所以
≤
若
的估计值在
附近,则
的值在
DW4,
DW
附近,t的自相关行很弱,若
在正负1附近,则DW接近0或4,t的自相关性很强。
5.2.4问题二结果的分析及验证
要根据DW的具体数值确定
t是否存在自相关,查D-W分布表,可以得到检验的临界值dL
和dU,然后根据区间来确定。
利用表1给出的残差et,根据以上式子可得出
DW=0.7388,对于显著性水平α=0.05,
n=20,k=2,查D-W分布表,得到检验的临界值
dL
=1.2和
dU
=1.4.现在DW<
因此可以认
dL
为随即误差存在正自相关,而且可得出=0.6306。
5.3问题三
5.3.1问题三的分析
题目要求建立消除了随机误差项目自相关性后的回归模型,即是加入了自相关后的回归模型,下面我们将自相关性加入问题中。
5.3.2问题三模型的求解
=1
加入自相关后的回归模型
做变换
yt*
yt1
,xt*
xtx1,t1
(4)
则模型(3)转化为
*
ut
,
0(1
)
(5)
1x1t
其中ut相互独立且服从均值为零的正态分布,所以(5)是普通回归模型。
yt*,x1t*估计模型(5)
以
的估计值带入(3)和(4)做变换,利用变换后的数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 统计 回归 模型