数学建模之统计回归模型.docx
- 文档编号:443810
- 上传时间:2022-10-10
- 格式:DOCX
- 页数:25
- 大小:24.87KB
数学建模之统计回归模型.docx
《数学建模之统计回归模型.docx》由会员分享,可在线阅读,更多相关《数学建模之统计回归模型.docx(25页珍藏版)》请在冰豆网上搜索。
数学建模之统计回归模型
数学建模大作业
统计回归模型
摘要
某公司想用全行业的销售额作为自变量来预测公司的销售额,题目给出了1977—1981此公司的销售额和行业销售额的分季度数据表格。
通过对所给数据的简单分析,我们可以看
出:
此公司的销售额有随着行业销售额的增加而增加的趋势,为了更加精确的分析题目所给的数据,得出科学的结论,从而达到合理预测的目的。
我们使用时间序列分析法,参照课本统计回归模型例4,做出了如下的统计回归模型。
在问题一中,我们使用MATLB数学软件,画出了数据的散点图,通过观察散点图,发现公司的销售额和行业销售额之间有很强的线性关系,于是我们用线性回归模型去拟合,发现有很好的拟合性。
但是这种情况下,并没有考虑到数据的自相关性,所以我们做了下面几个问题的分析来对这个数学模型进行优化。
在问题二中,通过建立了公司销售额对全行业销售额的回归模型,并使用DW检测诊断随机误差项的自相关性。
通过计算和查DW表比较后发现随即误差存在正自相关,也就是说前面的模型有一定的局限性,预测结果存在一定的偏差,还有需要改进的地方。
在问题三中,因为在问题二中得出随即误差存在正自相关,为了消除随机误差的自相关性,我们建立了一个加入自相关后的回归模型。
并对其作出了分析和验证,我们发现加入自相关后的回归模型更加合理。
通过使用我们建立的模型对公司的销售额进行预测,发现和实际的销售额很接近,也就是说模型效果还不错。
关键词:
销售额、回归模型、自相关性
一、问题提出
某公司想用全行业的销售额作为自变量来预测公司的销售额,下表给出了
1977-1981年
公司销售额和行业销售额的分季度数据(单位:
百万元).
(1)
画出数据的散点图,观察用线性回归模型拟合是否合适。
(2)
监理公司销售额对全行业销售额的回归模型,并用
DW检验诊断随机误差项的自相
关性。
(3)
建立消除了随机误差项自相关性后的回归模型。
年
季
t
公司销售额
行业销售额
年
季
t
公司销售额
行业销售额
y
x
y
x
1977
1
1
20.96
127.3
1979
3
11
24.54
148.3
2
2
21.40
130.0
4
12
24.30
146.6
3
3
21.96
132.7
1980
1
13
25.00
150.2
4
4
21.52
129.4
2
14
25.64
153.1
1978
1
5
22.39
135.0
3
15
26.36
157.3
2
6
22.76
137.1
4
16
26.98
160.7
3
7
23.48
141.2
1981
1
17
27.52
164.2
4
8
23.66
142.8
2
18
27.78
165.6
1979
1
9
24.10
145.5
3
19
28.24
168.7
2
10
24.01
145.3
4
20
28.78
171.7
1
二、基本假设
假设一:
模型中ε(对时间t)相互独立。
三、符号说明
公司销售额:
y(百万)
行业销售额:
x(百万)
概念介绍:
1.自相关:
自相关(autocorrelation),又称序列相关(serialcorrelation)是指总体
回归模型的随机误差项之间存在的相关关系。
即不同观测点上的误差项彼此相关。
2.置信区间:
如果P(axb)=1-α,α=0.1或0.05,则称区间[a,b]为x的置信度为
1-α的置信区间。
3.时间序列:
时间序列法是一种定量预测方法,亦称简单外延方法。
时间序列即按时间的推移或排布会对规律的变化有所影响。
四、问题分析
问题一:
表中的数据是以时间为顺序的。
由于前期的销售额对后期的投资一般有明显的影响,从而对后期的后期的销售额造成影响。
因此在此模型中应考虑到存在自相关,我们可以先建立基本的回归模型,然后再进行自相关性诊断,并建立新的回归模型。
问题二:
在问题一之后,就可以接着求出问题二,然后利用DW检验诊断随机误差项的自相关性。
问题三:
进行了自相关诊断后,将自相关加入模型中,建立消除了随机误差项自相关性的回归模型。
五、模型的建立与求解
5.1问题一
5.1.1问题一的分析
表中数据是以时间为序的,建立基本的回归模型。
5.1.2问题一模型的建立
基本回归模型:
设该公司第t时间的公司销售额为yt,行业销售额为xt。
为了大致分析yt和xt的关系,首先利用表中的数据作出yt对xt关系作出散点图,如下(见图中的“+”):
做散点图:
2
可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此本题用线性回归模型拟合非常合适。
5.2问题二
5.2.1问题二的分析
从问题一中的图形可以看出,随着行业销售额的增加,公司销售额增大,而且两者有很强的线性关系,图中的直线说明两者呈线性模型,因此可建立一元线性回归模型。
5.2.2问题二模型的建立
由题意建立一元线性回归模型
yt01xtt
(1)
模型
(1)中除了行业销售额和公司销售额的影响外,影响
yt的其他因素都包含在随机
误差t内,这里假设
t(对t相互独立)且服从均值为零的正态分布N(0,)。
5.2.3问题二模型的求解
根据表中的数据。
对模型(
1)直接利用MATLAB统计工具箱求解(具体算法见附录),
得到的回归系数估计值及置信区间(置信水平α=0.05)、检验统计量R,F,
p的结果见下表:
参数
参数估计值
参数置信区间
0
-1.4548
【-1.9047
-1.0048
】
0
0.1763
【0.1732
0.1793
】
R=1.0e+004*0.0001
F=1.0e+004*1.4888
P=1.0e+004*0.0000
将参数估计值代入
(1)得到:
3
yt
1.45480.1763xt
(2)
用MATLAB中rstool命令得到的交互式画面见图
(1),由此可以得出不同水平下的预测值及其置信区间。
通过左下方的Export下拉式菜单。
可以输出模型的统计结果。
图1
自相关性诊断与处理方法从表面上来看得到的基本模型
(2)拟合度(R)非常之高,接近你100%,应该很满意了,但是,这个模型并没有考虑到我们的数据是一个时间序列(将原表中
的数据打乱不影响模型
(2)的结果)。
实际上对于时间序列数据做回归分析时,模型的随机
误差t有可能存在相关性,违背模型关于t(对时间t)相互独立的基本假设,其他相关因
素对公司销售额的影响肯能也有时间上的延续,包含在随机误差t中,即随机误差t会出现
自相关性。
^
t的估计值,画出et~et1的散点图,能够从直观上判
残差et
ytyt可以作为随机误差
断t的自相关性。
模型
(2)的残差可在计算过程中得到表1,以及数据et
~et1的图见图2
t
1
2
3
4
5
e
-0.0282
-0.0642
0.0198
0.1616
0.0443
t
6
7
8
9
10
e
0.0441
0.0412
-0.0608
-0.0968
-0.1516
t
11
12
13
14
15
e
-0.1505
-0.0555
-0.0255
0.1033
0.0828
t
16
17
18
19
20
e
0.1034
0.0263
0.0395
-0.047
-0.0359
表1
4
图2
为了对ε的字相关性做定量的诊断,并在确诊后得到新的结果,我们考虑如下模型
yt01xt
t
,tt1ut
(3)
其中
是自相关系数,|
|
1,ut相互独立且服从均值为
0的正态分布。
若=0,则退化为普通的回归模型;若>0,则随机误差t存在正的自相关;若<0,则随
机误差t存在负的自相关。
利用D-W检验诊断自相关现象如下:
利用MATLAB算出:
y0=0.0980y1=0.1326
^
DW=0.7388=0.6306
(具体程序见附录)
^^^
因为DW≈2(1-
),
1
所以
0
≤
≤
若
的估计值在
0
附近,则
的值在
2
1
DW4,
DW
^
附近,t的自相关行很弱,若
在正负1附近,则DW接近0或4,t的自相关性很强。
5.2.4问题二结果的分析及验证
5
要根据DW的具体数值确定
t是否存在自相关,查D-W分布表,可以得到检验的临界值dL
和dU,然后根据区间来确定。
利用表1给出的残差et,根据以上式子可得出
DW=0.7388,对于显著性水平α=0.05,
n=20,k=2,查D-W分布表,得到检验的临界值
dL
=1.2和
dU
=1.4.现在DW<
因此可以认
dL
^
为随即误差存在正自相关,而且可得出=0.6306。
5.3问题三
5.3.1问题三的分析
题目要求建立消除了随机误差项目自相关性后的回归模型,即是加入了自相关后的回归模型,下面我们将自相关性加入问题中。
5.3.2问题三模型的求解
^
=1
DW
加入自相关后的回归模型
2
做变换
yt*
yt
yt1
,xt*
xtx1,t1
(4)
则模型(3)转化为
*
*
*
ut
,
*
0(1
)
(5)
yt
0
1x1t
0
其中ut相互独立且服从均值为零的正态分布,所以(5)是普通回归模型。
^
yt*,x1t*估计模型(5)
以
的估计值带入(3)和(4)做变换,利用变换后的数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 统计 回归 模型