建模论文.docx
- 文档编号:8866537
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:35
- 大小:231.06KB
建模论文.docx
《建模论文.docx》由会员分享,可在线阅读,更多相关《建模论文.docx(35页珍藏版)》请在冰豆网上搜索。
建模论文
2010年上海世博会对旅游业的影响
摘要
城市是人类文明的结晶,2010年上海世博会正以“和谐城市”的理念来回应对“城市,让生活更美好”的祈求。
世博会正日益影响各国人们的生活、科技、文化等。
本文就旅游这方面侧面定量评估上海世博会的影响力。
模型一考虑的是旅游业投资受上海世博会的影响。
首先通过灰色Verhulst预测模型,分析了每年(1990—2002)对旅游的实际投资金额,得出微分方程的解为:
,即可算出每年(1990—2009)对旅游的预测旅游业总投资,把2003—2009预测旅游业总投资与2003—2009实际旅游业总投资进行了残差分析,即上海世博会对旅游投资影响的量化值,得出对应年份的残差值分别为:
4.546,14.1,23.441,40.776,67.563,77.50,116.677,说明世博会对上海旅游业的投资有着很强的拉动力。
模型二考虑的是2010上海世博会对旅游业的收入的影响。
首先根据1983—2002年的上海旅游收入的线性分布图,初步识别为一个非平稳序列,然后对其进行平稳化处理,得出二阶差分消除序列的非平稳性,并通过了ADF检验,根据Box-Jenkins模型识别方法,用自回归移动平均模型(ARMA(p,q))模型进行拟合,导出了上海旅游未来收入的模型:
特别地,我们对该模型进行了检验,从而定量估计2010上海世博会对旅游业的收入的影响。
模型三通过1995年至2009年的来沪境外游客人数,拟定两个预测模型(指数模型和Logistic模型),鉴于指数模型的拟合优度偏大,所以选择指数模型
,其能更好地预测未来几年的游客人数,同时能预测世博结束后上海境外来沪旅游的人数。
关键词:
Verhulst预测残差分析ARMA模型Logistic模型
一、问题重述
2010年,世界博览会在我国上海举行,是历来首次由中国举办的博览会。
这次博览会的主题是“城市,让生活更美好”(BetterCity,Betterlife),预计吸引世界各地7000万人次参观者前往,总投资达450亿人民币,超过北京奥运会,是世界博览会史上最大规模。
这次世博会将进一步向世界宣传我国,提高我国的国际形象,大大促进中外经济、文化交流,极大地促进上海城市的发展,拉动长三角乃至全国的发展。
历届世博会的举办不仅极大提高了举办地的声誉,对举办国的社会、文化、经济各领域来说都是一笔宝贵的财富,影响深远。
本题要求我们选择一个感兴趣的方面,查阅利用相关数据,建立数学模型,对2010上海世博会的影响力进行一个定量的评估。
二、条件假设与符号约定
条件假设
1、假设所查的数据为权威性(除特殊说明外);
2、无特殊说明为,本文中世博会均指2010上海世博会;
3、假设时间序列的统计不随时间的平移而变化;
4、假设
的模型中上限值
小于某一值的时候就出现极坏的“极坏的”
模型;
5、假设后奥运时期的影响小于经济危机的影响。
符号约定
为
的模型中上限值
为待接人数数量;
为
软件计算的参数值
为
软件计算的参数值
为第t年上海入境游客人数
为
软件计算出的拟合优度
为自回归系数
为移动平均系数
为
的
期时间序列的变量
滞后因子
自相关系数
是非线性变化趋势
是概率值
三、问题分析
上海世博会充分演绎“城市,让生活更美好”为主题,表达着现代人的对新型城市、环保城市、更自然城市、更人性化城市的追求和向往。
世博会的成功举办,将会大中国的文化、经济、政治等方面都会产生巨大而深远的影响。
这里我们以2010年上海市世博会对旅游业的影响进行讨论。
为了更准确地定量估计2010年上海世博会对旅游业的影响,首先,我们收集到了1980年到2010年的上海年鉴关于上海市旅游业投资、上海市旅游收入以及1995——2009年上海市境外来沪旅游的总人数,我们对上海市旅游业投资、旅游业收入、境外来沪旅游的总人数这三个方面分别建立三个模型来定量估计2010年上海世博会对旅游业产生的影响。
为表述2010上海世博会对旅游业投资的影响。
我们引进灰色Verhulst预测模型对世博的旅游投资进行数据分析,特别地对若无世博会的假设情况下,预测2002年以的后每年的上海市旅游投资额,然后再与实际的旅游投资额相比较,如果两者相差很大,则说明世博会对上海旅游业的投资有着很强的拉动力。
第二个方面考虑的是2010上海世博会对旅游业的收入的影响。
这里我们考虑的是从世博申请成功到世博的成功举办的这段期间。
这段时间内,上海市旅游业投资总额为111.5亿元,大大提高的其本地的旅游基础设施的建设,从而吸收了大量的国内外旅客。
我们以1983——2002年期间上海市旅游收入总额统计数据为基础,进行平稳时间序列分析,预测即使没有世博会预期,2003——2009年期间上海市旅游业收入总额的情况(对于2010年世博会开园期间,部分数据我们进行了定量的描述),然后再与这段时期的实际旅游收入相比较,从而定量估计2010上海世博会对旅游业的收入的影响。
对于境外来沪旅游的总人数方面的影响,通过对1995——2009年数据进行比拟,建立指数模型,通过拟合优度分析,预测2010——2012年这三年的境外来沪旅游的人数,确定世博会结束后对上海境外来沪旅游的人数的影响。
四、模型的建立及求解
4.1模型一世博会对旅游投资贡献
世博会带来的投资包括直接投资和间接投资两个部分。
其中,直接投资包
括运营费、参展费、展馆与相关设施建设费、新增城市基础设施费(包括世博会直接带动的市政建设投资和交通运输投资),据世博会初步估计,世博会的直接投资将达300亿元RMB左右;间接投资是指即使不举办世博会也需要增加的城市基础设施投资,只是因为举办世博会而提前或进一步扩大的投资,专家估计由世博会引起延伸领域的投资将放大5~10倍,即上海世博会将产生1500一3000亿元RMB的间接投资。
其中,世博会的直接旅游投资即是前世博阶段在世博园区内建设旅游设施所花费的投资,是世博直接投资的一部分;世博会的间接旅游投资主要是指由世博会拉动的旅行社、旅游交通设施、宾馆业三部分的投资。
表
(1)世博会旅游业直接投资
世博村动迁费用(亿元)
7.05
世博村建设投资(亿元)
23.05
表
(2)世博会旅游业间接投资总额
年份
实际投资(亿元)
年份
实际投资(亿元)
1990
1.6
2000
17.47
1991
3.94
2001
18.379
1992
6.076
2002
19.20
1993
8.014
2003
19.95
1994
9.778
2004
20.64
1995
11.382
2005
21.26
1996
12.841
2006
21.82
1997
14.177
2007
22.34
1998
15.374
2008
22.34
1999
16.472
2009
23.23
至此我们引进灰色Verhulst预测模型对世博的旅游投资进行数据分析建模分析,并对无世博情况时,预测2002年以后每年的旅游投资,再与实际的旅游投资相比较,进而可以估计出在有世博情况下对旅游投资的拉动影响力。
应用灰色系统理论可对社会、经济等抽象系统进行分析、建模、预测。
首先对灰色Verhulst预测模型进`行理论介绍:
1)Verhulst模型
Verhulst模型的基本原理和计算方法如下:
设
为原始数据序列:
为
的一次累加生成
序列
为
的紧邻均值生成列:
则称
为灰色Verhulst模型
和
为参数。
称
为灰色Verhulst模型的白化方程,
为时间。
2)应用灰色Verhulst预测模型求解
利用互联网得到每年(1990—2009)对旅游的实际投资金额,如下表:
表(3)Verhulst预测旅游业总投资(亿元)
年份
实际投资
预测投资
投资增长率(%)
残差
相对误差△k(%)
1990
1.600
1.600
——
0.000
0
1991
2.500
2.944
56.25
-0.44
5.78
1992
3.300
3.076
32.00
0.224
6.71
1993
7.600
8.015
130.00
-0.415
0.5
1994
12.700
11.778
67.10
0.422
3.32
1995
10.100
10.382
-20.0
-0.282
2.79
1996
17.100
16.841
70.00
0.259
2.49
1997
25.200
17.168
47.36
1.255
4.98
1998
12.900
14.374
-48.80
-1.474
5.82
1999
16.500
16.472
27.90
0.028
0.02
2000
14.200
15.470
-13.94
-1.27
2.3
2001
18.600
18.378
30.99
0.222
0.12
2002
18.600
19.203
0.00
-0.603
0.32
2003
24.500
19.954
31.72
4.546
——
2004
34.800
20.637
42.04
14.1
——
2005
44.700
21.259
28.45
23.441
——
2006
63.600
22.824
42.28
40.776
——
2007
89.900
22.337
41.35
67.563
——
2008
100.900
22.8046
12.23
77.50
——
2009
140.300
23.230
39.14
116.677
——
2010
——
鉴于模型建立的普遍性,因此可以仅对影响规模的制约因素中的投资进行模拟检验并预测,应用MATLAB编程(见程序一)并求出相应模型方程的表达式及模型合理的检验。
从上表可以看出相对误差△k均比较理想小,相对误差除(1991、1992、1994、1998)外也均可以接受。
并且在确认该模型准确性时,对2002年以后进行了预测,在实际中遇到政策决策时很有参考意义。
图1世博前期实际旅游投资的线性图
图2世博建设期间旅游投资的线性图
图3各时间段实际与预测投资对比曲线图
图(3)综合了两个时段两种投资(实际投资与虚拟投资)的对比,其中1990—2002的实际投资为时段2003—2009预测提供了可预测数据,1990—2002时段两段曲线的可侧面反映模型的可行性,具体合理性解释见图(4)的分析。
时段2003—2009之间的投资对比是在对模型的可预测检验之后才有对比的性的。
图4残差立体直方图
图(4)是残差立体直方图,是对模型检验(时段1990—2002)及世博对旅游投资的拉动影响力的直观表现。
即是定量确立了世博对旅游投资的量化的影响力。
从上图也可以看出,2002年以的后每年的上海市旅游投资额,预测再与实际的旅游投资额相比较,如果两者相差很大,说明了世博会对上海旅游业的投资有着很强的拉动力。
图5投资增长率
反常点合理性解释,对应年份1998、2000、2003、2008旅游投资增长率下降分别对应1998年洪水,2000经济危机,2003非典型性肺炎,2008再次经济危机。
据此可反证模型建立的合理性,反映了实际突发时间时的模型的仍然实用性。
3)模型的优缺点分析
通过Verhulst预测模型对旅游的投资额进行建模分析,得出了理想的效果,不仅得出了模型方程:
,而且对抽象的世博影响力进行的定量分析,模型的预测与实际情况基本相符,可将该模型进行推广解决类似灰色问题,以便对问题科学预测,对行政决策提供很好的参考价值。
此模型预测的变量区间不能跨越太大,会产生病态预测结果。
4)模型的改进
模型的预测区间可调控性使得此模型不仅可以解决本文所阐述的问题,还可对模型进一步改进,加入可操控因子,使得预测区间跨越更大,而不会产生意想不到的跃变。
4.2模型二世博促收入模型
假设上海不举办世博会,即在无世博会预期下,以1983—2002年期间上海市旅游收入统计数据为基础,进行平稳时间序列分析,预测即使没有世博会预期,2003—2009年期间上海市旅游收入的情况,然后与实际的2003—2009年期间上海市旅游收入的情况作比较,从而定量估计2010上海世博会的影响力。
时间序列预测就是一个可以用来预测未来上海市旅游收入差距是否会更大的一种方法。
时间序列预测模型
1)时间序列预测概念
时间序列,指变量数据按照时间顺序变动排列而成的一种数列,反映变量随时间变化的发展过程,揭示未来变化规律,并对未来状态进行预测。
本文以上海市旅游收入为变量,预测2003一2009年上海市旅游收入的状况。
2)模型简介
时间序列分析,常用平滑法、趋势线法、季节性指数法和自回归法进行预测分析。
自回归滑动平均模型(Auto-RegressiveandMovingAverageModel,ARMA)是研究时间序列的重要方法,以自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”而成。
其中,时间顺序排列的观察值之间具有依赖关系或自相关性时,就采用自回归模型;ARMA(p,q)模型中包含了影响p自回归项和q移动平均项,ARMA(p,q)模型可以表示为:
(*)
为
期时间序列变量,
为自回归系数,
为移动平均系数,都是模型的待估参数,
为
的
期时间序列的变量。
引入滞后算子B,模型(*)可简记为
ARMA(p,q)过程的平稳条件是滞后多项式
的根均在单位圆外。
可逆条件是
的根都在单位圆外。
运用B-J方法研究时间序列,最重要的工具是自相关和偏自相关。
a.自相关:
构成时间序列的每个序列值
之间的简单相关关系称为自相关。
自相关程度由自相关系数
度量,表示时间序列相隔
期的观测值之间的相关程度:
其中,n是样本量;
为滞后期;
代表样本数据的算术平均值。
b.偏自相关:
对时间序列
,在给的
的条件下,
与
之间条件相关关系。
其相关程度用偏自相关系数
度量,有
,
其中
是滞后
期的自相关系数,
。
3)时间序列模型的建立与求解
首先在Matlab中,作出上海旅游收入线性分布图。
图6上海旅游收入线性分布图
Box-Jenkins时间序列建模方法是基于平稳时间序列的分析,从图中可以看出,中国从1982年到2002年的上海旅游收入具有明显的上升趋势,显现出指数增长的趋势,初步识别为一个非平稳序列。
因此,在对上海旅游收入建立时间序列模型前,首先要对其进行平稳化处理。
令:
,序列
是非线性变化趋势,故对序列
进行差分:
再对
零均值化,令:
,
对
进行平稳性检验。
上海旅游收入的ADF检验结果如下表:
表(4)
t-Statistic
Prob.*
AugmentedDickey-Fullerteststatistic
0.913640
0.9948
Testcriticalvalues:
1%level
-3.584743
5%level
-2.928142
10%level
-2.602225
*MacKinnon(1996)one-sidedp-values.
由上表可看出,上海旅游收入序列以较大的P值,即99.48%的概率接受原假设,即存在单位根,序列非平稳。
因此应该先对其做平稳化处理。
①.时间序列平稳化
这里考虑取对数,做出上海旅游收入序列的曲线图及ADF检验,发现其仍然呈现非平稳趋势。
因此考虑取对数后再进行一阶差分,记为DL。
图7上海旅游收入的一阶差分图
表(5)上海旅游收入的ADF检验结果
t-Statistic
Prob.*
AugmentedDickey-Fullerteststatistic
-3.596367
0.7643
Testcriticalvalues:
1%level
-3.753996
5%level
-3.1654793
10%level
-2.2439568
*MacKinnon(1996)one-sidedp-values.
通过看图,可初步识别序列平稳。
但ADF的值为-3.596367,大于其中的一个检验水平的临界值,因此它没有通过ADF检验,为一非平稳序列。
所以要进行二阶差分,记为DIFF。
二阶差分图如下:
图8上海旅游收入的二阶差分图
表(6)上海旅游收入的ADF检验结果
t-Statistic
Prob.*
AugmentedDickey-Fullerteststatistic
-3.788046
0.0005
Testcriticalvalues:
1%level
-3.685728
5%level
-3.0167526
10%level
-2.6439872
*MacKinnon(1996)one-sidedp-values.
通过看图,可初步识别序列已平稳。
并且
的值为-3.788046,分别小于不同检验水平的三个临界值,因此它通过了
检验,为一平稳序列。
在这里应该注意的是要防止过度差分。
一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点,
(1)序列的样本容量减小;
(2)方差变大;所以建模过程中要防止差分过度。
对于一个序列,差分后若数据的极差变大,说明差分过度。
此处,我们认为二阶差分已可以消除序列的非平稳性。
②.模型建立与参数估计
根据Box-Jenkins模型识别方法,用ARMA(p,q)模型进行拟合。
首先利用SPSS16.0做出二阶对数差分的自相关以及偏相关函数图,以判断模型阶数。
图9上图分别为上海旅游收入的自相关分析图和上海旅游收入的二阶偏相关分析图
可以看出,自相关系数在K=4后很快的趋近于0,所以取q=4;偏相关系数也是在K=4后趋近于0,两者均具有较明显的拖尾性质,可判断时间序列模型为ARMA(4,4)模型较为合适。
利用Eviews5.0对模型进行估计,结果如下:
表(6)
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.256812
0.086540
3.109236
0.0056
AR
(2)
0.625842
0.165745
3.402938
0.0074
AR(3)
0.256252
0.152875
1.358954
0.0048
AR(4)
-0.132142
0.051750
-2.553468
0.0014
MA
(1)
0.158869
0.059302
2.678972
0.0080
MA(3)
-0.245871
0.165424
-1.745852
0.0085
MA(4)
-0.752485
0.153422
-4.588225
0.0000
R-squared
0.354122
Meandependentvar
0.141529
AdjustedR-squared
0.304405
S.D.dependentvar
0.167683
S.E.ofregression
0.139852
Akaikeinfocriterion
-1.006881
Sumsquaredresid
0.938807
Schwarzcriterion
-0.821005
Loglikelihood
31.68236
F-statistic
5.656530
Durbin-Watsonstat
1.823555
Prob(F-statistic)
0.000231
InvertedARRoots
.45
-.30
InvertedMARoots
1.00
-.75
从上表可以看出概率
说明参数显著。
采用ARMA(4,4)模型进行平稳时间序列分析,根的倒数都在单位圆内,时间序列{
}模型是平稳的。
可以导出上海旅游未来收入的模型如下:
4)模型的检验和预测
经过模型识别与诊断,模型是合理的。
运用该模型,我们对历史数据进行回报检验,发现对历史数据基本吻合,平均绝对误差率仅为2.79%,可见模型回报检验的结果比较理想。
表(7)回报检验表
年份
旅游业总收入
(亿元)
旅游总收入预测值(亿元)
误差率(%)
1983
11.1
11.6772
-5.2
1984
11.8
10.4784
11.2
1985
13.1
13.1262
-0.2
1986
14.3
14.8291
-3.7
1987
15.7
15.857
-1
1988
18.6
19.0464
-2.4
1989
21.1
22.1972
-5.2
1990
24.2
24.9986
-3.3
1991
30.9
31.8579
-3.1
1992
40.3
38.46635
4.55
1993
57.3
56.22276
1.88
1994
78
75.114
3.7
1995
99.1
96.92971
2.19
1996
124.8
123.15264
1.32
1997
154.22
151.428618
1.81
1998
171.84
172.87104
-0.6
1999
199.23
202.61691
-1.7
2000
236.37
238.02459
-0.7
2001
272.86
276.68004
-1.4
2002
323.87
328.40418
-1.4
因此,可用该模型进行短期预测。
预测结果见下表:
表(7)2003年至2009上海市旅游实际总收入和旅游预测总收入
2003年
2004年
2005年
2006年
2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 建模 论文