数学建模江西旅游市场分析.docx
- 文档编号:30316709
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:26
- 大小:195.06KB
数学建模江西旅游市场分析.docx
《数学建模江西旅游市场分析.docx》由会员分享,可在线阅读,更多相关《数学建模江西旅游市场分析.docx(26页珍藏版)》请在冰豆网上搜索。
数学建模江西旅游市场分析
课程设计报告
课程设计题目:
江西省旅游需求的预测与分析
2013年01月12日
基于两种预测模型的江西旅游需求的预测
摘要
本文主要对江西省旅游需求的预测进行研究,收集近15年的相关数据,分别利用灰色理论GM(11)模型和多元线性回归分析模型进行预测,并运用平均相对误差(MAPE)参数来确定这2种模型对该问题预测的精确度,进行对比分析。
最后,运用关联度分析法确定各因素的影响程度。
GM(11)模型:
在分析灰色预测模型基本原理的基础上,利用测近20年的旅游量。
预测模型比较分析:
本文借助平均相对误差(MAPE)参数对以上2种预测方法的预测结果进行分析比较,说明回归分析模型对江西旅游量的预测更加合理可行。
预测模型
回归分析
灰色理论
MAPE
0.013718
0.020357
MATLAB强大的矩阵功能,实现灰色预测GM(1,1)模型算法,并通过残差检验和关联度检验对该模型进行验证,预测江西未来五年旅游量。
多元线性回归分析模型:
先将多个单因素分别与旅游量进行拟合,再将单因素确定的矩阵与旅游量通过matlab拟合,确定其为线性关系,故本问题可用回归模型预测。
在得出旅游量与各因素的线性关系之后,通过各因素的值预关联分析:
本文收集了1996~2010年江西每年的旅游量以及5个影响因素的时间序列资料。
运用关联度分析法确定各因素的影响程度,按关联度大小排序为:
全国居民人均可支配收入,江西省星级酒店数量,全国居民恩格尔系数,江西省商品零售价格指数,江西省高速公路里程。
关键词:
旅游预测灰色理论GM(1,1)多元线性回归分析
关联度分析
1.
问题的提出
我国的旅游资源极其丰富,是一个国际旅游大国。
合理规划、正确地预测预报旅游需求,对于促进我国各地区的经济发展和文化交流有着重要意义。
现在要求你们选择合适的旅游城市或地区,对旅游需求的预测和预报建立数学模型,来帮助有关部门进一步规划好旅游资源。
具体说:
1.对你们所选的旅游城市或地区,根据你们能够查到的关于旅游需求的预测预报资料,并结合你们从相关旅游部门了解到的情况,分析旅游资源、环境、交通、季节、费用和服务质量等因素对旅游需求的影响,建立关于旅游需求的预测预报的数学模型。
2.你们可以利用国内外已有的与旅游需求预测预报相关的数学建模资料和方法,分析这些建模方法能否直接移植过来,做出合理、正确的预测预报;如果不行的话,请对这些方法的优、缺点做出评估,并提出改进的办法。
但在引用他人的资料时必须注明出处。
3.为了能够用数学建模的方法对旅游需求进行预测预报,必须做好哪些准备工作(包括有关数据的采集和整理)?
在调研及对你们所建立的数学模型分析的基础上写出一篇报告,向有关旅游部门提出具体的建议。
二.问题的分析与模型假设
本文主要探讨的是对江西省旅游产业发展进行预测,并分析影响该旅游业的主要因素,及时向有关部门提出合理建议,推动江西省整个旅游产业的快速发展。
首先,打算收集从1996年到2010年与江西旅游业发展有关的数据,初步预计建立2种预测模型分别是:
灰色理论GM(1,1)模型,多元回归模型。
其次,本文根据上述2种模型求解的结果以及运用平均相对误差法确定这2种模型的精确度,对比分析,找出最适合求解该类问题的模型并加以推广。
最后,初步选定用关联度分析法从若干个因素中筛选出对问题影响相对较大的因素并对剩下的因素进行排序,指出哪些因素主要影响旅游业发展,及时向有关部门提出合理建议。
2.为了更方便的研究问题,我们做出了如下假设:
(1)收集到的数据真实有效,客观的反应了江西旅游业的现状;
(2)假设旅游需求只与全国居民人均可支配收入,江西省星级酒店数量,全国居民恩格尔系数,江西省商品零售价格指数,江西省高速公路里程有关;
(3)假设江西旅游业没有跳跃式发展,相对平稳;
(4)假设江西旅游业不受重大灾害(特大洪水,非典,猪流感)影响;
(5)假设江西省旅游产业结构没有发生重大调整。
三.符号说明
(1)
:
一次平均移动值;
(2)
:
二次平均移动值;
(3)
:
平均移动项数;
(4)x(0):
原始序列;
(5)x
(1):
累加序列;
(6)y:
旅游需求量
四.预测模型建立与求解
4.1收集数据
本文从江西统计年鉴和中国统计年鉴收集了1996年至2010年江西每年的旅游量和旅游收入以及5个影响因素的时间序列资料(见表1)。
其中影响江西旅游量和旅游收入的5个因素为:
全国居民人均可支配收入,江西省星级酒店数量,全国居民恩格尔系数,江西省商品零售价格指数,江西省高速公路里程。
表11996-2010年江西每年的旅游量和旅游收入及影响因素的时间序列资料
年份
旅游总人数
旅游总收入
江西省星级酒店数量
江西省高速公路里程
江西省商品零售价格指数
全国居民人均可支配收入
全国居民恩格尔系数
1996
1309
50.15
91
65
106.6
4838.90
48.80
1997
1614
79.35
92
70
99.60
5160.30
46.60
1998
1620
81.64
110
212
98.80
5425.10
44.70
1999
2094
111.29
124
263
96.80
5854.00
42.10
2000
2537
134.6
136
414
98.50
6280.00
39.40
2001
2900
161.39
142
421
98.40
6859.60
38.20
2002
3270
191.1
140
666
100.2
7702.80
37.70
2003
3391
197.47
140
1040
100.1
8472.20
37.10
2004
4089
240.81
145
1425
103.0
9421.60
37.70
2005
5058
320.02
147
1559
100.9
10493.0
36.70
2006
6000
390.89
186
1761
101.2
11759.5
35.80
2007
6944
463.67
190
2206
104.0
13785.8
36.30
2008
8100
559.38
200
2316
106.1
15780.7
37.90
2009
9399.7
675.61
215
2433
99.10
17174.6
36.50
2010
10815
818.00
243
3088
102.1
19109.0
35.70
4.2灰色理论(GM1)模型
4.2.1背景知识
目前使用最广泛的灰色预测模型就是关于数列预测的一个变量、一阶微分的GM(1,1)模型。
它是基于随机的原始时间序列,经按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近。
经证明,经一阶线性微分方程的解逼近所揭示的原始时间序列呈指数变化规律。
因此,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测是非常成功的。
4.2.2GM(1,1)模型的建立
设原始非负数据序列为:
x(0)=(x(0)
(1),x(0)
(2),x(0)(3)…x(0)(n))
(1)
(1)一次AGO(1-AGO)生成序列即对原始数据进行一次累加,以弱化原始序列的随机性和波动性。
x
(1)=(x
(1)
(1),x
(1)
(2),x
(1)(3)…x
(1)(n))
(2)
式中,x(k)=
k=1,2,…n
(2)采用一阶单变量微分方程进行拟合,得到白化方程的GM(1,1)模型:
(3)
式中的a,u为待定系数
灰微分方程动态模型为:
x(0)(k)+az
(1)(k)=u(4)
式中z
(1)(k)为x
(1)(k)的紧邻均生成,即z
(1)(k)=0.5x
(1)(k)+0.5x
(1)(k-1)。
(3)构造矩阵B和数据向量Yn
x(0)与x
(1)满足Yn=B
,其中:
(4)计算系数a,u
(5)
Yn=B
可由(5)计算出系数a,u
(5)累加模型预测结果
(6)
(6)还原后的预测结果(作IAGO)
(7)
4.2.3检验和判断GM(1,1)模型的精度
为确保所建灰色模型有较高的精度能应用于预测实际,按灰色理论一般采用三种方法检验判断GM(1,1)模型的精度,它们是:
残差大小检验;关联度检验和后验差检验。
通常关联度要大于0.6,残差e(k)、方差C越小,模型精度P越好。
(1)残差检验
残差检验:
相对误差:
(2)关联度检验
因分辨系数ξ是在(0,1)中取定的实数,一般取ξ=0.5。
关联度是各关联系数ξ(k)累加后在n维空间的平均值。
当分辨系数ξ=0.5,认为关联度大于0.6时可以接受,即通过关联度检验,否则关联程度差些。
4.2.4模型求解与检验
(1)根据以上建立的模型,编写MATAB程序,将1996年到2010年江西旅游客量带人程序中,直接可得
a=-0.1525u=1170.8
时间响应式:
累加预测结果:
(1039,2923,4543,6637,9174,12074,15344,18735,22824,27882,33882,40826,48926,58326,69141)
还原预测结果:
(1309,1480,1724,2008,2339,2724,3173,3696,4305,5014,5840,6803,7923,922910749)
(2)对模型进行残差检验和关联度检验
由以上检验方法,计算得到关联度为:
0.6870大于0.6
其相对误差与1996~2010年江西游客量实际值与预测值见表3。
该模型通过检验。
表31996~2010年江西游客量实际值与预测值和相对误差表
年份
实际游客量(万)
预测游客量(万)
绝对误差
相对误差(%)
1996
1309
1309
0
0
1997
1614
1480
134
8.28
1998
1620
1724
104
-6.44
1999
2094
2008
86
4.09
2000
2537
2339
198
7.80
2001
2900
2724
175
6.05
2002
3270
3173
97
2.95
2003
3391
3696
305
-9.00
2004
4089
4305
216
-5.29
2005
5058
5014
44
0.86
2006
6000
5840
160
2.66
2007
6944
6803
141
2.04
2008
8100
7923
177
2.18
2009
9399.7
9229
171
1.82
2010
10815
10749
66
0.61
实际值与预测值如下图(折线为真实值,点位预测值)
图4实际值与预测值拟合图
4.2.5模型预测
通过以上建立的模型,预测江西2011~2015年游客量,结果如下表
表42011-2015年江西旅游量预测值
年份
2011
2012
2013
2014
2015
游客总人数(万)
12520
14582
16984
19782
23041
旅游总收入(亿元)
947.91
11423
1378.2
1661.9
2003.88
4.3建立多元线性回归分析的模型
式中
都是与
无关的未知参数,其中
称为回归系数。
其中
为
阶单位矩阵。
本题中
分别表示江西
旅游总收入,星级酒店数量,高速公路里程,商品零售价格指数,全国人均可支配收入,恩格尔系数,
表示江西总旅游人数。
利用总收入与总旅游人数的数据画出拟合图
图5总收入与总旅游人数的数据拟合图
图5它们之间是线性关系,符合多元线性回归模型要求的条件。
依次类推其它的因素可知初步达到建立多元线性回归模型的条件。
最终得到的模型为:
y=-206.055+14.1299
+0.6997
+0.2806
+27.6024
-0.1361
-31.5573
4.3.1多元线性回归分析的模型的求解
利用上面的通式以及数据经Matlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法(通过最小化误差的平方和寻找数据的最佳函数匹配),用法是:
b=regress(Y,X),b为回归系数估计值。
[b,bint,r,rint,stats]=regress(Y,X,alpha)
alpha为显著性水平(缺省时设定为0.05),b,bint为回归系数估计值和它们的置信区间,r,rint为残差(向量)及其置信区间,stats是用于检验回归模型的统计量。
代入已知的
并且用rcoplot(r,rint)画出残差(向量)及其置信区间。
图6
第15个值不包含零点,所以剔除得到修正。
重复上面的步骤画出残差(向量)及其置信区间图。
图7
运行得到stats=
1.0e+004*
0.00011.17620.00000.1216
有四个数值,第一个是复相关系数
,其值大于0.8说明拟合程度高,第二个是
第三个是与
对应的概率
说明回归模型成立,第四个是
残差的方差
,
残差越小,拟合值与观测值越接近,各观测点在拟合直线周围聚集的紧密程度越高,拟合的模型就越为精确。
在模型确定后,回归系数就定下来了,就得到了具体回归系数模型。
将
数据代入就会有
的预测数据。
表5江西省
实际游量和预测量
年份
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
旅游总人数
1309
1614
1620
2094
2537
2900
3270
3391
4089
5058
预测人数
1328
1575
1662
2074
2528
2869
3307
3413
4069
5055
年份
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
旅游总人数
6000
6944
8100
9399
10815
预测量
6005
6946
8073
9419
11480
21178
21223
21040
21137
21333
运用单因素分别与旅游总人数拟合得到
的数据,重新代入该模型,发现预测的数据不太理想(预测值见表5)。
需要用真实的
才能得到比较理想的旅游人数。
五.模型对比分析
为了验证以上各种模型的可行性,本文对回归分析模型,灰色系统模型来进行对比分析,本文选取2005-2010年间2个模型的预测结果,见表7。
年份
实际旅游总人数
灰色理论测得值
多元回归分析测得值
2005
5058
5014
5055
2006
6000
5840
6005
2007
6944
6803
6946
2008
8100
7923
8073
2009
9399.7
9229
9419
2010
10815
10749
11480
本文用MAPE(绝对平均误差%)这个参数来评价模型的精确度,其计算公式为:
式中:
代表模型预测输出值;
是实际旅游人数。
在这里n取2,i=1,2,3,4,5,6。
现将以上几个模型的MAPE值计算列于表8。
表8 MAPE值
预测模型
回归分析
灰色理论
MAPE
0.013718
0.020357
MAPE是一个模型预测精确度的评价指标,用于评价模型预测值与实际值的相关性。
MAPE值越小,表示模型的预测效果越好。
由表8可以看出,在这个参数上,回归分析模型的预测效果比灰色模型好,说明回归分析对江西旅游量的预测更加合理可行。
六.因素关联分析
关联分析法简介:
大千世界里的客观事物往往现象复杂,因素繁多。
我们往往需要对系统进行因素分析,这些因素中哪些对系统来讲是主要的,哪些是次要的,哪些需要发展,哪些需要抑制,哪些是潜在的,哪些是明显的。
关联分析法主要根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程度。
本文运用关联分析法确定各因素的关联程度,即对江西旅游的影响因素。
关联分析过程:
(1)本文收集了1996年至2010年江西每年的旅游量和旅游收入以及5个影响因素的时间序列资料(见表1)。
其中影响江西旅游量和旅游收入的5个因素为:
全国居民人均可支配收入,江西省星级酒店数量,全国居民恩格尔系数,江西省商品零售价格指数,江西省高速公路里程。
根据表一做曲线图,如下:
plot(t,x1,'-b*',t,x2,'-g*',t,x3,'-k*',t,x4,'-c*',t,x5,'-m*')
江西省星级酒店数量(蓝色)
江西省高速公路里程
(绿色)
江西省商品零售价格指数(黑色)
全国居民人均可支配收入(灰色)
全国居民恩格
尔系数(紫色)
图81996-2010年江西旅游相关数据折线图
(2)将数据无量纲化,运用MATLAB编程直接算出各因素的关联度。
如下:
表9 各因素的关联度
级别
1
2
3
4
5
因素
全国居民人均可支配收入
江西省星级酒店数量
全国居民恩格尔系数
江西省商品零售价格指数
江西省高速公路里程
关联度
0.9332
0.9203
0.9043
0.8924
0.6493
对表9进行分析,关联度大小排序为:
全国居民人均可支配收入,江西省星级酒店数量,全国居民恩格尔系数,江西省商品零售价格指数,江西省高速公路里程。
故全国居民人均可支配收入对江西旅游业影响最大。
七.模型的评价与推广
优点:
灰色理论GM(1,1)模型:
这种预测模型简单,经济并且针对普遍问题还是有较高的可信度。
多元回归模型:
该模型简单易懂,可以直接调用matlab软件工具箱对问题进行回归分析。
关联度分析:
该分析方法可对生活中相对复杂,因素繁多且是动态过程发展态势的现象进行量化比较分析有较好的效果。
缺点:
灰色理论GM(1,1)模型:
该模型要求原始数据序列比较“规矩”,未来的数据要和过去的以及现在的数据有相同的发展趋势,上下波动不能太大,否则会在某一时刻产生较大的偏差。
多元回归模型:
单因素与预测值之间必须大致是线性关系,灵活性差。
对已有数据预测另一单因素准确,但有数据缺失的情况预测效果差。
关联度分析:
该方法只对于问题中一些可以进行量化的因素分析,而不能将与问题相关且不能量化的因素考虑在内。
推广:
在遇到现实生活中许多预测问题时,可根据问题本身的特点,相应的选择上述几种模型进行求解,必要时选择多种模型求解进行结果分析对比,会有意想不到的收获。
八.有关建议
1.制定旅游业发展规划
由历年的统计数据表明江西最近几年的旅游业发展迅速,政府须制定中长期旅游发展规划,以合理引导并促进旅游业及相关服务业发展。
2.开发旅游资源,完善配套设施,
一方面,江西由于其自身特点,地域并不广阔、旅游资源有限;一方面旅游业发展势头强劲,这在一定程度上就造成了矛盾。
江西可以通过开发新的旅游资源并完善相关配套设施、适当限制外来人口落户江西来提高环境的容纳能力,进而满足日益增长的旅游需求。
3打响属于江西自己的旅游口号
结合江西在中国革命时期所起到的作用并利用与其相关的旅游景点,打响属于江西自己的旅游口号(如将现在已有的“红色旅游”的口号声势进一步壮大)。
参考文献
[1]姜启源,谢金星,叶俊.数学建模.北京:
高等教育出版社,第三版.2003.
[2]朱旭,李焕琴,籍万新.matlab软件与基础数学实验.西安:
西安交通大学出版社.2008.
[3]司守奎.数学建模算法大全,烟台:
海军航空工程学院出版社.
[4]高隽.人工神经网络原理及仿真实例[M].北京:
机械工业出版社.2003.
[5]邓聚龙.灰色预测与决策.武汉:
华中工学院出版社.1985.
[6]肖华勇.使用数学建模与软件使用.西安:
西北工业大学出版社.2008
[7]王泽星.数学实验与数学建模.南昌:
东华理工大学.2011
附原程序:
clc,clear
x0=[13091614162020942537290032703391408950586000694481009399.710815]';
n=length(t0);
t1=cumsum(t0);%累加运算
B=[-0.5*(t1(1:
end-1)+t1(2:
end)),ones(n-1,1)];Y=t0(2:
end);
r=B\Y;
y=dsolve('Dy+a*y=b','y(0)=y0');
y=subs(y,{'a','b','y0'},{r
(1),r
(2),t1
(1)});
yuce1=subs(y,'t',[0:
n+3]);
%为提高预测精度,先计算预测值,再显示微分方程的解
y=vpa(y,6)%其中的6表示显示6位数字
yuce=diff(yuce1);%作差分运算,进行数据还原
yuce=[t0
(1),yuce]
yuce_new=yuce(n+1:
end)%求得的四个预测值
误差分析:
clc,clear
x0=[13091614162020942537290032703391408950586000694481009399.710815]';%注意这里为列向量
n=length(x0);
jibi=x0(1:
n-1)./x0(2:
n)%计算级比
range=minmax(jibi')%计算级比的范围
x1=cumsum(x0);%累加运算
B=[-0.5*(x1(1:
n-1)+x1(2:
n)),ones(n-1,1)];
Y=x0(2:
n);
u=B\Y;
x=dsolve('Dx+a*x=b','x(0)=x0');
x=subs(x,{'a','b','x0'},{u
(1),u
(2),x1
(1)});
yuce1=subs(x,'t',[0:
n-1]);
%为提高预测精度,先计算预测值,再显示微分方程的解
y=vpa(x,6)%其中的6表示显示6位数字
yuce=[x0
(1),diff(yuce1)]%差分运算,还原数据
cancha=x0'-yuce%计算残差
xiangduiwucha=abs(cancha./x0')%计算相对误差
jibipiancha=1-(1-0.5*u
(1))/(1+0.5*u
(1))*jibi'%计算级比偏差值
结果:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 江西 旅游 市场分析