云南省旅游消费影响因素分析主成分分析方法.docx
- 文档编号:11960926
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:10
- 大小:1.55MB
云南省旅游消费影响因素分析主成分分析方法.docx
《云南省旅游消费影响因素分析主成分分析方法.docx》由会员分享,可在线阅读,更多相关《云南省旅游消费影响因素分析主成分分析方法.docx(10页珍藏版)》请在冰豆网上搜索。
云南省旅游消费影响因素分析主成分分析方法
云南省旅游消费影响因素分析
小组成员:
付显勇王修平
1、背景介绍及研究的目的
旅游业是以提供服务为主的综合性服务行业,通过提供食、住、行、游、购等服务满足人们对旅游业的需求。
旅游业现已成为全球经济中发展势头最强劲和规模最大的产业之一。
近年来,中国旅游业一直保持较高的发展速度,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。
而云南作为中国的旅游大省,旅游业是其新兴支柱产业。
本文的研究对象是云南省的旅游收入,目前学术界对旅游出现了许多不同的定义,一般都是从各个角度给旅游下的定义,这样的定义多达十多种,分别描述了旅游的不同方面。
另外影响旅游的因素也是不计其数,从经济状况、人口、社会结构,到目的地的旅游资源开发、两地交通、两地文化差异,以及国际游的汇率、通胀率和政治环境等诸多因素都会影响旅游。
结合本次案例的实际,由于近十几年我国旅游增长主要集中在国内游方面,并且经济环境、政治环境、旅游资源优势相对稳定,本案例选取的影响因素包括以下几个方面:
居民人均可支配收入、入境旅游人数、旅游接待天数、入境旅游者人均天消费额、旅游饭店数、公路里程。
数据的来源均为历年的云南统计年鉴。
旅游属于奢侈品的一种,是人们在物质生活得到满足之后对于精神生活的一种追求。
随着现代旅游学研究规模的不断深入,人们逐渐发现,旅游并不仅仅是一种经济现象,更多的是一种社会文化现象。
旅游活动所涉及的范围之广泛都是以往任何活动都无法比拟的。
随着旅游的快速发展和广泛流行,人们对旅游现象的研究逐渐由经济角度专项奖旅游作为一种复杂的社会现象来研究。
这是旅游学卖出了下载的范畴,开阔了研究视野。
很显然,这些人文方面的影响目前为止是很难用定量分析来进行研究的,例如我们只能研究旅游收入、人数方面的因素,而必须忽略旅游中带个人们美的感受和人文气息的熏陶,因为那些事物无法定量化研究。
2、运用EViews软件分析影响云南省旅游消费收入因素
(一)、数据的选择与处理
1、影响因素的选择
影响云南省旅游消费收入的影响因素有很多,我们这里选取最重要的几个因素进行分析,包括旅游接待天数(X1)、入境旅游者人均天消费额(x2)、居民人均可支配收入(x3)、入境旅游人数(x4)、旅游饭店数(x5)、公路里程(x6)。
2、数据的收集
表1国内旅游收入数据资料
年份
旅游收入/亿元(Y)
旅游接待天数/天(X1)
人均天消费额/美元(X2)
人均可支配收入/元(X3)
入境者人数/人(X4)
旅游饭店数(X5)
公路里程/公里(X6)
1999
175.08
1648475
163.01
6178.68
1040000
259
102405
2000
183.19
1557453
166.93
6324.64
1001141
408
163604
2001
226.36
1751459
171.2
6797.71
1131303
431
163953
2002
255.00
2029803
170.22
7240.56
1303550
560
164852
2003
278.31
1603080
170.99
7643.6
1000101
572
166133
2004
334.08
1911976
171.76
8870.9
1100994
747
167050
2005
386.15
2616071
170.61
9265.9
1502787
799
167638
2006
447.10
3241139
173.76
10069.9
1810017
867
198496
2007
494.74
4004101
182.73
11496.1
2219030
887
200333
2008
594.77
4527585
187.29
13250.2
2502170
904
203753
2009
730.66
5457749
180.85
14423.93
2844902
826
206028
2010
916.82
6151988
182.31
16064.54
3291532
560
209231
2011
1195.73
7501258
186.59
18575.62
3953837
563
214524
三、采用主成份法进行共线性处理。
根据样本数据得到各解释变量的样本相关系数关系如下图所示:
从上图可知,各解释变量之间的相关系数较高,旅游收入Y与旅游接待天数X1、旅游接待天数X1与旅游者人数X4、人均可支配收入X3与旅游者人数X4之间的相关系数分别为0.9806、0.9985、0.9771,均在0.9以上,所以这些解释变量之间显然存在多重共线性,而从实际上看也该存在多重共线性,与模型假设无多重共线性不符合,因而所得结果异常。
采用主成分分析法处理共线性:
各成分分析如下:
主成分分析结果如下
第1主成分
第2主成分
第3主成分
第4主成分
第5主成分
第6主成分
特
征
向
量
X1
0.425
-0.342
0.222
0.141
0.290
-0.741
X2
0.423
0.100
-0.273
-0.857
-0.001
-0.049
X3
0.432
-0.229
0.237
0.106
-0.823
0.122
X4
0.424
-0.357
0.164
0.078
-0.477
0.658
X5
0.323
0.800
0.485
0.097
0.102
0.020
X6
0.411
0.231
-0.747
0.468
-0.004
-0.007
特征值
5.027
0.684
0.160
0.109
0.020
0.0006
贡献率
0.838
0.114
0.027
0.018
0.003
0.0001
累积
贡献率
0.838
0.952
0.979
0.997
0.9999
1.000
碎石图:
各成分变量载荷图如下:
由上表结合碎石图以及载荷图可以看出,第1主成分的贡献率为83.8%,已能较好地反映6个一致指标的总体变动情况,而且根据它的特征值可以发现第2个特征值开始明显变小,碎石图在第二主成分处左右出现明显的拐弯,表中已经给出对应的特征向量,且累计贡献率大于95%,因此选取第一和第二主成分,设为Z1、Z2两大类主成分
选取各成分(变量)对主成分贡献率大于0.23的变量为主成分的组合成分,则两大主成分的表达式为:
PC1=0.425X1+0.423X2+0.432X3+0.424X4+0.323X5+0.411X6
PC2=-0.342X1+0.100X2-0.229X3-0.357X4-+0.800X5+0.231X6
对变量进行标准化处理
键入命令:
GENRy1=(y-@mean(y))/@stdev(y),其余X也采用同样的方法。
得到相应的Y1X11X22X33X44X55X66
对标准化变量进行回归得到模型:
Z1Z2的表达式如下:
GenrZ1=0.425*x11+0.423*x22+0.432*x33+0.424*x44+0.323*X55+0.411*X66
GenrZ2=-0.342*X11+0.1*x22-0.229*x33-0.357*x44+0.8*X55+0.231*X66
得到的数据信息如下
对新生成的主成分Z1和Z2进行相关性分析如下表:
从上表可看出,经过将六个变量整合为Z1和Z2两个主成分后,两者之间不再有明显的相关性,因此可认为该操作消除了变量之间的共线性
第一大主成分Z1由旅游接待天数X1、人均天消费额X2、人均可支配收入X3、旅游者人数X4、公路里程X6构成,且每一类的贡献率都在0.4左右,所以Z1几乎是这五项的等权平均,因此可以将他看成是旅游消费收入的直接影响因素
第二大主成分Z2的主要成分是旅游饭店x5,贡献率达到0.8,且他与其他成分的相关性不高,因此可以把它看成是旅游消费收入的间接影响因素
对主成分进行最小二乘估计,得出结果:
其中,修正可决系数为0.959542,整体拟合状况良好。
pc1和pc2的p值均为0,表明这两个因素对y有显著影响。
5.求解标准化回归系数:
由于y和x都是标准化变量,所以标准化回归系数
=116.3136
-85.9048
(i=1,2,…,6)其中
,
为主成分与变量y回归后的系数,
,
为原6个变量表示前两个主成分时的系数。
最终模型中的系数
=
,
即为利用主成分消除共线性后,原变量在最终模型中的系数。
、
分别为Y和
的标准差。
首先,将Y、X1~X6作为数组打开,在窗口菜单上选择DescriptiveStats\CommonSample,
得到各变量的均值和标准差,如下:
计算过程可以在Excel表中进行操作操作如下:
其中,
=
-
最终模型为:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 云南省 旅游 消费 影响 因素 分析 成分 方法