陕西铁路客运需求分析.docx
- 文档编号:5212675
- 上传时间:2022-12-14
- 格式:DOCX
- 页数:31
- 大小:418.02KB
陕西铁路客运需求分析.docx
《陕西铁路客运需求分析.docx》由会员分享,可在线阅读,更多相关《陕西铁路客运需求分析.docx(31页珍藏版)》请在冰豆网上搜索。
陕西铁路客运需求分析
吧
课程设计
设计题目:
陕西铁路客运需求分析
课程名称:
运输统计与分析
学院:
交通运输工程学院
专业:
交通运输
班级:
交运1102班
学生姓名:
陈雷
学号:
201130010214
指导教师:
周和平、柳伍生、李利华、朱灿
====2012/2013学年第二学期====
课程设计(学年论文)任务书
课程名称:
运输统计与分析
适用对象:
交通运输工程
一、课程设计(论文)目的
《运输统计与分析》课程设计作为独立的教学环节,是交通运输本科专业的必修课。
其目的是,通过本课程设计实践,培养学生理论联系实际思想,加深统计分析基本理论与基本知识的理解,学会收集或调查行业统计数据,切实掌握各种统计分析方法,并能灵活运用统计软件在计算机上实现,正确解释和分析运行结果,培养运用各种统计分析方法解决交通运输领域内实际问题的能力。
二、课程设计(论文)题目与内容
本课程设计(论文)主要任务为:
针对交通运输领域内某一主题,设计调查表调查或查询相关统计数据,根据本课程讲授内容选择一种或多种合适的统计分析方法,运用SPSS建立模型分析问题。
题目自拟,但题名一般要包含主题与统计方法。
且必须与交通运输相关,选题主题主要包括:
1.运输市场定位研究
2.运输需求分析与预测
3.政策或技术方法实施效果评价
4.交通行为选择
5.影响因素分析
6.聚类分析
7.服务质量评价
8.自选
三、课程设计(论文)基本要求
报告内容原则上不少于8000字,其正文至少包括如下几个方面的内容:
1.问题背景(问题的提出、必要性与意义,该问题目前常用的分析手段与方法,本设计采用的方法)
2.数据采集
(含数据采集方式、描述性分析、统计图表)
说明:
调查分析则必须包含调查方案,其它数据原则上必须说明出处。
3.统计模型与分析
(包含模型原理、SPSS操作步骤、输出结果及分析)
4.总结
5.附录数据清单
四、课程设计(论文)时间及进度安排
1.时间:
两周:
2012-2013学年第二学期第十九、二十周
2.进度安排:
确定主题;调查、收集数据:
2天
数据分析与预处理、描述性统计分析:
2天
分析方法原理及选择:
3天
SPSS操作及结果分析:
4天
解决实际问题或建议:
2天
撰写报告、总结:
1天
(此部分同学们可以按照自己设计具体内容,详细安排)
3.成果提交:
要求独立完成,每人需提交1份打印的设计报告(A4)、word电子文档、数据文件(sav格式)。
电子文档文件名为:
学号后四位+姓名+题目,先发电子文档给指导老师,经许可后方可打印。
最终成果(打印稿1份、电子文档1份)统一交班长汇总并转交指导老师;最终成果提交截止时间为第20周周五。
五、成绩评定
平时考勤20%,报告撰写规范20%,内容(选题合理、方案可行、分析正确、有创新)60%。
成绩评定实行优秀、良好、中等、及格和不及格五个等级。
优秀者人数一般不得超过总人数的20%。
六、报告格式
课程设计报告装订顺序依次为:
封面、课程设计(学年论文)任务书、目录、正文、参考文献、成绩评定表。
报告中所有图表应按“章号-图表序号-图表名”(例:
图1-1-***频数图)进行编号。
具体格式参看实验报告样本。
七、主要参考资料
1.罗应婷等主编.SPSS统计分析从基础到实践.北京:
电子工业出版社,2007年6月;
2.章文波陈红艳编著.《实用数据统计分析及SPSS12.0应用》.人民出版社,2006年;
3.张文彤.SPSS.11.0统计分析教程.(高级篇).北京希望电子出版社.2002年6月;
4.郝黎仁等.SPSS实用统计分析.中国水利水电出版社.2003年1月。
1概述1
1.1研究背景1
1.2常用分析方法2
1.3本设计采用的分析方法3
2数据采集4
2.1数据来源4
2.2数据处理5
3统计模型与分析9
3.1因子分析法9
3.2时间序列法10
3.3曲线拟合法15
3.4线性回归分析法19
3.5预测值汇总表24
4总结25
4.1本设计的主要工作25
4.2存在的不足25
附录数据清单26
1概述
1.1研究背景
随着社会的发展,交通运输已成为国民经济正常运行的重要保障条件,也是人们生活不可或缺的支撑。
而铁路运输是陆地运输两个基本方式之一,它在整个运输领域中占有重要的地位,并发挥着愈来愈重要的作用。
目前,旅客运输需求是我国铁路客运专线运输组织与经营管理的基础。
铁路客运需求是社会经济生活在人的空间位移方面所提出的具有支付能力的需要,有实现位移的愿望和具备支付能力是客运需求的两个必要条件。
这些年来我国铁路运输需求也发生了一些变化,产生了新特点:
(1)铁路客运总量将快速上升:
(2)快捷,便利的铁路客运需求迅速上升:
(3)客流结构将发生明显变化。
但是,近年来,因为公路和民航运输的崛起,也使得铁路运输的市场占有率下降。
与此同时,铁路运输与公路、水运和民航的竞争格局已经形成,各种运输方式之间互相竞争,抢占市场行为日趋白热化。
铁路运输作为最具可持续性及环境友好性的交通运输模式,集中体现和标志
着一个国家的创新能力、综合国力和现代化程度,在保障国民经济正常运转和促进经济社会又好又快发展中起着不可替代的作用。
根据《铁路“十一五”规划》,“十一五"(2006--2010年)期间,中国将建设铁路新线17000公里,其中客运专线公里;建设既有线复线8000公里,既有线电气化改造15000公里。
2010年,全国铁路营业早程达到9力.公里以上,复线和电气化比例分别达到45%以上,快速客运网总规模达到20000公里以上,“十一五"铁路基建总投资将达12500亿元,是“十五"规模的近4倍。
这对于铁路旅客运输创造了新的社会形势,必将推动铁路旅客运输进一步向市场化迈进。
铁路客运需求量增加的原因:
一是在中长途途运输上,铁路运输相对公路运输有时间及价格上的优势,同时更为安全,相对于民航运输,则在价格上优势更为突出;二是随着科技的发展,火车几次提速加之高铁的运营使得铁路运输效率提高:
三是铁路客运的服务质量得到提高。
选题研究意义:
一是可以更好的满足社会需要,按市场需求提供运输能力。
二是正确认识铁路客运系统,进一步改善提高其效率。
三是增强铁路运输企业竞争力。
富有竞争性的市场,迫使铁路运输产品接受市场的检验。
因此了解消费需求,分析市场环境,制定和实施有效的营销模式,必将极大提高运输企业素质,改善经营管理,增强应变与竞争能力。
铁路旅客运输必须面向未来,因此对客运需求分析是很有必要的。
1.2常用分析方法
1.2.1时间序列法:
时间序列回归模型,是考虑事物发展的变化规律,以时间为自变量建立的一种相关模型,它既考虑了事物发展的延续性,又充分考虑到事物的发展受偶然因素的作用而产生的随机变化。
1.2.2因果分析法:
因果分析法是从其它经济指标、社会发展状况与交通量的关系水平进行预测,通过对客运量与社会经济指标的相关关系研究,建立并选择合适的数学模型进行计算,最后对各种预测结果进行汇总、对比、分析和研判,确定远景客运量
1.2.3组合预测:
组合预测方法是对同一个问题,采用两种以上不同预测方法的预测。
它既可是几种定量方法的组合,也可是几种定性的方法的组合,但实践中更多的则是利用定性方法与定量方法的组合。
组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度。
1.2.4回归分析法:
回归分析法是指根据预测的相关性原则,找出影响预测目标的各因素,并用数学方法找出这些因素与预测目标之间的函数关系的近似表达,再利用样本数据对其模型估计参数及对模型进行误差检验,一旦模型确定,就可利用模型,根据因素的变化值进行预测。
1.2.5灰色模型预测:
灰色预测模型是通过少量的、不完全的信息,建立数学模型并做出预测的一种预测方法。
1.3本设计采用的分析方法
本课程设计采用相关分析,因子分析,时间序列法,曲线拟合法,一元及多元线性回归预测法。
2
数据采集
2.1数据来源
本设计所需数据(旅客周转量,总人口,生产总值等)均来自2012年中国统计年鉴。
年度
铁路客运量(万人)
旅客周转量(亿人公里)
总人口
(万人)
生产总值(亿元)
公路客运量(万人)
2002
2670
207.4
3662
2253.39
28663
2003
2497
207.8
3672
2587.72
28159
2004
3231
255.5
3681
3175.58
31763
2005
3601
279.1
3690
3675.66
34780
2006
4370
294.9
3699
4523.74
38606
2007
4848
319.5
3708
5465.79
43555
2008
5218
350.6
3718
6851.32
70566
2009
5008
342.6
3727
8169.80
79033
2010
5411
362.6
3735
10123.48
87457
2011
5614
405.4
3743
12512.30
101062
表2-12007-2011年陕西省相关数据
2.2数据处理
本课程设计选取陕西省旅客周转量,总人口,生产总值,公路客运量作主要指标。
a旅客周转量,指旅客人数与运送距离的乘积,旅客周转量是制订运输计划和考核运输任务完成情况的主要依据之一。
故旅客周转量是一个重要影响因素。
b.总人口,作为陕西的消费者,人口数量将对客运量产生影响。
c.生产总值,国民经济同样会对交通运输业产生重要影响,故选取陕西生产总值作为解释变量之一。
d.公路客运量,作为陆地运输两大基本方式之一,很大程度上,公路运输可替代一部分铁路运输,公路客运量的增加会使铁路客运量减少,故也会对铁路客运量产生影响。
2.2.1数据描述性分析:
处理过程:
打开spss软件,在菜单栏中找到“分析—描述统计—探索”,单击出现一个对话框,在对话框中输入变量和数据,点击确定,即可得到最终数据。
表2.22-1描述统计量
N
极小值
极大值
均值
标准差
铁路客运量
10
2497
5614
4246.80
1160.502
旅客周转量
10
207.4
405.4
302.540
66.0281
总人口
10
3662
3743
3703.50
27.403
生产总值
10
2253.39
12512.30
5933.8780
3437.17528
公路客运量
10
28159
101062
54364.40
27393.521
有效的N(列表状态)
10
图2.22-1各变量与铁路客运量关系
表2.22-2相关性
铁路客运量
旅客周转量
总人口
生产总值
公路客运量
铁路客运量
Pearson相关性
1
.980**
.968**
.889**
.875**
显著性(双侧)
.000
.000
.001
.001
N
10
10
10
10
10
旅客周转量
Pearson相关性
.980**
1
.983**
.937**
.918**
显著性(双侧)
.000
.000
.000
.000
N
10
10
10
10
10
总人口
Pearson相关性
.968**
.983**
1
.959**
.946**
显著性(双侧)
.000
.000
.000
.000
N
10
10
10
10
10
生产总值
Pearson相关性
.889**
.937**
.959**
1
.982**
显著性(双侧)
.001
.000
.000
.000
N
10
10
10
10
10
公路客运量
Pearson相关性
.875**
.918**
.946**
.982**
1
显著性(双侧)
.001
.000
.000
.000
N
10
10
10
10
10
**.在.01水平(双侧)上显著相关。
2.3现状分析
对所研究的地区与行业发展现状进行分析,采用描述性统计方法进行分析。
经过以上数据分析可得:
(1)根据铁路客运量和其他指标的茎叶图,可知铁路客运量总体水平随各指标数量的增加而增加,呈正相关关系。
(2)根据各指标相互相关性表,可知各指标相互Pearson相关性均较强,且均为显著相关。
(3)根据各指标相互相关性表,可以看出铁路客运量并未与公路客运量呈现负相关关系,故不再作讨论。
3统计模型与分析
3.1因子分析法
3.1.1统计原理
因子分析法:
又叫因素分析,就是通过寻找众多变量的公共因素来简化变量中存在复杂关系的一种统计方法,它将多个变量总和为少数几个“因子”以在线原始变量与“因子”之间的相关关系。
3.1.2操作步骤
点击【分析】/【降维】/【因子分析】,弹出窗口,选择铁路客运量,旅客周转量,总人口,生产总值,年份作为变量,【抽取】选择主成分,单击【确定】,生出结果。
3.1.3输出结果分析
表3.13-2成份矩阵a
成份
1
铁路客运量
.975
旅客周转量
.992
总人口
.997
生产总值
.964
年份
.998
提取方法:
主成份。
a.已提取了1个成份。
表3.13-1公因子方差
初始
提取
铁路客运量
1.000
.951
旅客周转量
1.000
.983
总人口
1.000
.993
生产总值
1.000
.929
年份
1.000
.995
提取方法:
主成份分析。
表3.13-3解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
4.853
97.052
97.052
4.853
97.052
97.052
2
.117
2.344
99.397
3
.019
.372
99.769
4
.011
.230
99.998
5
8.233E-005
.002
100.000
提取方法:
主成份分析。
由上表分析可知,提取主成分1个,利用公式可生成一个新变量Z,即主权重。
Z=0.975*铁路客运量+0.992*旅客周转量+0.997*总人口+0.964*生产总值+0.998*年份
3.2时间序列法
3.2.1统计原理
从统计意义上讲,时间序列是将一个变量在不同时间上的不同数值按时间先后排列而成的数列。
从数学意义上讲,设Xt(t∈T)是一个随机过程,Xt(i=1,2,……,n)是在Xt在时刻i对过程Xt的观察值,则称Xt为一次样本实现,也就是一个时间序列。
从系统意义上讲,时间序列就是某一系统在不同时间(地点、条件等)的响应。
3.2.2SPSS操作步骤
说明SPSS操作步骤,如果涉及到统计量、图表以及相关参数选择,并须予以说明。
①按分析——预测----创建模型打开创建模型对话框
②在左侧源变量框中选择铁路客运量,旅客周转量,总人口,生产总值,作为因变量,将其送入因变量框,选择年份作为自变量,将其送入自变量框。
在方法一框中选择ARIMA,并设置条件中模型的几个值分别为2、1、2,然后点继续。
接着在统计表选项中选中显示预测值、拟合优度等选项。
③然后将模型框中选择多种方法进行拟合,并点击“确定”按钮,如图所示。
3.2.3输出结果分析
对输出结果进行详细分析,给出主要结论。
表3.23-1模型描述
模型类型
模型ID
铁路客运量
模型_1
ARIMA(2,1,2)
旅客周转量
模型_2
ARIMA(2,1,2)
总人口
模型_3
ARIMA(2,1,2)
生产总值
模型_4
ARIMA(2,1,2)
表3.23-2模型拟合
拟合统计量
均值
SE
最小值
最大值
百分位
5
10
25
50
75
90
95
平稳的R方
.544
.333
.237
.949
.237
.237
.255
.495
.882
.949
.949
R方
.965
.040
.923
1.000
.923
.923
.927
.968
.999
1.000
1.000
RMSE
192.819
229.473
.651
490.787
.651
.651
6.603
139.919
431.935
490.787
490.787
MAPE
3.282
2.573
.008
6.139
.008
.008
.712
3.491
5.644
6.139
6.139
MaxAPE
10.373
9.959
.019
23.889
.019
.019
1.925
8.792
20.402
23.889
23.889
MAE
91.508
106.703
.295
226.323
.295
.295
3.166
69.708
201.651
226.323
226.323
MaxAE
224.017
277.204
.688
596.516
.688
.688
6.865
149.431
515.753
596.516
596.516
正态化的BIC
8.718
5.990
.607
13.857
.607
.607
2.420
10.205
13.530
13.857
13.857
表3.23-3模型统计量
模型
预测变量数
模型拟合统计量
Ljung-BoxQ(18)
离群值数
R方
统计量
DF
Sig.
铁路客运量-模型_1
1
.923
.
0
.
0
旅客周转量-模型_2
1
.939
.
0
.
0
总人口-模型_3
1
1.000
.
0
.
0
生产总值-模型_4
1
.998
.
0
.
0
表3.23-4预测
模型
2012
2013
2014
2015
2016
铁路客运量-模型_1
预测
6069
6140
6557
6593
6973
UCL
7432
7844
8523
8690
9178
LCL
4706
4436
4592
4496
4768
旅客周转量-模型_2
预测
432.4
450.2
475.2
504.1
531.0
UCL
497.7
520.3
547.1
575.8
604.1
LCL
367.0
380.2
403.3
432.4
458.0
总人口-模型_3
预测
3751
3760
3768
3775
3783
UCL
3753
3762
3770
3778
3785
LCL
3749
3757
3765
3773
3780
生产总值-模型_4
预测
14890.14
17355.16
19991.25
22909.62
26174.32
UCL
15553.71
18080.65
20719.40
23688.13
26965.97
LCL
14226.57
16629.67
19263.10
22131.12
25382.68
对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。
图3.23-1时间与各变量关系图
由上述的表格以及图像可以得出上述六个变量与年份的时间序列分析的拟合度较高,均大大0.8,说明这个预测值的准确度较好。
其中,总人口数的R方的值为1.0,说明总人口数与年份的预测值最为准确。
3.3.曲线拟合预测法
3.3.1统计原理
曲线估计用在因变量与自变量与一个已知或未知的的曲线或者非线性函数关系相联系的情况下,在很多情况下有两个相关的变量,用户希望用其中一个变量对另一个变量进行预测,但是又不能马上根据记录数据确定一种最佳模型,此时可以用曲线估计在众多回归模型中建立一个既简单又比较适合的模型。
3.3.2spss操作步骤
①按分析——回归----曲线估计打开曲线估计对话框
②在左侧源变量框中选择铁路客运运量作为因变量,将其送入因变量框,选择生产总值为自变量,将其送入自变量框。
③然后将模型框中选择多种方法进行拟合,并点击“确定”按钮,如图所示
3.3.3输出结果及分析
表3.33-1模型描述
模型名称
MOD_5
因变量
1
铁路客运量
方程
1
对数
2
二次
3
三次
4
Sa
自变量
生产总值
常数
包含
其值在图中标记为观测值的变量
未指定
用于在方程中输入项的容差
.0001
a.该模型要求所有非缺失值为正数。
表3.33-3变量处理摘要
变量
因变量
自变量
铁路客运量
生产总值
正值数
10
10
零的个数
0
0
负值数
0
0
缺失值数
用户自定义缺失
0
0
系统缺失
5
5
表3.33-2个案处理摘要
N
个案总数
15
已排除的个案a
5
已预测的个案
0
新创建的个案
0
a.从分析中排除任何变量中带有缺失值的个案。
表3.33-4模型汇总和参数估计值
因变量:
铁路客运量
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
b2
b3
对数
.927
100.998
1
8
.000
-12100.778
1914.858
二次
.951
67.552
2
7
.000
681.333
.960
-4.646E-005
三次
.977
86.110
3
6
.000
-1075.650
1.957
-0.000203
7.171E-009
S
.956
174.724
1
8
.000
8.850
-2353.583
自变量为生产总值。
图3.33-1生产总值与铁路客运量关系图
从以上数据可以得知,以生产总值为自变量,铁路客运量为因变量,得到对数,二次,三
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 陕西 铁路 客运 需求 分析