基于统计分析的公共自行车服务系统.docx
- 文档编号:6892242
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:22
- 大小:296.89KB
基于统计分析的公共自行车服务系统.docx
《基于统计分析的公共自行车服务系统.docx》由会员分享,可在线阅读,更多相关《基于统计分析的公共自行车服务系统.docx(22页珍藏版)》请在冰豆网上搜索。
基于统计分析的公共自行车服务系统
2013高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)
日期:
年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2013高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
基于统计分析的公共自行车服务系统
摘要
公共自行车作为一种低碳、环保、节能、健康的出行方式,在许多城市迅速推广与普及。
而公共自行车服务系统的运行效率对用户的满意度有重要的影响。
本文以浙江省温州市鹿城区的公共自行车服务系统为例,建立数学模型,就自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置等因素定量分析系统的运行效率对用户满意度的影响。
首先,对数据进行预处理,通过SPSS软件的分析站点号1-181中缺省108号站点,而增加了站点号为1000的站点。
针对问题一,对于该地区公共自行车管理中心提供的某20天的数据,首先利用SPSS软件分别统计各站点20天中每天及累计的借车频次和还车频次,并按所有站点分别给他们排序。
然后再利用excel中的数据透析表和数据透视图对数据进行整合,统计分析得出每次用车时长的分布情况(详见表格1)。
针对问题二,用同样的方法统计20天中各天使用公共自行车的不同借车卡数量,统计得出数据中出现过的每张借车卡累计借车次数的分布情况(详见表格2)。
针对问题三,首先利用每个站点的借车次数计算出各站点的平均时间,再利用excel软件和MATLAB计算统计得出最短距离是从区政府东--区政府西的距离,最长距离是公共自行车中心--质量监督局的距离。
最后,通过使用SPSS软件的数据筛选分类,对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
找出所有已给站点合计使用公共自行车次数最大的一天以及该天中借车频次最高的42号站点和还车频次最高的56号站点,其分布情况分别见图4、图5。
最后对第20天的站点进行统计、排序归类得到各站点各时段的借车频次和还车频次,及其站点等数据详见表格8、表格9。
针对问题四,采取了模糊综合评价法对目前公共自行车服务系统站点设置和锁桩数量的配置做出综合评价,得出了公共自行车服务系统站点设置和锁桩数量还应多增加。
针对问题五,在问题一到四的基础上结合参考文献,针对站点设置和高峰时期所桩数量安排的不合理提出改进意见,以提高公共自行车服务效率。
关键词:
公共自行车系统SPSS软件模糊综合评价统计分析
一、问题重述
1.1问题背景
自行车因其便利、经济、耐用、可达性好、节能、强身健体及无污染等特点,成为广大居民出行的主要工具。
[1]一般情况下公共自行车的站点数量是该城市公交车站点的二分之一,主要设置在社区、校园、商圈、景点和公交对接处,因其具有可以在任意站租、还车辆的特点,受到了越来越多的人的喜爱,在公共自行车服务系统中,随着用户的增多,其需求量就会增大,如果自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置不合理,就不能更好地满足用户的需求,严重影响用户对该系统运行效率的满意度。
正确分析这些因素对系统运行效率的影响将为相关管理部门的决策提供理论依据。
1.2需要解决的问题
在搞清楚公共自行车服务系模式和使用规则的情况下,根据附件提供的数据,建立数学模型,讨论以下问题:
1.分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序并统计分析每次用车时长的分布情况。
2.统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。
3.找出所有已给站点合计使用公共自行车次数最大的一天,讨论以下问题:
(1)定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。
对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。
(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。
(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。
4.说明上述统计结果携带的有用信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。
5.找出公共自行车服务系统的其他运行规律,提出改进建议。
二、问题分析
在公共自行车服务系统中,由于需要租车的人群在各地区分布并不均匀,以及用车时段的分布不同,所以,自行车租赁的站点位置的分布以及自行车数量的配置等都会影响系统运行效率以及用户的满意度。
因此需要根据附件中给出的数据找出该地区各个站点用车的情况以及各个站点的用车高峰时段。
问题的特点在于数据较多,各站点借还车情况复杂,解决问题的关键在于对数据的正确处理以及对统计结果的合理分析。
2.1问题一的分析
附件一已经给出了浙江省温州市鹿城区公共自行车管理中心提供的某20天借车和还车的原始数据,主要利用SPSS软件对该数据中每天及累计的借车和还车频次进行统计并按站点分别进行排序,然后统计分析每次用车的时长分布。
2.2问题二的分析
每个借车人所拥有的借车卡是固定的,因此统计出20天中各天使用的不同借车卡的数量以及统计数据中出现过的每张借车卡累计借车次数的分布情况就能确定出借车人数的分布情况。
2.3问题三的分析
首先剔除第二十天中时间的异常值,求出每个用户从各个借车站到各个还车站的平均时间,在此基础上得出最短距离和最长距离,寻找借还车频次高峰,并对站点位置、锁桩数量的优劣进行评价。
2.4问题四的分析
针对问题四,主要是对上面已经得到的统计结果进行分析,从中找出有用的信息,再根据这些信息建立评价模型对目前公共自行车服务系统站点设置和锁桩数量的配置做出合理地评价。
2.5问题五的分析
根据得到的信息,寻找数据背后的运行规律,我们建立在数据特征的基础上,进一步探究公共自行车系统的运行特点,并回顾和借鉴了一些现有研究的方法,最终提出政策建议。
三、基本假设与符号说明
3.1基本假设
1、人们的出行是随机的;
2、自行车的使用高峰期和地铁、超市的高峰期同时出现;
3、自行车的使用时间为早上6点到晚上9点。
4、刷卡一次即借车一次。
3.2符号说明
符号
意义
用户的正常平均时间;
用户从借车站点到还车站点所用的真正时间。
(
、
都为1、2、3······181)
实际求得的用户从借车站点到还车站点所用的平均时间。
(
、
都为1、2、3······181)。
四、模型的建立与求解
4.1问题一
运用excel的透视表功能将题目附件1中的20组excel表分别进行统计,绘制出各站点20天中每天的借车频次和还车频次的表格,各个站点的每天与累计借车与还车频次如表1所示,限于篇幅,表1中仅列出了前10个站点第1天和第20天的借还车频次以及累计频次,完整的数据请参见附录1、附录2。
表格120天各天借还车频次
第1天借车频次
第1天还车频次
…
第20天借车频次
第20天还车频次
累计借车频次
累计还车频次
1
91
93
…
91
87
1861
1814
2
114
117
…
114
361
1709
2060
3
179
176
…
182
252
2592
2968
4
235
224
…
295
485
5312
5740
5
139
154
…
146
133
2444
2593
6
105
112
…
124
293
1757
1985
7
106
106
…
116
216
1598
1900
8
95
89
…
118
293
1454
1666
9
353
334
…
489
253
6407
6210
10
354
341
…
351
197
5821
5579
在此基础上,我们用excel对各站点20天中累计的借车频次和还车频次进行排序,详见附录3、4。
然后统计分析每次用车时长的分布情况并绘制成表,见附录5,并生成条形图,见图1如下:
图1每次用车时长的分布条形图
从上图看出,用车0分钟出现的次数最大,说明租车设备不是很好,用户经常需要在本站换车;在5-30分钟出现的次数较多,相对比较密集,说明用户正常使用了车子,且尽量在一个小时之内归还了车子从而不需要花费费用;而用车1-5分钟的次数相对较少,用车31分钟之后的次数几乎为0,说明明每个站点的距离不是很近,也不是很远,符合安装需求。
4.2问题二
同样运用excel软件统计20天中各天使用公共自行车的不同借车卡(即借车人)数量单独绘制成表,见附录6;
表格220天借车人数量
天数
借车人数量
天数
借车人数量
1
16842
11
15098
2
17461
12
18195
3
9668
13
19534
4
14677
14
19463
5
17983
15
18677
6
18709
16
11333
7
18881
17
15414
8
10596
18
15309
9
7044
19
19190
10
4153
20
20024
再统计出这20天数据中出现过的每张借车卡累计借车次数的分布情况绘制成表格,见附录7。
从附录7可以看出,在这二十天中,每位用户借车次数最多的1-5次,随着借车次数的增加用户在逐渐下降,而借车次数在45-120次的用户几乎为0,上述现象说明在20天中,每位用户使用车子的次数还是较少的,因此每个站点的车子数量没必要太多,但也不能太少。
4.3问题三
在上面统计结果的基础上,应用excel统计出所有已给站点中每天合计使用公共自行车的次数,见表2如下。
表格3各天合计自行车使用次数
时间
累积次数
时间
累积次数
第1天
36402
第11天
32726
第2天
37412
第12天
32726
第3天
16910
第13天
41920
第4天
32429
第14天
41831
第5天
38308
第15天
38939
第6天
40326
第16天
19130
第7天
40362
第17天
32400
第8天
16548
第18天
32453
第9天
11210
第19天
40693
第10天
6981
第20天
42242
由上表可以看出,所有已给站点中每天合计使用公共自行车的次数最大的一天是第20天。
为用户的正常平均时间。
用户从借车站点到还车站点所用的真正时间。
(
、
都为1、2、3······181)
实际求得的用户从借车站点到还车站点所用的平均时间。
(
、
都为1、2、3······181)
首先统计所有已给站点合计使用公共自行车次数,如下表:
表格4表一所有已给站点合计使用公共自行车次数
天数
次数
天数
次数
天数
次数
天数
次数
1
36420
6
40326
11
32726
16
19130
2
37412
7
40362
12
38319
17
32400
3
16190
8
16548
13
41920
18
32453
4
32429
9
11210
14
41831
19
40693
5
3308
10
1981
15
38939
20
42242
由上表可知所有已给站点合计使用公共自行车次数最大的一天是第20天,因此选取第20天的数据作为研究对象。
设用户的正常平均速度为
,用户从借车站点到还车站点所用的真正时间为
,则定义两站点之间的距离为
。
因此,需要统计用户从借车站到还车站所用的真正时间。
最小值的求解。
从定义的距离来看,所有用户的速度是一样的,距离的最小值则需求解到用户从借车站点到还车站点所用的真正时间的最小值,而题目中的数据中,用户所用的时间可能受到用户客观因素和外界环境因素的影响造成延误而不具有真实性,但是,在去除借还车是同一站点的数据后,真实的最小时间数据落在用车时间为1的概率是最大的,因此,选取用车时间为1的数据,并进行排序和筛选,将
和
划分为一组,再在这一天的数据中查找到
和
这个组别的所有数据,去除这个数据中用车时间奇异的数据,再去掉一个用车时间最大值和一个用车时间最小值,求其剩余数据的用车时间的平均值
,详见附录7,则可以认为
近似等于
。
这样可以得到37组数据,如表四:
表格5借还车站平均用时
借-还车站号
借-还车站名
平均用时间
71—14
国际大酒店南浦医院-江滨东杨府山路口
5.33
78—12
桥儿头公交站-桥儿头交运国旅
17.14
3—11
吴桥路加油站-鹿城区审批中心
7.55
8—7
市政府东-市政府西
24.33
105—100
温州十九中-蒲鞋街道卫生中心
3.71
127—106
人力资源社保局-金桥路桃源居
11.88
129—128
马鞍池西路89号-马鞍池吴桥路口
7.6
130—124
水心邮电-马鞍池路杏花路口
5.63
140—139
水心过境路口-瓯海二高
7.5
142—141
勤奋路市财政局-勤奋路花坦小区
7.5
146—118
人才大厦-上陡门住宅公交站
6.6
147—110
杨府山南大门-杨府山公园停车场
2.92
148—109
物华天宝-浙江工贸学院
4.7
149—126
均瑶宾馆对面-学院大厦
2.43
150—118
滨江街道办事处-上陡门住宅公交站
6.64
151—117
江滨路车站大道-金迅达大厦
2.5
163—133
九山公园-清明桥站
2
165—11
过境路宽带路口-鹿城区审批中心
4
166—16
南郊派出所-金色家园
2.75
18—17
区政府东-区政府西
1.67
30—105
绣山中学-温州十九中
2.67
32—179
数码广场-国际贸易中心
1.875
34—33
广信大厦-国光大厦
3
37—33
松台广场-国光大厦
6
44—19
东瓯智库-开太百货
5.67
46—176
巽山公园-马鞍池南
9.6
51—148
新城车站-物华天宝
3.6
59—168
文景花苑东-上村小区
2.35
60—55
公园路去茶去-中山公园北
6.6
70—52
区地税局-裕达大厦农业银行
2.35
71—62
江滨东杨府山路口-大南门农贸
6.62
73—115
汤家桥路英豪花园-汤家桥北云中花园
2
78—63
桥儿头交运国旅-体育中心西
8.69
92—180
十四中学-繁华公寓
6.63
9—43
小南门立交桥-群艺大楼
2
9—56
小南门立交桥-五马美食林
2.84
99—95
公交上徒门始发站-特警支队
13.17
从上表中可以看出,18-17是距离最短的,即:
从区政府东--区政府西的平均时间是最小的,并且通过附件1的图检验得从区政府东--区政府西距离确实最近,因此,从区政府东--区政府西的距离上是最短的。
最大值的求解。
从温州市鹿城区公共自行车管理中心网站中了解到,它的收费标准是实行限时免费、阶梯收费办法,具体标准为:
1小时内免费使用,1小时以上2小时以内收1元,2小时以上每小时2元(不足1小时按1小时计算),24小时内最高限额为20元。
因此,作为一个正常的普通卡用户,他一定尽可能的在一个小时之内还车,所以,最大时间落在用车时间为60的概率是最大的。
所以,我们选取用车时间为60分钟的数据并进行排序和筛选,同最小值的求解类似,求得剩余数据的用车时间的平均值
,详见附录8,则可以认为
近似等于
。
这样可以得到12组数据,如表五:
表格6借还车站平均用时
借-还车站号
借-还车站名
平均用时
70—7
区地税局-市政府西
14
120—111
会展中心-巨一花苑
21.8
129—128
马鞍池西路89号-马鞍池吴桥路口
7.6
18—177
区政府东-都市花苑
60
21—100
东阿外楼-蒲鞋街道卫生中心
32.67
50—172
中西医结合医院-东方灯具市场
25
56—100
五马美食林-蒲鞋街道卫生中心
42
64—48
县前头-沃尔玛(欧洲城)
9.5
70—58
区地税局-新城大道体检中心
60
80—66
牛山北路文杰酒业-体育中心南
60
83—43
南塘一组团-群艺大楼
60
89—55
妙果寺-中山公园北
12.5
从上表中可以看出,有多组平均值均为60,因此无法通过平均时间判断最大时间,也就无法计算最大距离。
从题中所给网址中我们了解到,VIP用户是超过时间也不进行收费的,因此,最大的真实时间落在VIP用户群中可能性也是非常大的。
因此,将这一天中的所有VIP用户的数据提取出来,去除借还车是同一站点的数据,将其剩余数据采取同上的分组方法,在这一天中寻找出各个组别的数据,去除奇异的数据和一个最大值、一个最小值,求其平均值,方法详见附录9,得到与真实时间最相近的时间
,如表六所示:
表格7借还车辆总时间
借-还车站号
借-还车站
时间
32-45
数码广场—白鹿洲公园
595
6-97
绣山卫生院—江滨路府东路口
253
33-56
国光大厦—五马美食林
10.83
37-69
松台广场—时代广场
186
10-64
市九中—县前头
7.64
4-55
银泰百货-中山公园北
12
149-32
均要宾馆对面-数码广场
8
107-42
远东大酒店—街心公园
9.75
149-63
均瑶宾馆对面—体育中心西
16.3
44-52
东瓯智库—裕达大厦农业银行
28
106-98
金桥路桃源居—市公安局
2.67
148-67
物华天宝—大自然家园
16.75
135-95
温州大厦—特警支队
46
22-25
鱼鳞浃—鹿城法院
12
13-72
公共自行车中心—质量监督局
65
16-98
金色家园—市公安局
19
通过附录9中的数据看出,仍有4组数据是单一的,无法确定它是不是具有可参考性,因此,将普通会员中无法确定时间大小的借还站点和这4组数据中的借还站点列出,即:
13-72、32-45、97-6、69-37、66-80、177-18、83-43、70-58、56-10。
通过结合题目中的附件2和温州市鹿城区公共自行车管理中心地图找到这几个站点,通过地图,直观的看到13-72即:
公共自行车中心—质量监督局这两个站点是距离最远的。
我们运用SPSS筛选出借还车站是同一个站点并且使用时间在1分钟以上的借还车情况,详见附录8.
(2)用excel软件对第20天的站点进行统计、排序得到借车频次最高和还车频次最高的站点分别为42号站点街心公园和56号站点五马美食林,详见附录9、10。
再次分别统计街心公园用车和五马美食林的用车时长分布情况,见附录11、附录12。
取一小时为间隔统计出他们的时刻分布情况,见附录13、14,分别绘制它们的时刻分布图和时长分布图如下如图2和图3和图4和图5:
图242号站点街心公园借车时刻分布图
上图说明,42号站点街心公园这一借车频次最高的站点,在上午11-12时间段和下午17-18时间段是用车的高峰期,这种现象可能是因为这两个时间段刚好是下班点造成的。
图356号站点五马美食林还车时刻分布图
上图说明,56号站点五马美食林这一还车频次最高的站点,在上午8-9时间段和下午17-18时间段是还车的高峰期,这种现象可能是因为这两个时间段刚好是上班点造成的。
图442号站点街心公园借车的时长分布图
上图说明,42号站点街心公园这一借车频次最高的站点,借车时长为10-20的用户是最多的。
图556号站点五马美食林还车的时长分布图
上图说明,56号站点五马美食林这一还车频次最高的站点,借车时长为3-19的用户是最多的。
(3)用excel软件对第20天的站点进行统计、排序得到各站点各时段的借车频次和还车频次,限于篇幅,表格3、表格4中仅列出了1号和181号站点第20天的借还车频次,完整的数据请参见附录15,计算程序见附录17。
表格8各站点各时段借车情况
1号站点各时段借车情况
…
180号站点各时段借车情况
时刻
次数
时刻
次数
15--16
0
…
12—13
2
10--11
1
…
6—7
3
6--7
2
…
20—21
3
14--15
2
…
19—20
5
7--8
3
…
13—14
7
9--10
3
…
14—15
11
12--13
3
…
7—8
14
18--19
3
…
18—19
14
16--17
4
…
11—12
15
13--14
4
…
15—16
15
11--12
4
…
10—11
16
8--9
8
…
16—17
16
19--20
11
…
8—9
21
17--18
17
…
17—18
30
20--21
26
…
9—10
31
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 统计分析 公共 自行车 服务 系统