用出租车GPS数据分析深圳道路交通情况文档格式.docx
- 文档编号:19630719
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:25
- 大小:806.08KB
用出租车GPS数据分析深圳道路交通情况文档格式.docx
《用出租车GPS数据分析深圳道路交通情况文档格式.docx》由会员分享,可在线阅读,更多相关《用出租车GPS数据分析深圳道路交通情况文档格式.docx(25页珍藏版)》请在冰豆网上搜索。
交通小区面积/km2
交通小区人口/人
范围
平均值
<
7.5
0.28~5.25
1.38
120~2700
872
7.5~15.0
0.60~8.48
2.77
357~1692
954
15.0~30.0
0.60~10.03
3.30
545~2400
1296
30.0~100.0
2.03~25.68
5.55
1316~7175
2828
>
100.0
1.45~33.32
7.83
2214~22659
7339
传统的进行交通小区划分的方法主要基于大规模的人工抽样调查。
这种划分方法成本高、周期长.调查的数据存在抽样率低、抽样统计的精度不高、数据更新周期长等问题。
由于我国大部分城市正处于快速发展期,土地利用不断变化,人口高速增长闭,通过这种方式进行交通小区的划分时效性较差。
通过交通出行数据的聚类运算,提供实时的交通小区的分布状态。
这种快速、动态的划分方法弥补了传统划分方式的不足。
2基于K均值聚类算法对交通小区的划分建立数学模型
2.1划分方法
本划分方法首先对坐标数据进行空间聚类运算,得到出行起讫点的OD矩阵,最后以此为依据进行交通小区的划分。
划分具体流程如图l所示:
2.2出租车GPS数据预处理
试验中所用到的数据主要包括车辆GPS实时数据信息。
原始数据表主要保存了出租车上装配的GPS终端所采集的数据,这些数据包括车牌号、采集时间点、经度、纬度、车辆状态、车速、行车方向等。
字段定义见表2:
表2原始表数据定义
字段名
含义
name
车牌号
time
采集时间点(格式:
YYYY/MM/DDhh:
mm:
ss)
jd
经度
wd
纬度
status
车辆状态(0=非打表,即:
空载;
1=已打表,即:
重载)
v
车速(单位为:
km/h)
angle
行车方向(0=东;
1=东南;
2=南;
3=西南;
4=西;
5=西北;
6=北;
7=东北)
由于每天的数据量庞大,基于缩短数据查询时间以及提高整体运算性能等方面的考虑,需要对原始数据进行筛选、统计、优化。
原始数据内容见表3:
表3原始出租车GPS数据
粤B000H6
2011/4/2012:
15:
30
114.105797
22.558567
16:
08
114.112831
22.558683
114.116753
22.558733
38
114.117867
22.558750
21:
114.125099
22.569750
1
22:
114.125168
22.569733
23:
00
114.125130
114.123398
22.569599
24:
114.117752
25:
114.117920
22.573999
26:
114.114502
22.582283
27:
114.110985
22.587418
28:
114.111153
22.587000
29:
02
114.113548
22.583567
10
114.114136
22.582550
32
114.114830
22.579983
30:
114.116982
22.576082
33:
06
114.125549
22.552900
36
114.128120
22.556084
36:
41
114.131714
22.561617
其中status字段代表的是出租车的空重车状态,当值为O时表示车的状态为空车,值为l时表示车的状态为重车。
当status值由0变为1时,status值为l的车的位置即为乘客上车时的位置;
相反地,乘客下车时的位置也可以得到。
根据这一特性剔除原始表中的无用数据,优化后的数据见表4:
表4优化后的数据
114.1179
22.55875
114.1251
22.56975
114.111
22.58742
114.1135
22.58357
114.1255
22.5529
2.3聚类模型求解
经过上一步的数据优化,即可得到由起讫点数据组成的据集。
现在需要对这些数据进行聚类运算:
一段时间内的起点或者讫点被划分为若干个区域。
每个区域中的点分布紧凑,区域与区域之间自然分开。
我们采用了K—Means聚类算法。
K—Means聚类算法是一种分割式聚类方法.它是数据挖掘技术中一种经典的基于划分的聚类算法。
其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进行后续的处理。
K—Means算法采用了迭代更新的运算思想,聚类过程如下:
首先从n个数据点随机选择k个点作为初始聚类中心;
通过运算其它点与这些聚类中心点的相似度(距离),将其分别分配给与其相似度最高(距离最近)的中心点所在的聚类;
然后对划分好后的聚类重新运算聚类中心。
这一过程不断重复直到标准测度函数开始收敛。
K-Means聚类算法Matlab的实现代码在附录中给出。
2.4模型边界值运算处理
聚类运算结束之后,得到若干组包含中心点在内的一些坐标点,如图1、2所示(点x表示出租车的坐标点,实心圆点表示交通小区中心)。
图1经纬度坐标点模拟
图2坐标点
将所有聚类后的坐标通过GIS平台输出,通过这种方式很难看出不同区域之间的界线。
这时需要将区域的边界绘制出来。
本文采用的边界运算过程如下:
首先建立平面直角坐标系.将坐标系以(0,0)为中心点均分为n等份区域(n的值将决定边界运算结果的精度)。
每个区域的角度为360/n。
如图3所示:
图3360度分为n份
然后,将某个聚类的点集放入该坐标系,使得区域中心点与坐标原点重合。
通过计算其它点与中心所形成的角的正、余弦,即可得到每个点与中心点所形成的夹角。
进而将这些点归入上一步所划分的区域。
依次计算第i个区域里每个点距离中心点的距离,记录距离中心点最远的点为Ci。
如图4中P点等。
图4距离中心点的距离
最后,将这所有的Ci点相连接,即可得到点集的相应边界,如图5所示。
图5边界点相连
最后,通过上述方法,利用Matlab工具对原始数据进行优化处理以后,可以得到最终的小区划分。
小区点的具体坐标在附录中给出。
图6交通小区分布图
2.5模型一评价
模型一通过对出租车GPS数据进行聚类运算,快速计算出不同时间段内出租车载客OD矩阵,进而将划分好的区域在GIS平台中显示出来。
从实验结果可以看出:
这种划分方法能够反映出不同时间段内交通小区的绝对动态性以及相对稳定性的特征,对城市交通小区的划分具有很高的参考价值。
但不可否认所使用的交通小区划分方法也存在一定的不足:
1)划分算法使用了纯粹的K—Means空间聚类法,没有与现有的位置属性相结合,比如住宅区、商业区等属性;
2)其次,算法没有对出租车的特殊数据和异常数据进行处理,比如红绿灯停车、GPS信号机发生故障等情况,这些都将影响最终结果的准确性;
3)最后,针对特定时间段进行交通小区的划分更有代表性。
比如早晚高峰等,本文没有对此展开讨论。
这些都是今后的改进方向。
三、问题二模型建立与求解
针对问题二,我们从一中已经划分完成的交通小区作为出发点,基于出租车GPS数据和地理信息系统GIS,通过使用FMEUniversalTranslator矢量图形转换软件和Excel-VBA宏,实现出租车OD矩阵推算,从而做出OD时空分布,对以后深圳市客流分析、城市规划和道路交通运行质量有重要意义。
1出租车GPS的基础数据分析
出租车GPS定位信息表见表2和表3.
1.1出租车GPS定位数据基本假设
(1)忽略时间间隔△t
卫星每隔△t(s)接收到出租车GPS信号接收机发出的一次新的运营状态信号,我们假设这个间隔△t足够小,即认为信号接收是连续的。
那么,在这个间隔期内出租车一直保持上个接收到的车辆状态继续运行。
(2)“载客”状态连续
假设最小“载客”状态的持续时间大于卫星接收间隔时间△t,即:
总是出现连续的“载客”状态。
以下提到的“载客”状态都是特指连续“载客”状态。
2基于GPS的出租车OD矩阵推算[3]
基于GPS的出租车OD矩阵推算是利用GIS的各种运算功能(如属性编辑、叠合处理等)和Excel-VBA软件,将出租车GPS原始数据转换为出租车OD矩阵的一种方法。
这里所需的出租车GPS原始数据必须是一个城市的全样或抽样的出租车在一年中最具代表性的一天24小时的运营数据。
2.1数据预处理
1)统一文件格式
由于出租车GPS数据以Maplrffo的格式存储,城市小区划分与编号数据以AutoCAD的格式存储,所以我们必须采用矢量图形转换软件FMEUniversalTranslator将他们转换为GoogleEarth的文件格式,即所需要的统一文件格式。
其中,FME(FeatureManipulateEngine)Suite是加拿大SafeSoftware公司推出的用于不同数据格式之间转换的一种方法,该方法基于OpenGIS组织提出的新的数据转换理念“语义转换”,通过提供在转换过程中重新构造数据的功能,实现了超过100种不同空间数据格式(模型)之间的相互转换。
2)匹配小区编号
首先在统一格式后的出租车GPS数据文件中添加小区编号属性,然后将此文件和城市小区划分及编号的文件一起加载到GoogleEarth中,再根据每个出租车GPS记录点的空间坐标,通过GIS的匹配运算得到各个记录点所在的小区,最后将该小区的编号记录到GPS数据文件的小区编号属性列。
3)重新排列GPS定位信息表
出租车定位信息表是出租车GPS数据的另一种表现形式,是以Excel的格式存储。
它里面的数据是按照接收时间的倒序排列,显示在前面的记录是最新接收到的,所以要进行重新排序。
首先对所有记录顺序编号,再对编号列重新排序,使用降序排列并扩展选定区域,使得显示在前面的记录是最早接收到的。
4)判定出行的起讫点
在GPS定位信息表中,出租车一次出行的记录是一系列连续的“载客”状态记录点的集合,且第一个“载客”记录点为本次出行的起点,最后一个“载客”记录点为本次出行的终点。
2.2OD推算
假设小区编号依次为1,2,…N。
构建初始出租车OD矩阵
且
;
出租车出行总次数记为K,K是有限正整数;
第k次出行产生一个累加OD矩阵
i=l,2,…,N:
j=l,2,…,N。
其中
则有效OD矩阵提取的具体步骤为:
Step1:
令k=l,指向定位信息表的第一行;
Step2:
寻找第k次出行的起点,记录下该点的定位时间乃和小区编号I;
Step3:
寻找第k出行的终点,记录下该点的定位时间%和小区编号j;
Step4:
由上两步得到累加OD矩阵:
,并更新出租车OD矩阵:
Step5:
若还有“载客”状态的记录,则令k-k+1,并返回到Step2,进行循环提取,否则进入下一步;
Step6:
输出出租车OD矩阵
。
2.3出租车OD矩阵处理
根据2.2节OD推算出的深圳市全样OD矩阵,进行现状分析得出该市出租车一日出行OD总量。
最后运用交通规划软件TransCAD计算出该市出租车一日流量。
具体流程见下图:
表5即为出租车的GPS定位数据信息:
表5深圳市出租车GPS定位信息表
54
粤B00F27
2011/4/2311:
29
113.989464
22.558767
71
2
OD矩阵见表6:
表6OD矩阵
0D
3
4
5
6
7
8
9
1249
690
674
543
347
254
346
326
3560
6532
945
132
6484
257
332
253
664
640
5830
8127
5430
7936
654
525
532
284
574
4674
3542
356
463
547
635
146
5308
8690
342
8956
546
653
632
255
107
1490
241
353
854
235
565
462
6489
2468
1247
5463
676
437
322
784
456
807
246
321
545
624
914
352
743
154
363
563
537
按图7中所示的操作流程,先将200辆出租车的GPS数据推算为样本量的OD,再经放样、校核和TransCAD分析与计算等操作,最终得到了深圳市出租车现状一日流量,见下图:
图8深圳市出租车现状一日流量
3模型二评价
在本次出租车OD的调查分析中,我们灵活地使用了目前已有的智能设备。
与传统的调查相比,此方法可以省去出租车OD表的设计、印制、发放、填写、录入等过程。
从很大程度上节省了人力、财力,提高了劳动效率。
出租车OD是客流分析的重要组成部分,但出租车OD的获取却相当不易。
我们以充分利用现有出租车信息资源为目的,首次提出利用矢量图形转换软件FMEUniversalTranslator直接将出租车GPS数据转换到GIS—GooleEarth中,并推算出出租车OD矩阵的思想,进行了详尽介绍。
此次所提出的方法将为生成出租车OD提供一种全新的思路。
该方法是现代智能设备在交通规划调查中的一次试验使用,并为GPS的使用开创了新的领域。
四、问题三的解答
针对问题三,在一个城市里,人们的出行行为对整个交通的管理和控制起着非常重要的作用。
国外关于居民出行行为的研究较早,利用集计的方法,将研究范围划分成多个交通小区.以小区为研究的基本单元将出行者的交通行为进行集体统计分析。
1.人们出行行为的分类[4]
人们的出行分为刚性出行与柔性出行两种,诸如上班、上学等刚性出行由于其日常性的反复,将会形成出行路径的详细信息.从而形成各自的交通方式选择模式。
这种情况下人们的出行方式选择比较容易确定。
相反,柔性出行(包括购物、访友等)不会一成不变地沿用一种出行形态,此时人们出行时具体选择哪一种出行方式与很多因素相关。
人们出行方式选择是个决策过程,与人们的出行意愿、费用、交通基础设施建设水平等主要因素相关。
其中任何一个因素的变化都有可能使人们的出行方式选择产生变化。
2.人们出行选择交通方式的影响因素
(1)出行目的:
通常人们在日常性的刚性出行时,通常重视出行的可靠性.需要快速、准时地到达目的地,对于时间和费用的要求较严格。
相反,弹性出行具有很强的随意性和自由性,故对时间和费用的要求都比较低,追求的是出行的舒适度。
(2)出行时间——高峰期与非高峰期:
高峰时期人们更倾向于出租车这类便捷的出行方式。
相反,在非高峰期人们更追求一种经济实惠的出行方式。
(3)出行地区特性:
出行方式的选择与出行地区的特性有着明显的关系,主要包括地区的经济水平、居住人口密度、公共设施条件以及旅游资源等。
一般经济繁荣、公共设施齐全或者旅游资源充足的地区,交通设施会比较完备。
3.合理假设
(1)假设一个交通小区的出行产生量和另一个交通小区的出行吸引强度密切相关。
(2)假设各个小区的抽样率在3%~5%,且各小区的抽样率所存在的差异极小。
(3)假设所有营运过程中的出租车始终在载客和空驶两个状态之间变换,不考虑在一个地方停留的情况。
(4)载客状态下出租车的旅行目的服从乘客的旅行目的;
空驶状态下出租车的旅行目的地的选择有很大的随机性,服从于驾驶者对下一个乘客需求点位置的判断。
4.人们出行的OD时空分布的推断
出租车是城市客运交通的一个不可或缺的组成部分,同时也是除公交以外人们出行方式的另一经常性的选择。
而现在随着人们生活水平的提高,对生活质量要求的提升,也促使着出租车数量的不断增长。
所以出租车交通量已成为城市道路交通总量中的重要组成部分,陈盛2002年对蚌埠市结果显示,蚌埠市典型交叉口的出租车交通量在交通总量中所占的平均比值高达33.52%,如此大比重的交通出行量,已成为影响城市道路交通分布及分配预测准确性的重要因素之一。
所以,出租车的OD时空分布在一定程度上可以反映人们出行的OD时空分布。
具体见下图图9:
图9人们出行流量图
5.问题三求解结语
但是在现实生活中,人们出行方式的选择有多种多样,影响人们对出行方式选择的因素也是多种多样。
由于在一些繁华的地段以及生活之间都会有比较完善的交通设备,同时随着人们的环保观念的提升以及考虑到经济实惠等方面,大多数人对出行方式的首选还是公交。
因此以出租车的OD时空分布来推断人们出行的OD时空分布还存在着一定的误差。
五、问题四模型建立与求解
针对问题四,交通拥堵已经成为制约城市发展的瓶颈,不仅影响着城市经济的发展,也影响着人们的工作和生活效率。
1.合理假设
(1)路口不发生交通事故,且所有司机都自觉地遵守交通规则和调度规则。
(2)同一转向的出租车通过交叉口的平均速度相同,通过路口的时间也相同。
(3)在出租车平均时速为15公里/小时和出租车在行驶过程中等待时间在大于1个小时的情况下可视为交通拥堵时段和路段。
2.数据处理
2.1.原始数据见表3
由于本题只需根据出租车载客后的行驶数据进行问题的求解。
所以对原始数据进行进一步的优化。
优化后的数据见表7:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 出租车 GPS 数据 分析 深圳 道路交通 情况