基于多源数据的多模式公共交通出行链构建

时间：分类：应用电子技术

　　摘要：公共交通乘客出行链构建是公共交通出行需求分析的基础，也是推进城市公共交通系统融合发展和可持续运营的关键。现有研究大多关注单一模式出行链，较少考虑多源数据环境下多模式公共交通出行链构建，无法进行各模式之间的转移和换乘客流特征的分析。基于轨道交通、BRT 和公共汽车三网融合数据进行乘客出行链构建，数据类型主要有公交 IC 卡、车载 GPS 等。具体方法包括基于时间匹配的上车站点推算、基于出行链假设的下车站点匹配和基于换乘规则的个体出行链推算。最后，使用厦门市公共交通数据验证了该方法的有效性，同时讨论了匹配阈值对匹配精度的影响。

基于多源数据的多模式公共交通出行链构建

　　本文源自张懿木; 陈田; 王俊; 李哲; 李健，城市交通发表时间：2021-06-08

　　关键词：城市公共交通;多源数据融合;多模式公共交通出行链;出行特征分析;运营管理

　　0 引言

　　公交优先倡议是城市交通可持续发展的必然选择，而公共交通乘客出行链特征分析是精准把握公共交通出行需求，切实有效推进公交优先倡议的关键。传统获取公共交通个体出行链数据通常采用人工抽样调查[1]以及反推模型计算[2]的方法。随着公交 IC 卡系统、车载 GPS 设备的广泛应用，基于多源数据的大规模公共交通乘客个体出行链构建和特征规律挖掘成为可能[3]。国内外相关研究侧重公共汽车、轨道交通等单一模式的公共交通乘客出行链构建和特征规律的挖掘，主要集中在乘客上、下车站点的匹配，以及通过设置换乘时空阈值进行公共交通出行链推断。由于各国城市公共交通数据结构有所不同，部分城市公共交通乘客上车数据包含卡号、时间、线路地点等信息[5];对于不包含站点信息的数据，文献[6]基于巴西圣保罗市 IC 卡刷卡数据、GPS 数据以及线路站点数据构建时空匹配算法，实现了公共交通乘客上车站点的识别。国内研究中，文献[7]较早阐述了 IC 卡与 GPS 数据融合推算上车站点的原理，文献[8]以北京市单日单条公共交通线路的 IC 卡和 GPS 数据验证了该方法的可行性。其他相关研究从公共交通模式[9]、时间跨度[10]等方面对该方法的应用场景进行了拓展。在下车站点推断方面，文献[11]基于出行链假设对伦敦公共交通乘客下车站点进行推算，并结合实际出行调查数据验证了推算方法的有效性。针对单日仅一次出行数据下车站点识别的问题，有研究利用历史多日出行[12]特征进行下车站点推算。近年来，基于下车站点、下车时间推算结果，通过设置换乘时间[13]、换乘距离[14]等换乘约束，可以实现乘客出行链的构建。

　　从现有研究来看，基于 IC 卡、GPS 等多源数据的单模式公共交通乘客出行链构建方法已较为成熟，但对多模式公共交通乘客出行链构建研究较少。随着中国城市公共交通系统的不断发展，特别是在大城市快速公交(BRT)、轨道交通网络规模不断增加的情况下，如何有效推进公共交通系统内部不同模式之间的融合发展，提升城市公共交通系统的可持续运营能力，是最为紧迫的问题。通过多源数据构建多模式公共交通出行链，进而对不同公共交通模式的运行特征和换乘行为进行研究，是推进公共交通系统多模式融合发展的关键。

　　本文基于轨道交通、BRT、公共汽车系统的 IC 卡和 GPS 数据等多源数据，提出公共交通乘客多模式出行链推算方法。以厦门市公共交通系统为例进行了方法验证，并对匹配率的变化、匹配阈值的合理性和数据采集方式的局限性进行了讨论。

　　1 数据基础

　　数据来源于公共交通系统三网数据，包括公共汽车系统、BRT 系统以及轨道交通系统数据，各公共交通方式数据属性如表 1 所示。

　　公共汽车系统数据包括设备连接表、IC 卡刷卡数据、GPS 数据、发车班次数据、线路站点 GIS 数据。刷卡数据记录乘客上车时 IC 卡刷卡信息，每次刷卡均会在设备中产生一条刷卡记录。GPS 数据记录公共汽车行驶过程中的时空间状态信息。发车班次数据为公共汽车离开起点和进入终点站的到发时刻表。线路站点 GIS 数据记录当月公共汽车开行线路及途经站点顺序、位置信息。

　　轨道交通数据与 BRT 数据结构类似，包括闸机验票数据和线路站点数据。闸机数据在乘客每次进站或出站验票时产生，记录乘客进出站活动信息。线路站点数据记录了 BRT 线路站点的详细信息，作为乘客进出站信息的补充。

　　2 多模式公共交通出行链构建

　　轨道交通与 BRT 采用闸机进出站方式，易于匹配进出站信息。具体步骤包括：1)基于刷卡站点编号字段连接闸机数据与站点数据，为原始数据添加具体的站点名称及经纬度等信息;2)将一天中同一卡号的刷卡记录按刷卡时间进行排序，连接两条相邻刷卡记录，若第一条进出站类型为进站，第二条为出站，即可组成一次出行记录。至此完成轨道交通与 BRT 乘客的出行信息匹配。公共汽车的出行信息匹配则涉及上车站点、下车站点以及下车时间多个阶段的推算。

　　2.1 基于时间匹配的上车站点推算

　　对于上车站点推算，采用基于时间的匹配算法，其基本原理是利用时间属性关联 IC 卡与 GPS 数据，从而匹配获得刷卡数据的空间信息。首先根据车辆到发时间，匹配 GPS 数据与 IC 卡数据对应的线路班次信息。在此基础上，按时间最近原则匹配 GPS 时间与刷卡时间获得刷卡时的空间位置信息。之后，对比线路站点空间位置确定乘客上车站点信息。算法匹配流程如图 1 所示。

　　公共汽车上车站点的匹配主要包括以下三部分。

　　1)基于路单信息的车次匹配。

　　为了减少计算量，提高查询效率，同时便于下车时间的匹配处理，本文利用发车班次信息匹配 IC 卡数据和 GPS 数据对应的车次。对于某一条线路，一辆公共汽车在相邻两趟发车之间存在一定的休息时间。考虑到乘客在车辆发车前提前上车刷卡的情况，将公共汽车上一班次的到站时间至下一班次的发车时间作为乘客在首站上车的时间范围。利用到站时间和发车时间的区间匹配 IC 卡数据及 GPS 数据对应的车辆班次。

　　2)基于 GPS 数据的刷卡位置匹配。

　　利用 GPS 数据与 IC 卡数据的最近时间差进行匹配，寻找刷卡记录对应的最近 GPS 空间位置。考虑乘客可能存在先上车后刷卡行为，实际上车刷卡时间与上车时的 GPS 空间位置可能不一致，因此采用近似匹配 GPS 时间与刷卡时间。基于路单匹配结果，通过“车辆编号”“线路”“班次”字段进行关联，选择与刷卡数据时间最为接近的 GPS 点作为当条刷卡记录产生时的 GPS 数据，从而确定每一条刷卡记录的 GPS 空间位置(见图 2)。

　　理论上每一条刷卡数据均能获得对应 GPS 位置信息，为了保证匹配结果的准确性，需要设置一定的时间差阈值避免数据时间间隔过大的错误匹配。考虑到站点位于某相邻 GPS 点集的必然性，时间阈值

　　式中：

品质、专业的

基于多源数据的多模式公共交通出行链构建

获取免费资料

最新文章