北京市交通信息中心副主任杜勇在中国智能交通年会城市智能交通创新发展论坛上发表《公交大数据技术创新与应用》的演讲,本文为演讲速记整理,未经演讲者本人审核。
北京市交通信息中心副主任 杜勇
1.大数据背景下的北京公交
最近几年,北京的地面公交客运量在逐年下滑,而且下滑的幅度达到了10%以上。这其中包含了很多原因,其中主要的原因在于北京轨道交通大规模的发展。2014-2017年间,北京新开通了七条地铁线,总里程约100公里。到2020年北京地铁的运营里程将会达到1000公里。另一方面,近几年互联网的进入使交通行业产生的新业态,这对地面公交也造成了一定的冲击。
图1公交线路情况
图2站点影响情况
上图是2008-2017年间的公交和地铁的日均客运量,其中蓝色代表地面公交,橙色代表轨道交通,从2014年开始,地面公交的客运量逐年下降,而轨道逐年提升。到2015年9月份,轨道交通每天客运量已经超过了地面公交。对于典型的公交站点,轨道交通的开通使地铁站点周边的公交站点的客运量急剧下降。
图3 2016-2017年4-6月重点接驳站公交客流下降趋势
对于近两年兴起的共享单车,这种出行方式和公交、地铁相比有很大区别。公交、地铁是中长距离的运输,单车出行主要以短途为主。我们认为总体上共享单车、公交、地铁是一种互补关系。通过分析2016-2017年的数据,我们发现在共享单车投放比较集中的公交站点,站点的客运量也受到了影响。平均客运量下降了30%,更有甚者达到50%,所以共享单车对地面公交的局部客运量还是会产生一些影响。
实际在这种情况下,地面公交运营企业感受到冲击和压力。因为客运量对运营企业来说是生命线。所以传统的企业面临着转型升级的压力,但是大数据为传统行业的管理方式变革带来了机遇。
以北京市为例,对于公交方面的数据,我们拥有包括4万多个站点的数据。同时每天会产生大概10亿条的车辆定位数据,以及1000万条乘客刷卡的数据,还有基于手机的数据。这些都是很宝贵的数据资源。在这个背景下,通过大数据的驱动,公交技术的创新,可以的提高企业的效益、管理的效率,以及面向乘客的服务水平。
2.我们的探索与实践
2009年之前,我们基于出租车的卫星定位数据分析实时路况,主要还是面向机动车驾驶者服务。从2010年开始,我们在前期工作的基础上,依托了国家的“863计划”课题,还有北京市科委的科研课题,启动了面向公共交通数据的研究。
到2013年的时候,北京公交做了一款APP,它可以查公交的到站时间和到站距离。2014年我们在数据处理领域进行拓展,除了向社会提供出行服务之外,还有公交企业运营管理。到今年为止,我们初步形成了技术体系,而且这个成果获得了北京市科学技术奖,以及中国智能交通协会的科学技术奖。
在公交的大数据处理方面,我们的工作主要包括三个方面,分别是基础、支撑和应用。在基础方面我们进行了精细化数据的预处理工作,这个工作往往会被大家忽略,人们往往会关注模型、算法。在支撑层面我们实现了精准化计算公交的特征。在应用层面我们实现智慧公交的决策服务,包括提供出行服务,运营管理的服务,甚至政府的决策服务。通过以上实践,我们认为要把东西做到实处,让它好用、实用,还要围绕着实际的需求,而不是纯理论的研究。下面将简要阐述这三方面工作。
在数据汇聚和处理方面,目前我们梳理了北京公交的数据集,包括15大类,积累的数据大概1000亿条,这些数据里面既包括线路、站点、车辆等静态数据,也包括卫星定位还有刷卡记录等动态数据,另外还有很多与地图相关的数据。到目前为止,这些数据实际上已经明确了数据接入标准、存储的规格还有动态预处理流程,基本形成了数据预处理体系。
在公交的特征计算方面,主要包括客流计算,和公交运行速度计算。在客流计算方面,我们发现了数据存在不可避免的问题,包括刷卡记录所反映的站需和实际不匹配的问题,以及乘客刷卡时间上有提前或延后的问题。另外还有驾驶员报站和实际到站不同步的问题等等。针对这些问题,我们形成了基于关键数据链客流的计算方法。
图4基于多层次目标关联的公交运营优化调度方法
在速度计算方面,我们面临很多的问题,包括公交车辆卫星定位数据样本分布不全,缺失,以及公交车红绿灯的等待带来的误差。这种情况下,我们也形成了一套精准的计算公交车的运行速度方法。通过这些技术的突破,我们每天能够准确、实时的掌握北京市的大概900多条的公交线路,还有4万多个站点动态的客运量。在运行速度方面北京市全部运行路网的速度以及公交车辆的速度可以实时提取,精度达到一分钟。
在应用层面我们做了这么几方面的工作:支持公交更智能化的调度,基于多层次目标的优化调度方法。所谓的多层次目标我们主要是以客运量最大、运行时间最短,以及车辆满载率适中为主要目标。同时要兼顾司乘人员的劳动时常,还有厂站的物理条件等等,从而推导得出能为线路提供优化的排班调度计划以及最优的配车数。
图5 西南三环某条智慧公交新线规划
北京公交运营方面对上述技术做了较好的应用示范。首先在客运量上,去年9月份开通的线路,随着配车数的增加,每个月平均每天的客运量有一个提升。但优化前每天平均客运量约为5000人次,在优化完调度时刻表以后,整体客运量提升了20%左右,另外司乘人员的劳动时间也是平均减少了20分钟。最后在满足线路要求的前提下,实际的配车数比计划配车出减少了6辆。在公交线网规划方面,当公交线路新增调整或者延长时候,我们会进行精确化客运量的预测,例如首末站和中途站的设置。对于北京公交新开通的一个线路,左图是最开始的方案,线路比较长,站点比较多,和轨道交通接驳的四个站点,传统认为这样客运量应该是比较大。预测结果约为每天3500人次。基于我们的方法对其稍微调整,线路与站点也减少了,和地铁接驳点由原来的四个变成了两个。运输效率明显提高。公交的安全管理方面,我们所做的探索主要是采用计算机图象识别处理,计算车上乘客的数量、排队等候的数量,针对驾驶员疲劳驾驶行为进行预判。而且,基于数据我们也提出了地面公交运营的评价体系,这个主要给公交企业提供量化的、客观的、数字化指标,让他们了解整个运营的实际情况是什么。在对社会的信息服务方面,我们推出了公交车辆到站时间、到站距离查询服务。2013年推出的时候仅包含了78条线路,现在到目前为止已经达到800多条,北京公交线路覆盖率达到了99%。最近,我们将和一些全国性的定植公交的互联网平台合作,依据我们线路规划的方法,选取出一些线路来,让他们进行实际的运营。
图6公交安全运营管理应用
3.未来发展展望
最后我们认为大数据技术和公交未来的发展最后,大数据技术和公交未来的发展,还有很多事情可以去做:
第一,我们应该以我们乘客的实际需求,多样化的需求作为导向,以大数据作为支撑,从而改变现有单一的公交运营模式,能够向社会、乘客提供多元化、主动的服务模式。比如说在传统运营的线路基础上,提供接驳专线、高铁快巴、微循环小巴等等。
第二,我们可以对社会提供更好的服务,包括现有的公交到达预测,车上拥挤程度预测,让大家有一个更便捷、舒适的出行体验。
另外现在国家、地方政府特别重视节能减排,运营车辆也在更新车纯电动车。这个方面我觉得还有很多工作需要进行,包括纯电动车辆换电站布局、规划等等问题。
希望传统公交行业有更好的转型升级,提质增效。