『引言:AI的浪潮势不可挡,在无数大众最熟悉的生活场景中,其实蕴含着许多未被发现的秘密。这些“深藏功与名”的AI技术,在最基础的功能背后,却演绎着数据和算法最动人的一面。百度地图将通过揭秘黑科技一系列专题,讲讲地图日常功能背后的技术。
本期内容将为你展示,百度地图如何通过大数据的自学能力,进行堪比“福尔摩斯”的交通事故推演,找出引起拥堵的真正原因,并及时送上提醒和时间参考,避免用户误入一场由事故引起的“世纪大堵车”。』
你知道自己每年要浪费多少时间在堵车中吗?答案恐怕是难以估量的。尤其是事故造成的拥堵,一旦发生交通事故,高速路也变成了“降速路”。不过,有的导航却似乎有着“未卜先知”的能力,即使没有用户上报,也能够准确推测事故并提醒拥堵时间。
“小度助手推测当前道路可能发生了事故,请来往车辆提前注意避让。”“已拥堵超过2小时,超过1小时消散。”相信不少用过百度地图的人都见过类似的提醒,当感叹越来越精准的地图软件让出行更顺畅之时,你是不是也好奇过,它是怎么知道前面有事故,而且这么判断的这么快、这么准就?这就要归功于大数据的功劳。
百度地图事故提醒
整体而言,百度地图之所以能够洞察交通事故,主要是通过大数据能力,学习用户上报事件的特征,结合当前路段的实时轨迹特征,进行时空校验,从而判断事故信息。
首先,要在拥堵道路中选取前后一段时间都有用户上报的路段作为正样本,这意味着这段路确实发生了事故,再选取前后很大范围都没有用户上报的路段作为负样本。当然,这样选取的负样本数量会远远多于正样本,需要按照通行流量对负样本排序,选其中流量较大的前几名,用以平衡正负样本的数量。
其次,要提取道路的特征。这既包含长度,限速、通行等级等自身属性,也包含实时路况速度,路段历史拥堵概率等路段特征,同时还包含上下游实时路况拥堵程度、历史上下游发生事故概率等连续性的空间特征。
接下来,便是进行模型预测。按照道路等级等信息,可将样本划分为不同类别。分别训练出不同类别的样本和不同城市的模型。依次访问不同的模型组合,寻找效果最优的“人工集成模型”。集成后的模型应用在不同城市时,分别使用不同的标准来划分。至此,便完成了对事故的判断。
最终,推断出确有事故发生时,就到了进一步判断事故发生位置的环节。这一环节可分为两种情况:如果拥堵路段速度变化不大,则用训练好的“回归模型”预测事故位置;若拥堵路段速度变化较大,则拟合速度的二次曲线,输入道路中多个坐标试验,速度最小值偏下游的地方就是事故的发生地。
拥堵路段速度变化较小时位置判断
拥堵路段速度变化较大时位置判断
判断事故及其位置后,便是第一时间告知用户。百度地图的事故提醒在准确性的基础上还包含了许多其他细节,事故位置、距离、通过时间、预计消散时间等一应俱全,用户看起来更清晰直观。
百度地图事故提醒详情页
讲完了事故推演,我们来说说拥堵路段的消散时间是如何计算的。
关于拥堵的消散时间,我们可以理解为未来一段时间的路况预测。目前百度地图实现了分钟级消散时间预测,举个例子,如果我们预测未来5分钟路况分别是拥堵,拥堵,拥堵,畅通,畅通,那么对应的消散时间就是三分钟。
目前百度地图实时路况监测的准确率在99%以上,因此路况预测通常以实时路况作为样本。对于要预测的路段,百度地图将时间维度与历史路况、实时路况、路段长度、通行能力等综合影响因素纳入DNN神经网络,分别得出畅通,缓行,拥堵,严重拥堵4个级别路况。再以每分钟内的通行情况是畅通还是拥堵,来推断这段拥堵的消散时间。
流动的交通使路况变化万千,要实现精准的交通服务,离不开大数据的支撑。不得不说,基于大数据资源进行深层次挖掘的百度地图,给我们带来了更有保障的出行和愈加便利的生活。而对于未来交通的预测,也有望成为交通大数据的又一个核心价值。