讲者介绍
许岩岩,加州大学伯克利分校 HuMNet 实验室的博士后研究员,2015年在上海交通大学获得博士学位,主要研究方向是空气质量、城市交通、城市规划等城市科学。此前曾在 MIT 土木和环境工程系担任博士后研究员,并在 Lawrence 伯克利国家实验室担任客座博士后研究员。
报告的主题为如何利用大数据时代的海量数据帮助人们进行智能交通预测,共分为两部分,其中第一部分介绍了对未来电动车充电情况进行估计的模型,该模型能够帮助城市规划工作者对电网充电情况进行安排。
根据调查显示,到2035年世界电动汽车保有量将会占汽车总量的五分之一。而电动汽车充电带来的不可预测性和大量电力需求将会给电网带来很大的压力,因而对电动汽车未来应用情况的预测是十分必要的。而研究疾病传播、城市规划、交通工程、金融市场预测等方面所用到的人类动力学(human mobility)可以对该问题进行指导。
为了研究该问题,作者先对用户的行为进行建模,用基站定位的方式收集到用户移动的位置和时间等原始数据,再通过聚类来定位用户所在的地点。将出行情况和位置结合,用马尔可夫模型和高斯混合模型对用户进行建模。对用户的行为建模后,就可以对任意时刻的出行情况进行整体的把握,为之后的分析打好基础。
然后,作者使用了贝叶斯模型对城市中电动车保有量进行建模。基于目前拥有电动车的用户的家庭年收入和每日出行距离以及目前的电动车占比,可以反推用户是否拥有电动车。在上述两个模型的基础上对电动车充电情况进行建模,且对模拟出的数据与真实数据进行了对照实验,验证了模型的有效性。
报告的第二部分介绍了通过深度学习利用POI地图数据来计算两点间通行时间的工作。
Travel Time Estimation 问题,也就是 EstimatedTime of Arrival (ETA)问题,有着非常多的应用,包括个人旅行规划、救护车和消防车安排等。由于 Link-based 和 Path-based 等传统方法对于原始数据的要求较高,同时要求手动计算特征,所以最后的误差会比较大。作者提出了 DeepI2T,通过深度学习的方法,使用百度地图、谷歌地图等基于 POI 的地图图像数据来计算 ETA。
首先,作者通过合并与填充的方法,将原始轨迹和小图像块匹配起来。同时把图像、交通情况、行驶方向、天气等信息集成输入到 CNN ,最后将得到的特征输入给 Bi-LSTM ,训练出最终模型。
实验结果显示,DeepI2T 的精确度比传统方法要好很多,并且避免了如 DeepTTE 直接使用经纬度点到点学习时存在的过拟合问题。
由于在数据获取过程中可以直接用在谷歌地图上截图得到的小块图像,因此实验中使用的数据比较容易获取,同时在效果上也有很大提升。在未来,该方法可以扩展到预测能源消耗、空气质量甚至犯罪率等问题,还可以把图像替换为卫星图像来获取更丰富的特征,前景十分广阔。