轨迹生成路网论文研读:Learning to Generate Maps from Trajectories

本文入选AAAI 2020

传统路网生成的方法分为三类:聚类/轨迹顺序扫描合并/密度。前两者基于点生成的line,在低采样频率时出现“伪捷径”,且无法处理平行道路。第三类基于点云,可以处理低采样频率,但是无法区分平行道路。

本文提出deepMG模型生成路网,可以处理不同频率的轨迹点,且在拓扑中区分平行道路。

deepMG包含两个部分:

1.几何转换:T2RNet,提取两类轨迹特征作为输入,送入T2RNet(轨迹to路),输出road 的中心线。

2.拓扑构建:从road 中心线构建图解钩,然后添加连接,最后结合轨迹进行map细化。


特征提取:

将ROI区域分割成tile(子豪卫星图这边没有生成ROI),每个tile分成I*J个cells,每个cell提取两类特征:

1.Spatial View:点的密度/线的数量/平均速度/方向直方图(8个方向)每个cell共计1+1+1+8=11维特征

2.Transition View:低频采样时两个连续的点不一定在同一个cell,此时空间特征失效。为每一个cell设定T*T的邻域,建立T*T的矩阵,矩阵中的每个元素1/0代表是否与本cell的points之间有连续性关系。这种关系存在时序性,即c“->c->c‘ ,所以需要从时间顺序上取先、后两个T*T的矩阵存储,每个cell共计2*T*T的特征。这里需要说明,论文中的邻域采用了降分辨率重建的方式,根据采样频率设置超参数:邻域距离,采样频率为30s时邻域设置为300m,3s的采样频率邻域为50m,然后根据T的参数进行cell的重建(这一步有些模糊,sample边缘处怎么处理未说明)。


T2RNet提取road中心线:卷积encoder+反卷积decoder

1.Transition Embedding:(2*T*T)*I*J的transition view 通过两层dense layers变成(k)*I*J维,这里T=8,k=64

2.Shared Encoder : concat Transition Embedding与Spatial View送入卷积组

3.Road Region Decoder:辅助任务,提取road区域,将encoder得到的最终features融合对应卷积组的Encoder特征进行反卷积

4.Road Centerline Decoder:road中心线提取,与3类似,每组卷积中融合的信息不但包括对应卷积组的Encoder特征,还包括辅助任务对应卷积组的Road Region Decoder特征。

损失函数:混合loss,对辅助任务和中心线提取任务进行加权,其中lamda=0.2

标签数据来源:use OpenStreetMap as the ground truth, and road region labels are generated by masking 2 cells surrounding the centerlines.

T2RNet相比unet性能优越的原因:在unet的基础上,添加道路区域作为辅助信息流,融合编码信息与道路信息进行中心线提取。但是参数量上相比unet多了近80%。

ps: 若T2RNet结构无法理解,可以先看FCN和Unet两篇论文。


T2RNet 训练细节:

1.原始gps轨迹做预处理("Trajectory Data Mining: An Overview 2015"),包括过滤噪声和驻留点移除等。

2.然后选取ROI区域作为tiles(这里的ROI论文中引述自"DeepGlobe 2018 A Challenge to Parse the Earth through Satellite Images"),该论文讲述的是卫星图识别竞赛,目前排名第一的网络(子豪这边正在调研该网络)并未对roi进行区分。我认为轨迹这里的ROI区域可以自己定义,比如以grid进行分割,统计区域内的轨迹点数/轨迹数,设定阈值选取ROI。

3.对每个tile进行网格化,划分为256*256的cells,每个cell 2m*2m (可以区分平行道路最粗的分辨率),也就是说每个tile作为一个data sample进行训练,size为512m*512m

4.unet部分卷积组数为4,每层通道数为64/128/256/512。Transition Embedding部分的dense layer 为64/8 。 adam优化。batch size 8。learning rate 2e−4。

复现逻辑:取某个城市某个地区一个月的轨迹图(原文选取16km*16km区域内的一个月的数据,由于unet可以在小数据量的情况下拟合网络,所以数据量应该可以再降一下。而取整个城市跑的,cell的数量太过庞大),先做预处理,然后按照2m*2m划分cell,然后每256*256个cell组成一个样本,每个样本的提取到的特征为11(Spatial View)+8(Transition View,dense layer处理后的维)=19维,那么input chanal = 19 。送入T2RNet网络中学习到256*256*2的道路中心线结果(二分类)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章