轨迹生成路网论文研读：Learning to Generate Maps from Trajectories

原創

hr_net

2020-04-29 16:52

本文入选AAAI 2020

传统路网生成的方法分为三类：聚类/轨迹顺序扫描合并/密度。前两者基于点生成的line，在低采样频率时出现“伪捷径”，且无法处理平行道路。第三类基于点云，可以处理低采样频率，但是无法区分平行道路。

本文提出deepMG模型生成路网，可以处理不同频率的轨迹点，且在拓扑中区分平行道路。

deepMG包含两个部分：

1.几何转换：T2RNet，提取两类轨迹特征作为输入，送入T2RNet（轨迹to路），输出road 的中心线。

2.拓扑构建：从road 中心线构建图解钩，然后添加连接，最后结合轨迹进行map细化。

特征提取：

将ROI区域分割成tile（子豪卫星图这边没有生成ROI），每个tile分成I*J个cells，每个cell提取两类特征：

1.Spatial View：点的密度/线的数量/平均速度/方向直方图（8个方向）每个cell共计1+1+1+8=11维特征

2.Transition View：低频采样时两个连续的点不一定在同一个cell，此时空间特征失效。为每一个cell设定T*T的邻域，建立T*T的矩阵，矩阵中的每个元素1/0代表是否与本cell的points之间有连续性关系。这种关系存在时序性，即c“->c->c‘ ，所以需要从时间顺序上取先、后两个T*T的矩阵存储，每个cell共计2*T*T的特征。这里需要说明，论文中的邻域采用了降分辨率重建的方式，根据采样频率设置超参数：邻域距离，采样频率为30s时邻域设置为300m，3s的采样频率邻域为50m，然后根据T的参数进行cell的重建（这一步有些模糊，sample边缘处怎么处理未说明）。

T2RNet提取road中心线：卷积encoder+反卷积decoder

1.Transition Embedding：（2*T*T）*I*J的transition view 通过两层dense layers变成（k）*I*J维，这里T=8，k=64

2.Shared Encoder : concat Transition Embedding与Spatial View送入卷积组

3.Road Region Decoder：辅助任务，提取road区域，将encoder得到的最终features融合对应卷积组的Encoder特征进行反卷积

4.Road Centerline Decoder：road中心线提取，与3类似，每组卷积中融合的信息不但包括对应卷积组的Encoder特征，还包括辅助任务对应卷积组的Road Region Decoder特征。

损失函数：混合loss，对辅助任务和中心线提取任务进行加权，其中lamda=0.2

标签数据来源：use OpenStreetMap as the ground truth, and road region labels are generated by masking 2 cells surrounding the centerlines.

T2RNet相比unet性能优越的原因：在unet的基础上，添加道路区域作为辅助信息流，融合编码信息与道路信息进行中心线提取。但是参数量上相比unet多了近80%。

ps: 若T2RNet结构无法理解，可以先看FCN和Unet两篇论文。

T2RNet 训练细节：

1.原始gps轨迹做预处理（"Trajectory Data Mining: An Overview 2015"），包括过滤噪声和驻留点移除等。

2.然后选取ROI区域作为tiles（这里的ROI论文中引述自"DeepGlobe 2018 A Challenge to Parse the Earth through Satellite Images"），该论文讲述的是卫星图识别竞赛，目前排名第一的网络（子豪这边正在调研该网络）并未对roi进行区分。我认为轨迹这里的ROI区域可以自己定义，比如以grid进行分割，统计区域内的轨迹点数/轨迹数，设定阈值选取ROI。

3.对每个tile进行网格化，划分为256*256的cells，每个cell 2m*2m （可以区分平行道路最粗的分辨率），也就是说每个tile作为一个data sample进行训练，size为512m*512m

4.unet部分卷积组数为4，每层通道数为64/128/256/512。Transition Embedding部分的dense layer 为64/8 。 adam优化。batch size 8。learning rate 2e−4。

复现逻辑：取某个城市某个地区一个月的轨迹图（原文选取16km*16km区域内的一个月的数据，由于unet可以在小数据量的情况下拟合网络，所以数据量应该可以再降一下。而取整个城市跑的，cell的数量太过庞大），先做预处理，然后按照2m*2m划分cell，然后每256*256个cell组成一个样本，每个样本的提取到的特征为11（Spatial View）+8（Transition View，dense layer处理后的维）=19维，那么input chanal = 19 。送入T2RNet网络中学习到256*256*2的道路中心线结果（二分类）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

轨迹生成路网论文研读：Learning to Generate Maps from Trajectories

《Python进阶》学习笔记

Leetcode 3161. 物块放置查询

leetcode 60 排列序列

一个docker容器暴露多个端口

微服务实践之使用 Visual Studio 2022 调试Dapr 应用程序

wpf附加属性理解 WPF附加属性

tensorflow-gpu OOM的參數調整

劍指offer之孩子們的遊戲（約瑟夫環問題）

deconvolution/transposed conv 理解

cnn網絡架構的演進簡述

骨架矢量化sknw源碼研讀

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結