軌跡生成路網論文研讀：Learning to Generate Maps from Trajectories

原創

hr_net

2020-04-29 16:52

本文入選AAAI 2020

傳統路網生成的方法分爲三類：聚類/軌跡順序掃描合併/密度。前兩者基於點生成的line，在低採樣頻率時出現“僞捷徑”，且無法處理平行道路。第三類基於點雲，可以處理低採樣頻率，但是無法區分平行道路。

本文提出deepMG模型生成路網，可以處理不同頻率的軌跡點，且在拓撲中區分平行道路。

deepMG包含兩個部分：

1.幾何轉換：T2RNet，提取兩類軌跡特徵作爲輸入，送入T2RNet（軌跡to路），輸出road 的中心線。

2.拓撲構建：從road 中心線構建圖解鉤，然後添加連接，最後結合軌跡進行map細化。

特徵提取：

將ROI區域分割成tile（子豪衛星圖這邊沒有生成ROI），每個tile分成I*J個cells，每個cell提取兩類特徵：

1.Spatial View：點的密度/線的數量/平均速度/方向直方圖（8個方向）每個cell共計1+1+1+8=11維特徵

2.Transition View：低頻採樣時兩個連續的點不一定在同一個cell，此時空間特徵失效。爲每一個cell設定T*T的鄰域，建立T*T的矩陣，矩陣中的每個元素1/0代表是否與本cell的points之間有連續性關係。這種關係存在時序性，即c“->c->c‘ ，所以需要從時間順序上取先、後兩個T*T的矩陣存儲，每個cell共計2*T*T的特徵。這裏需要說明，論文中的鄰域採用了降分辨率重建的方式，根據採樣頻率設置超參數：鄰域距離，採樣頻率爲30s時鄰域設置爲300m，3s的採樣頻率鄰域爲50m，然後根據T的參數進行cell的重建（這一步有些模糊，sample邊緣處怎麼處理未說明）。

T2RNet提取road中心線：卷積encoder+反捲積decoder

1.Transition Embedding：（2*T*T）*I*J的transition view 通過兩層dense layers變成（k）*I*J維，這裏T=8，k=64

2.Shared Encoder : concat Transition Embedding與Spatial View送入卷積組

3.Road Region Decoder：輔助任務，提取road區域，將encoder得到的最終features融合對應卷積組的Encoder特徵進行反捲積

4.Road Centerline Decoder：road中心線提取，與3類似，每組卷積中融合的信息不但包括對應卷積組的Encoder特徵，還包括輔助任務對應卷積組的Road Region Decoder特徵。

損失函數：混合loss，對輔助任務和中心線提取任務進行加權，其中lamda=0.2

標籤數據來源：use OpenStreetMap as the ground truth, and road region labels are generated by masking 2 cells surrounding the centerlines.

T2RNet相比unet性能優越的原因：在unet的基礎上，添加道路區域作爲輔助信息流，融合編碼信息與道路信息進行中心線提取。但是參數量上相比unet多了近80%。

ps: 若T2RNet結構無法理解，可以先看FCN和Unet兩篇論文。

T2RNet 訓練細節：

1.原始gps軌跡做預處理（"Trajectory Data Mining: An Overview 2015"），包括過濾噪聲和駐留點移除等。

2.然後選取ROI區域作爲tiles（這裏的ROI論文中引述自"DeepGlobe 2018 A Challenge to Parse the Earth through Satellite Images"），該論文講述的是衛星圖識別競賽，目前排名第一的網絡（子豪這邊正在調研該網絡）並未對roi進行區分。我認爲軌跡這裏的ROI區域可以自己定義，比如以grid進行分割，統計區域內的軌跡點數/軌跡數，設定閾值選取ROI。

3.對每個tile進行網格化，劃分爲256*256的cells，每個cell 2m*2m （可以區分平行道路最粗的分辨率），也就是說每個tile作爲一個data sample進行訓練，size爲512m*512m

4.unet部分卷積組數爲4，每層通道數爲64/128/256/512。Transition Embedding部分的dense layer 爲64/8 。 adam優化。batch size 8。learning rate 2e−4。

復現邏輯：取某個城市某個地區一個月的軌跡圖（原文選取16km*16km區域內的一個月的數據，由於unet可以在小數據量的情況下擬合網絡，所以數據量應該可以再降一下。而取整個城市跑的，cell的數量太過龐大），先做預處理，然後按照2m*2m劃分cell，然後每256*256個cell組成一個樣本，每個樣本的提取到的特徵爲11（Spatial View）+8（Transition View，dense layer處理後的維）=19維，那麼input chanal = 19 。送入T2RNet網絡中學習到256*256*2的道路中心線結果（二分類）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

軌跡生成路網論文研讀：Learning to Generate Maps from Trajectories

tensorflow-gpu OOM的參數調整

劍指offer之孩子們的遊戲（約瑟夫環問題）

deconvolution/transposed conv 理解

cnn網絡架構的演進簡述

骨架矢量化sknw源碼研讀

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結