軌跡生成路網論文研讀:Learning to Generate Maps from Trajectories

本文入選AAAI 2020

傳統路網生成的方法分爲三類:聚類/軌跡順序掃描合併/密度。前兩者基於點生成的line,在低採樣頻率時出現“僞捷徑”,且無法處理平行道路。第三類基於點雲,可以處理低採樣頻率,但是無法區分平行道路。

本文提出deepMG模型生成路網,可以處理不同頻率的軌跡點,且在拓撲中區分平行道路。

deepMG包含兩個部分:

1.幾何轉換:T2RNet,提取兩類軌跡特徵作爲輸入,送入T2RNet(軌跡to路),輸出road 的中心線。

2.拓撲構建:從road 中心線構建圖解鉤,然後添加連接,最後結合軌跡進行map細化。


特徵提取:

將ROI區域分割成tile(子豪衛星圖這邊沒有生成ROI),每個tile分成I*J個cells,每個cell提取兩類特徵:

1.Spatial View:點的密度/線的數量/平均速度/方向直方圖(8個方向)每個cell共計1+1+1+8=11維特徵

2.Transition View:低頻採樣時兩個連續的點不一定在同一個cell,此時空間特徵失效。爲每一個cell設定T*T的鄰域,建立T*T的矩陣,矩陣中的每個元素1/0代表是否與本cell的points之間有連續性關係。這種關係存在時序性,即c“->c->c‘ ,所以需要從時間順序上取先、後兩個T*T的矩陣存儲,每個cell共計2*T*T的特徵。這裏需要說明,論文中的鄰域採用了降分辨率重建的方式,根據採樣頻率設置超參數:鄰域距離,採樣頻率爲30s時鄰域設置爲300m,3s的採樣頻率鄰域爲50m,然後根據T的參數進行cell的重建(這一步有些模糊,sample邊緣處怎麼處理未說明)。


T2RNet提取road中心線:卷積encoder+反捲積decoder

1.Transition Embedding:(2*T*T)*I*J的transition view 通過兩層dense layers變成(k)*I*J維,這裏T=8,k=64

2.Shared Encoder : concat Transition Embedding與Spatial View送入卷積組

3.Road Region Decoder:輔助任務,提取road區域,將encoder得到的最終features融合對應卷積組的Encoder特徵進行反捲積

4.Road Centerline Decoder:road中心線提取,與3類似,每組卷積中融合的信息不但包括對應卷積組的Encoder特徵,還包括輔助任務對應卷積組的Road Region Decoder特徵。

損失函數:混合loss,對輔助任務和中心線提取任務進行加權,其中lamda=0.2

標籤數據來源:use OpenStreetMap as the ground truth, and road region labels are generated by masking 2 cells surrounding the centerlines.

T2RNet相比unet性能優越的原因:在unet的基礎上,添加道路區域作爲輔助信息流,融合編碼信息與道路信息進行中心線提取。但是參數量上相比unet多了近80%。

ps: 若T2RNet結構無法理解,可以先看FCN和Unet兩篇論文。


T2RNet 訓練細節:

1.原始gps軌跡做預處理("Trajectory Data Mining: An Overview 2015"),包括過濾噪聲和駐留點移除等。

2.然後選取ROI區域作爲tiles(這裏的ROI論文中引述自"DeepGlobe 2018 A Challenge to Parse the Earth through Satellite Images"),該論文講述的是衛星圖識別競賽,目前排名第一的網絡(子豪這邊正在調研該網絡)並未對roi進行區分。我認爲軌跡這裏的ROI區域可以自己定義,比如以grid進行分割,統計區域內的軌跡點數/軌跡數,設定閾值選取ROI。

3.對每個tile進行網格化,劃分爲256*256的cells,每個cell 2m*2m (可以區分平行道路最粗的分辨率),也就是說每個tile作爲一個data sample進行訓練,size爲512m*512m

4.unet部分卷積組數爲4,每層通道數爲64/128/256/512。Transition Embedding部分的dense layer 爲64/8 。 adam優化。batch size 8。learning rate 2e−4。

復現邏輯:取某個城市某個地區一個月的軌跡圖(原文選取16km*16km區域內的一個月的數據,由於unet可以在小數據量的情況下擬合網絡,所以數據量應該可以再降一下。而取整個城市跑的,cell的數量太過龐大),先做預處理,然後按照2m*2m劃分cell,然後每256*256個cell組成一個樣本,每個樣本的提取到的特徵爲11(Spatial View)+8(Transition View,dense layer處理後的維)=19維,那麼input chanal = 19 。送入T2RNet網絡中學習到256*256*2的道路中心線結果(二分類)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章