kaggle

原創

jwy2014

2020-02-21 22:39

TernausNet is a modification of the celebrated UNet architecture that is widely used for binary Image Segmentation. For more details, please refer to our arXiv paper.

(Network architecure)

Pre-trained encoder speeds up convergence even on the datasets with a different semantic features. Above curve shows validation Jaccard Index (IOU) as a function of epochs for Aerial Imagery

This architecture was a part of the winning solutiuon (1st out of 735 teams) in the Carvana Image Masking Challenge.

2.Kaggel DSTL

訓練步驟

該模型能夠對輸入圖像的每個像素作出該點屬於目標類的概率。雖然用Jaccard指數作爲模型的評估指標，但是在訓練過程中以最小化所有像素的二進制交叉熵總和爲訓練目標。

我們對數據集通過預先計算得到數據的統計值，將圖像集歸一化爲具有零均值和單位方差的數據集。

根據圖像的實際類別，我們將預處理的圖像保持不變，或者將圖像及相應標籤共同調整爲1024x1024和2048x2048分辨率的正方形圖像。在訓練期間，我們從不同的圖像中隨機收集大小爲256x256的圖像塊，其中一半的圖像塊總是包含了一些正像素，即分類的目標對象。我們通過對圖像塊隨機地應用水平翻轉、垂直翻轉、隨機旋轉和顏色抖動等方法來增加批次中的圖像數量。雖然在處理數據集的不平衡類問題時，有欠採樣和調整數據集權重等多種方法，如上過採樣方法是效果最好和最簡單的方法。

每個網絡模型有大約有170萬個參數，設置批次大小爲4。該網絡訓練沒有采用現有模型進行微調的方法，在單個GTX 1070上花了約兩天時間完成了從權值初始化開始進行的網絡訓練過程。

後期處理

地面實際情況的標籤通過WKT格式文件進行加載，以由頂點定義的多邊形來表示對象。我們在提交過程中需要簡化所生成的多邊形，去除不必要的噪聲干擾。這樣評估系統可以快速處理所提交的結果，避免超時而限制實際效果。我們可以通過使用二值化輸出上的參數化操作，以最小的評估指標損失來實現多邊形簡化。在後期處理階段，我們使用了形態學上的圖像擴張和侵蝕操作，簡單有效地去除了小於給定閾值的物體及小孔

https://github.com/grantbey/kaggle-dstl