【Transfer Learning】Deep feature transfer between localization and segmentation tasks

忙裏偷閒寫一篇博客,因爲實在是很久沒有寫博客了,內心覺得有一些內疚,我就是個這麼乖巧的博主和小編(這麼說我要開始催師弟們寫博客了阿哈哈哈~)。我們進入正題,最近因爲課題的原因,多多少少的接觸了一些遷移學習的內容,就將一些學習筆記和內容記錄下來。從Paper名字來看,這是一篇在定位和分割任務之間做深度特徵遷移的,使用的也是分割的基礎網絡UNet,一個很基礎的分割網絡。 這篇論文可在在Axiv【Paper】上檢索的到,但只有4頁,可能是2019年CVPR的Workshop的小論文(但小編我實在是找不到它出自哪個workshop)。不過嚴格來說,這篇論文不算是大套路中的遷移學習,至少和Multi-tasks的套路還是有些區別的, 如果從網絡的結構來看,有些像預訓練思想和Multi-task的結合。雖然有取巧的嫌疑,但這不能妨礙它有效,所以我們來圍觀學習一下。

0 Paper前的複習

目標檢測問題實際上就是對圖像中能夠識別出類別的物體框起來,圖像分割問題就是獲取這個物體比較準確的輪廓邊緣,也就是說圖像分割實際上是像素級別的分類。求解圖像分割mask的算法有很多,最早將深度學習和圖像分割結合起來的算法是FCN(Fully Convolutional Networks)全卷積網絡,可以實現端到端的圖像分割。後續很多的網絡都是基於全卷積的思想來實現的。UNet【Paper】就是基於FCN的一種基礎分割網絡,把UNet的網絡結構放在下面,有感興趣的夥伴可以取倆節一下。
在這裏插入圖片描述

1 Paper的主要思想

論文使用的數據是眼底視盤的光學圖像(optic disc from fundus photographs),論文中認爲這種方法可以用於其他的醫學圖像分割。訓練集、驗證集和測試集的圖像總量超過10,000張,對於訓練集來說,其中有9,047張帶有中心點的檢測框,有92張圖像帶有二值分割mask。

“敲黑板,劃重點!!!” 在這篇論文中提出了一個基於UNet圖像分割的預訓練計劃,先用檢測網絡訓練UNet中的編碼分支,然後擴展到用於分割的UNet體系中,即把分割的分支加上。 結構很簡單,對於基礎的UNet也沒有做特別多的改動,所以在網絡結構的理解上應該沒有什麼難點。

我們來看一下網絡結構(如下圖)。
在這裏插入圖片描述
網絡結構主要包括兩個部分:Encoder檢測階段+Decoder分割階段。訓練步驟如下:

  • 我們先用帶有檢測框的圖像數據進行檢測網絡的訓練,直到損失收斂。
  • 檢測網絡收斂之後,去掉全連接層,將剩餘的檢測網絡權重凍結,增加分割的decoder分支,使用帶有mask標註的圖像訓練網絡,直到收斂。

2 Paper中的其他Points

可能是Workshop的小論文,所以在實驗結果上和其他大論文相比看起來有些單薄,也沒有相應的對比實驗,在論文實驗結果中,在普通的UNet上測試的結果是Dice coefficient是0.84,standard deviation是0.2。在用論文中的方法和基於五折驗證法的基礎上,Dice coefficient是0.88,standard deviation是0.1。 從結果上來看提升還是很明顯的,在Dice coefficient的得分上提高了4個百分點,這在沒有其他數據的補充和擴增上效果還是很好的。
不過這篇論文中值得一提的還有Dice coefficient這個評價指標。 這是在分割算法中還算常見的一個評價指標,和我們接觸的Iou或者mIou還是不太相同的。雖然都是用面積來表示分割算法的準確性,Iou用的是交併比,即重疊面積/合併面積,而Dice用的是另一種交併比,即2倍的重疊面積/面積之和。具體的可以看這個博客【Dice’s coefficient】

後續的還會隨時記錄遷移學習Transfer Learning的內容,小編纔開始學習遷移學習+分割,小夥伴們有什麼推薦的可以儘管把乾貨砸給我,謝謝各位鐵鐵們。

發佈了56 篇原創文章 · 獲贊 106 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章