【CVPR2017論文】Loss Max-Pooling for Semantic Image Segmentation

問題引入

CNN的發展在很多任務取得了很好的效果,但是很少有工作注意到怎麼合理的處理類別分佈不均衡的問題。所謂的不均衡指的就是大多數的數據組成了數據中的類別數目較少的大類別,而其餘的屬於小類別,形成了相對不具有代表性的類別,數據聚集在某些類別上,因此,可以觀察到可以觀察到,在沒有校正機制的情況下進行訓練的分類器在推斷期間傾向於偏向大類別。

減輕類不均衡問題的方式

一種方式是首先強調數據集的均衡彙集,大致統一收集樣本。ImageNet,Caltech,CIFAR10這些數據集是遵循這點的典型代表,訓練集驗證集和測試集大致均衡,每一類的樣例數均衡。
另一種使用廣泛的是在彙集實際訓練數據時,對數據較少的類別進行過度採樣或從大多數人羣中進行抽樣。這樣的方法改變了底層的數據分佈,並且可能導致次優利用可用數據,增加計算工作量,或在重複訪問來自數據量小的類別的樣本時過度擬合的風險。但是它的效率以及可以直接應用於圖片分類任務取得了普遍認同的做法。
被稱爲成本敏感學習的另一種方法是通過引入特定類別的權重來改變算法行爲,這通常是從原始數據統計中得出的。這些方法最近在深度學習領域研究,其中一些方法遵循先前在諸如隨機森林或支持向量機等淺層學習方法中應用的想法。這些工作中許多使用靜態定義的代價矩陣或引入額外的參數學習步驟。 由於空間排列和相鄰像素之間的類間強相關性,因此當執行像語義分割任務中的密集像素分類時,成本敏感的學習技術優於重採樣方法。 然而,當前語義分割數據集的趨勢表現出複雜性的增加,增加了更多的少數類別。

貢獻

在這項工作中,我們提出了一個原則性的解決方案來處理在深度學習方法中語義分割任務的的數據集不平衡問題。 具體而言,我們引入了一個新的損失函數,限制了傳統損失的上界,傳統損失中每個像素的權重相等。 這個上界是通過作用於像素損失級的廣義最大池化操作獲得。
最大化是通過像素加權函數實現的,由此基於它們實際展現出的的損失,提供對每個像素的貢獻的自適應重新加權。 一般來說,訓練期間較高損失的像素的權重大於損失較低的像素,從而間接地補償了數據集內潛在的類間和類內不平衡。 後一種不平衡是因爲我們的動態重新加權是類無關的,即我們沒有利用以前的成本敏感學習方法的類標籤統計。
廣義的最大池化操作,即我們的新損失,可以以不同的方式實例化,這取決於我們如何劃分可行像素加權函數的空間。 在本文中,我們重點研究了具有有界p範數和∞範數的特定加權函數族,並研究了在這種情況下我們的損失函數所表現的性質。 此外,我們提供了在這種特殊情況下得到我們的損失函數的顯式表徵的理論貢獻,其使得能夠計算深度神經網絡的優化所需的梯度。

PS:
這篇論文後續就是很多的公式推導,數據分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章