SegmentationasSelectiveSearchforObjectRecognition
摘要
對於物體識別來說,當時的方法是基於窮舉搜索。此處提出了利用更加具有價值的信息的方法:對於一些少量且精確的物體描繪生成許多合適的位置信息——(1)不會被發現的那些物體的位置信息是不會被識別的,(2)外觀和周圍的內容對於物體識別來說是最爲有效的信息。總之我們的方法很棒,能夠比當時最先進的算法的分類識別率還要高。你不服不行。
1 引言
所謂物體識別,就是找到物體的位置,以及其類別信息。我們準備用分割的方法來生成一定數量的位置信息,允許使用更加有效的bag-of-words特徵。爲了促進物體識別,每張圖片生成幾千個位置信息能夠保證包含實際的所有物體,此外,粗糙的分割包含了一些對周圍信息有利的物體分類信息,因此,我們將我們計算主要放在圖像的這些部分上,這些地方包含了物體分類最爲有效的信息。
總而言之,我們的主要貢獻有:(1)我們重新考慮了分割,並且把分割作爲選擇物體識別的最佳位置。我們強調回歸(召回?)更喜歡物體的近似而不是精確地物體輪廓。(2)我們證明環境因素通過不變的色彩空間能夠產生一個高召回率的選擇策略(3)我們的選擇策略可以利用多種特徵來進行。
2 分割——選擇搜索
高召回率 :爲了獲得高召回率,我們採取以下假設,(1)物體能夠在一張圖片中以任意大小的形式出現,此外,一些物體可能包含在其他的物體中,所以生成所有規格大小的物體位置是必要的。(2)沒有單一最好的策略,我們追求的是把多個互補的分割結合起來,已達到最優。
泛化位置信息充足 : 精確的物體輪廓在這裏不是很重要。
計算速度快 :
3 分割算法
我們使用了大小和外觀特徵,由於區域要比像素包含更多的信息,我們首先從過分割開始,瞭如一些小的區域,並不會包含多個物體。根據初始區域,我們採用貪心算法能夠迭代的將兩個最相思的區域結合在一起,我們一直這樣做下去,直到整張圖片變成一個區域。
這種文章真心看不下去,我去看卷積神經網絡吧。
Emma
SIAT
2017.02.28