方向梯度直方圖(HOG)和顏色直方圖的一些比較

最近在學習視頻檢索領域的鏡頭分割方面的知識,發現常用的方法是直方圖的方法,所以才專門有時間來學習下。查看到這兩種直方圖的時候,感覺有點接近,好像又不同,放在這做個比較。大部分還是百科的內容,不過對基本理解還是夠了.OK,開始正文~


首先,介紹下什麼是直方圖

在統計學中,直方圖(英語:Histogram)是一種對數據分佈情況的圖形表示(數據分佈如:如物體的色彩分佈、物體邊緣梯度模板,以及表示目標位置的概率分佈。),是一種二維統計圖表,它的兩個座標分別是統計樣本和該樣本對應的某個屬性的度量。又稱質量分佈圖。是一種統計報告圖,由一系列高度不等的縱向條紋或線段表示數據分佈的情況。一般用橫軸表示數據類型,縱軸表示分佈情況。

直方圖與條形圖的區別在於,直方圖是用面積而非高度來表示數量。

歸一化直方圖:把直方圖上每個屬性的計數除以所有屬性的計數之和,就得到了歸一化直方圖。



然後,方向梯度直方圖(HOG)

特點:在一個網格密集的大小統一的方格單元(dense grid of uniformly spacedcells)上計算,而且爲了提高精確度使用了重疊的局部對比度歸一化(overlapping local contrastnormalization)的方法。

核心思想:一幅圖像中的物體的表象和形狀可以被像素強度梯度或邊緣的方向分佈很好地描述。

實現方法:將圖像分成小的叫做方格單元連通區域;然後採集方格單元中各像素點的梯度方向或邊緣方向直方圖;最後把這些直方圖組合起來就可以構成特徵描述子。

優點:首先,由於HOG方法是在圖像的局部方格單元上操作,所以它對圖像幾何的和光學的形變都能保持很好的不變性,這兩種形變只會出現在更大的空間領域上。其次,在粗的空域抽樣、精細的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。方向梯度直方圖方法是特別適合於做圖像中的行人檢測的。

算法和實現:

         1,計算梯度值。應用一個一維的離散的梯度模版分別應用在水平和垂直方向上去。可以使用如下的卷積核進行卷積:

[-1, 0, 1] and [-1, 0, 1]^T.

         2,建立分塊直方圖。每個塊內的每個像素對方向直方圖進行投票。每個塊的形狀可以是矩形或圓形的,方向直方圖的方向取值可以是0-180度或者0-360度,這取決於梯度是否有符號。Dalal和Triggs發現在人的檢測實驗中,把方向分爲9個通道效果最好。至於投票的權重,可以是梯度的幅度本身或者是它的函數。在實際測試中,梯度幅度本身通常產生最好的結果。

         在Dalal和Triggs的人檢測實驗中,發現最優的單元塊劃分是3x3或6x6個像素,同時直方圖是9通道。



最後,顏色直方圖

顏色直方圖(英語:ColorHistogram),指圖像中顏色分佈的圖形表示。

 

顏色直方圖它所描述的是不同色彩在整幅圖像中所佔的比例,而並不關心每種色彩所處的空間位置.

全局顏色直方圖:反映的是圖像中顏色的組成分佈,即出現了哪些顏色以及各種顏色出現的概率

 

計算:

計算顏色直方圖需要將顏色空間劃分成若干個小的顏色區間,每個小區間成爲直方圖的一個bin。這個過程稱爲顏色量化(color quantization)。然後,通過計算顏色落在每個小區間內的像素數量可以得到顏色直方圖。顏色量化有許多方法,例如向量量化、聚類方法或者神經網絡方法。

——————————————————————————————————————————————————

經過上邊細緻的比較,兩者之間的區別還是很明顯的。

對於應用,就我目前看過的,HOG大多作爲一種形狀描述,而顏色直方圖一般用於顏色特徵。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章