文章目錄
參考博客:
DPM(Deformable Part Model)原理詳解
目標檢測的圖像特徵提取之(一)HOG特徵
傳統目標檢測算法
Viola-Jones方法(人臉識別)
opencv內置的人臉識別算法用的就是該算法。
Haar特徵抽取
haar特徵屬於紋理特徵的一種,特徵提取爲
訓練人臉識別分類器(adaboost分類器)
多個弱分類器進行集成學習(三個臭皮匠賽過諸葛亮)
滑動窗口
滑動窗口算法有許多需要做優化的地方,比如滑動窗口的大小和步長,因爲尺度的變化和步長的變化會導致算法本身就會出現的大量的冗餘的候選框,這些冗餘的候選框就會造成目標檢測算法速度的下降和性能的降低
- 滑動窗口的步長
HOG + SVM (行人檢測、opencv實現)
該算法的提出也主要是用於行人檢測,該問題的難點也在於行人的姿態變化和行人處在運動狀態的識別。
主要過程:
HOG特徵
方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和圖像處理中用來進行物體檢測的特徵描述子。它通過計算和統計圖像局部區域的梯度方向直方圖來構成特徵。
優點
與其他的特徵描述方法相比,HOG有很多優點。首先,由於HOG是在圖像的局部方格單元上操作,所以它對圖像幾何的和光學的形變都能保持很好的不變性,這兩種形變只會出現在更大的空間領域上。其次,在粗的空域抽樣、精細的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。因此HOG特徵是特別適合於做圖像中的人體檢測的。
HOG特徵提取算法的主要流程
HOG特徵提取方法就是將一個image(你要檢測的目標或者掃描窗口):
-
灰度化(將圖像看做一個x,y,z(灰度)的三維圖像);
-
採用Gamma校正法對輸入圖像進行顏色空間的標準化(歸一化);目的是調節圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;
-
計算圖像每個像素的梯度(包括大小和方向);主要是爲了捕獲輪廓信息,同時進一步弱化光照的干擾。
- 最常用的方法是:首先用[-1,0,1]梯度算子對原圖像做卷積運算,得到x方向(水平方向,以向右爲正方向)的梯度分量gradscalx,然後用[1,0,-1]T梯度算子對原圖像做卷積運算,得到y方向(豎直方向,以向上爲正方向)的梯度分量gradscaly。然後再用以上公式計算該像素點的梯度大小和方向;
-
將圖像劃分成小cells(例如6*6像素/cell);
-
統計每個cell的梯度直方圖(不同梯度的個數),即可形成每個cell的descriptor;
- 爲局部圖像區域提供一個編碼,同時能夠保持對圖像中人體對象的姿勢和外觀的弱敏感性;
-
將每幾個cell組成一個block(例如3*3個cell/block),一個block內所有cell的特徵descriptor串聯起來便得到該block的HOG特徵descriptor。
- 由於局部光照的變化以及前景-背景對比度的變化,使得梯度強度的變化範圍非常大。這就需要對梯度強度做歸一化。歸一化能夠進一步地對光照、陰影和邊緣進行壓縮。
-
將圖像image內的所有block的HOG特徵descriptor串聯起來就可以得到該image(你要檢測的目標)的HOG特徵descriptor了。這個就是最終的可供分類使用的特徵向量了。
DPM(物體檢測)
基於HOG特徵進行優化。