計算機視覺理論基礎(四)
檢測識別
人臉檢測
Haar-like特徵+級聯分類器
Haar-like特徵
特徵模板有白色和黑色兩種矩形,定義模板的特徵值爲白色矩形內的像素和減去黑色矩形內的像素和
-
用處:表示人臉的某些特徵
具體見CV理論基礎(三):基於關鍵點的特徵描述子sift、surf、orb等;LBP、Gabor -
Haar-like特徵數量選擇
模板15種、位置、縮放相互組合
Haar級聯分類器
利用Adaboost。級聯分類器是將多個強分類器連接在一起進行操作,每一個強調分類器由若干個弱分類器加權組成。
強分類器拼接成級聯分類器如圖所示:
作爲負例去除的一定不是人臉
弱分類器拼接成強分類器如圖所示:
弱分類器和強分類器
弱分類器:選取特徵,以稍低於50%的錯誤率區分人臉或非人臉圖像。訓練弱分類器是在當前權重分佈情況下,確定f的最優閾值,使弱分類器對所有訓練樣本的分類誤差最低。
強分類器:將每輪得到的最佳弱分類器按照一定方法Boosting,構造強分類器。強分類器對負樣本更敏感
行人檢測
HOG+SVM
HOG 方向梯度直方圖
梯度是一個矢量。。其中,是沿x方向上的梯度,是沿y方向上的梯度,梯度的幅值,絕對值大小,方向角表示如下:
步驟如下:
(1) 將整個圖像進行Gamma空間、顏色歸一化
(2)圖像梯度計算
分別計算水平、垂直梯度的幅值和方向
注意:彩色圖,選取梯度幅值最大的通道
(3)Block拆分
定義兩種數據結構的單位:Cell、Block,避免明暗光照的影響
一個Block包含個Cell,每個Cell是個pixel
一幅圖個Block,步長是8,50%重合
(4)構建方向的直方圖
-
計算Cell的梯度方向直方圖:
使用位置高斯加權,進行平滑。將0-180度分爲9個bin,相鄰bin使用線性插值,如85,與80距離5,離100距離15,歸到80,歸到100。歸屬於哪裏,積累相應的梯度幅值。
三線性插值,x方向,y方向,bin分配 -
串接所有Block直方圖
例如圖片,形成個Block,共有維
(5)將細胞單元組合成更大的空間,對比度歸一化
梯度幅值絕對值大小容易受前景背景對比度和局部光照影響,所以需要對局部細胞單元進行對比度歸一化處理,L2範式或L1範式。
經過此步驟HOG描述符變成由各區間所有細胞單元的直方圖成分所組成的一個向量,區間相互重疊,每一個細胞單元的輸出都多次作用於最終的描述器。
(6)收集HOG特徵
SVM
基本模型:線性可分情況下,將正類和反類訓練樣本使用超平面完全正確分開,間隔最小。
模型允許錯分樣本,引入鬆弛變量,不但要使兩類樣本之間的間隔儘量大,同時還要使錯分的樣本的鬆弛變量之和儘可能小,
存在線性不可分數據時,通過非線性映射f(x)把數據由低維空間向高維空間映射,在高維空間爲低維數據構造線性可分離超平面。該分離超平面對應原特徵空間一個分割超曲面。
Multiple-instance SVM
思想:將標準SVM的最大化樣本間距擴展爲最大化樣本集間距。具體來說是選取正樣本集中最像正樣本的樣本用作訓練。
目標:保證正樣本中有正,負樣本不能爲正。
Latent SVM
實際上和MI-SVM相同,區別在於擴展了Latent變量。
Deformable Part Model
可變形的組件模型是一種基於組件的檢測算法,經典算法。
模型組成
模型包含一個分辨率的根濾波器(Root filter)——看整體形狀響應,如左圖所示
和一個分辨率的組件濾波器(Part filter)——上採樣高斯得到高分辨率,如中圖所示
響應函數
分別是錨點的橫座標,縱座標,尺度
是根模型的響應分數
是部件模型的響應分數
是不同模型組件之間的偏移係數,加上這個偏移量使其與跟模型進行對齊
表示組件模型的像素爲原始的2倍
檢測流程
(1)將輸入圖像,提取DPM特徵圖,進行高斯金字塔上採樣,提取其DPM特徵圖
(2)將原始圖像DPM特徵圖和訓練好Root filter做卷積操作,從而得到Root filter的響應圖
(3)2倍圖像的DPM特徵圖,和訓練好的Part filter做卷積操作,從而得到Part filter的響應圖
(4)對精細高斯金字塔的下采樣操作,Root filter的響應圖和Part filter的響應圖具有相同的分辨率
(5)進行加權平均,得到最終的響應圖。亮度越大表示響應值越大。