SIFT/SURF、haar特徵、廣義hough變換

 

三種強大的物體識別算法——SIFT/SURF、haar特徵、廣義hough變換的特性對比分析

識別算法概述:

 SIFT/SURF基於灰度圖,

一、首先建立圖像金字塔,形成三維的圖像空間,通過Hessian矩陣獲取每一層的局部極大值,然後進行在極值點周圍26個點進行NMS,從而得到粗略的特徵點,再使用二次插值法得到精確特徵點所在的層(尺度),即完成了尺度不變。

二、在特徵點選取一個與尺度相應的鄰域,求出主方向,其中SIFT採用在一個正方形鄰域內統計所有點的梯度方向,找到佔80%以上的方向作爲主方向;而SURF則選擇圓形鄰域,並且使用活動扇形的方法求出特徵點主方向,以主方向對齊即完成旋轉不變。

三、以主方向爲軸可以在每個特徵點建立座標,SIFT在特徵點選擇一塊大小與尺度相應的方形區域,分成16塊,統計每一塊沿着八個方向佔的比例,於是特徵點形成了128維特徵向量,對圖像進行歸一化則完成強度不變;而SURF分成64塊,統計每一塊的dx,dy,|dx|,|dy|的累積和,同樣形成128維向量,再進行歸一化則完成了對比度不變與強度不變。

 

haar特徵也是基於灰度圖,

首先通過大量的具有比較明顯的haar特徵(矩形)的物體圖像用模式識別的方法訓練出分類器,分類器是個級聯的,每級都以大概相同的識別率保留進入下一級的具有物體特徵的候選物體,而每一級的子分類器則由許多haar特徵構成(由積分圖像計算得到,並保存下位置),有水平的、豎直的、傾斜的,並且每個特徵帶一個閾值和兩個分支值,每級子分類器帶一個總的閾值。識別物體的時候,同樣計算積分圖像爲後面計算haar特徵做準備,然後採用與訓練的時候有物體的窗口同樣大小的窗口遍歷整幅圖像,以後逐漸放大窗口,同樣做遍歷搜索物體;每當窗口移動到一個位置,即計算該窗口內的haar特徵,加權後與分類器中haar特徵的閾值比較從而選擇左或者右分支值,累加一個級的分支值與相應級的閾值比較,大於該閾值纔可以通過進入下一輪篩選。當通過分類器所以級的時候說明這個物體以大概率被識別。

 

廣義hough變換同樣基於灰度圖,

使用輪廓作爲特徵,融合了梯度信息,以投票的方式識別物體,在本blog的另一篇文章中有詳細討論,這裏不再贅述。

 

 

特點異同對比及其適用場合:

 

三種算法都只是基於強度(灰度)信息,都是特徵方法,但SIFT/SURF的特徵是一種具有強烈方向性及亮度性的特徵,這使得它適用於剛性形變,稍有透視形變的場合;haar特徵識別方法帶有一點人工智能的意味,對於像人臉這種有明顯的、穩定結構的haar特徵的物體最適用,只要結構相對固定即使發生扭曲等非線性形變依然可識別;廣義hough變換完全是精確的匹配,可得到物體的位置方向等參數信息。前兩種方法基本都是通過先獲取局部特徵然後再逐個匹配,只是局部特徵的計算方法不同,SIFT/SURF比較複雜也相對穩定,haar方法比較簡單,偏向一種統計的方法形成特徵,這也使其具有一定的模糊彈性;廣義hough變換則是一種全局的特徵——輪廓梯度,但也可以看做整個輪廓的每一個點的位置和梯度都是特徵,每個點都對識別有貢獻,用直觀的投票,看票數多少去確定是否識別出物體。

像HOG就比較適用於人整體的檢測,而HAAR更傾向於人臉的識別

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章