【視覺算法】廣義霍夫變換在三維物體識別中的改進和應用學習

前兩篇文章,學習了經典霍夫變換和廣義霍夫變換,我們對霍夫變換的原理和整個過程有了較爲清楚的認知。這篇文章主要學習廣義霍夫變換在三維物體識別中的改進和應用。
首先思考一個問題,如果直接將廣義霍夫變換應用在三維場景下的物體識別中會怎麼樣?
先確定未知參數的個數,由基本的三維物體識別和姿態估計知識,六個自由度,包括三個方向的角度和位移,即6個未知參數;直接應用(這裏,以特徵點的法線方向替代梯度方向[1]),顯然霍夫參數空間是6維的,空間複雜度O(N6);這六個參數中的三個角度,是需要遍歷的,即有窮舉過程,時間複雜度O(MN3),其中M是特徵點個數,N是量化間隔數目(即單維度的區間劃分個數)。
代價極高!顯然,直接應用是不可取的。
接下來我們看一種改進方法[2]。
在這裏插入圖片描述
描述上圖,離線過程很好理解,即從模型中學習特徵,並將特徵存儲(特徵描述子的存儲方式,參考PFH,FPFH,VFH,SHOT[3]等一些描述子的特徵直方圖)。
在線過程,計算場景的特徵,和模型特徵匹配,霍夫投票,根據投票結果計算旋轉矩陣和平移向量。這裏逐個解釋:
1、特徵,特徵描述子內容較多,下一篇文章中詳細解釋SHOT[3]特徵描述子,文章[2]提出的方法,僅適用於基於局部參考系(Local Reference Frame,LRF)的特徵描述子(事實上,先進的特徵提取方法是要構建局部參考系的);爲了方便理解這篇文章,這裏簡要描述一下局部參考系的構建過程[3]:對於特徵點p,給定半徑r,在以p爲球心,半徑爲r的球體內,計算球內所有點的質心,根據這些點和質心構建協方差矩陣M,對M進行特徵值分解,局部參考系的x,y,z三個軸就是由三個特徵向量確定的,這裏只是簡要說明。
顯然,局部參考系具有旋轉和平移不變性,文章的改進就是充分利用了這一點。
ps:上面提到的PFH、FPFH、VFH沒有構建局部參考系,PFH、FPFH是局部特徵描述子,VFH是全局的,而SHOT是構建了局部參考系的局部特徵描述子。
2、特徵匹配,其目的是爲了確定特徵對應關係,兩兩匹配;常見的匹配方法,計算描述子之間的歐式距離(這裏不要侷限於一般意義的距離,兩個角度之間也是可以計算歐式距離的);距離小於給定閾值的就認爲匹配成功,顯然,這種匹配方法往往包含了一些錯誤點對,這是很難避免的,性能優異的描述子能夠使匹配正確率提高。
3、霍夫投票,着重理解。
先看一些變換關係:
在這裏插入圖片描述
上圖中虛線左邊是在模型點雲中的,F是特徵點,在其周圍構建了局部參考系;C是選取的參考點(文章中選取了模型質心);R是由全局參考系到局部參考系的變換矩陣,它是由局部參考系的3個單位向量確定的。看下面幾個公式:
在這裏插入圖片描述
向量V的計算與一般的霍夫變換是相同的。
在這裏插入圖片描述將V由全局參考系變換到局部參考系。
在這裏插入圖片描述
變換矩陣R的構建。
對於場景中,上述過程是類似的。看一下圖像空間到參數空間的投射關係:
對於一個點對,在局部參考系下:
在這裏插入圖片描述
投射:
在這裏插入圖片描述
等式左邊的V確定,即可確定參考點;每個對應關係,在霍夫參數空間中投一票。如果你仔細學習了霍夫變換,這是很好理解的。根據匹配好的對應關係,每個場景中的特徵點只進行一次投票,這與廣義霍夫變換中一個特徵點進行多次投票是不同的,省去了很多計算,同時也對對應關係的正確性產生了依賴。
得益於局部參考系的旋轉和平移不變性,投票過程僅需要上面的步驟,即僅根據V向量的三個分量構造霍夫參數空間,其維度僅爲3,空間複雜度O(N3);沒有窮舉過程,時間複雜度O(M),其中M是特徵點個數,N是量化間隔數目;效率極大提高。
干擾因素的存在可能使投票散落在峯值網格周邊的網格之中,因此,文章將峯值網格的6個臨近網格的票數加在當前網格。
應用廣義霍夫變換,顯然,多個峯值往往對應着多個目標,單/多目標都可通過一次投票識別完成。
求解旋轉矩陣時,選取對應關係的子集,這些子集是與票數最高的那個網格對應的,這樣能提高準確率和效率。平移向量求解是非常簡單的,如:質心相減。
算法部分就學習到這裏,接下來看文中的對比實驗:
在這裏插入圖片描述
觀察P-R曲線,顯然文中方法優於另外兩種方法。這裏要提一下GC(geometric consistency,幾何一致性分組),GC和本文的霍夫變換是可以應用於實際的兩種效果比較好的物體識別方法(見PCL官方教程代碼)。
至此,廣義霍夫變換在三維物體識別中的改進和應用就學習完了;下一篇文章學習SHOT描述子。
參考文獻:
(1) K. Khoshelham, “Extending generalized hough transform to detect 3d objects in laser range data,” in Proc. ISPRS Workshop on Laser Scanning, 2007, pp. 206–210.
(2) Tombari F , Stefano L D . Object recognition in 3D scenes with occlusions and clutter by Hough voting[C]// 2010 Fourth Pacific-Rim Symposium on Image and Video Technology. IEEE, 2010.
(3) Salti S , Tombari F , Stefano L D . SHOT: Unique signatures of histograms for surface and texture description[J]. Computer vision and image understanding, 2014, 125(AUG.):251-264.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章