用Hough投票做物體檢測的3篇文獻

原創

2020-02-21 21:53

用Hough投票做物體檢測的3篇文獻

文獻1：Combined Object Categorization and Segmentation with an Implicit Shape Model，ECCV 04 Workshop。

內容簡介：用隱形狀模型（Implicit Shape Model, ISM）把物體的檢測和分割結合起來。

創新點：

用隱形狀模型把物體的識別和分割結合起來，整合到同一個概率框架下。
用基於最小描述長度（Minimal Description Length, MDL）的標準來做多個物體檢測問題。

算法細節：

碼本：

Harris檢測器提取感興趣點，提取patch，合併相似的patch，將類中心存入碼本。

物體識別的過程：

Harris檢測器提取感興趣點——提取patch——與碼本匹配——對物體中心投票——得到最大得分——蒐集相關patch——提取相關patch附近的patch。

概率形式化：

第一項是給定物體類別、patch的解釋後，hough投票物體位置的概率；第二項是碼本匹配的是物體而不是背景的概率；第三項是patch和碼本匹配的概率。

對上式求平均，得到一箇中心作爲物體的中心的得分爲：

物體分割：

基於最小描述長度的規則做多個物體場景分析：

最小描述長度的規則要求最小化圖像、模型和錯誤的總描述長度。提出savings的概念：

其中：指可以被假設h解釋的像素個數；指描述錯誤的代價；指模型複雜度。

兩個假說時：

_____________________________________________________________________________________

文獻2：A Boundary-Fragment-Model for Object Detection，ECCV 06。

內容簡介：提出了"Boundary-Fragment-Model"（BFM）檢測器，用物體的邊界來做檢測。流程爲：

創新點：

學習邊界片段碼本的方式。片段不但具有較高的類別信息，並且能夠穩定的預測物體的中心。

用Boosting方法把一系列基於邊緣片段的弱檢測器構造成強檢測器。有這些檢測器，檢測物體時不再需要滑動窗對物體定位。

算法細節：

學習邊界片段。主要涉及對邊界片段打分和選擇。需要訓練集（已用bounding box劃定了物體）和驗證集（標註了物體是否存在和物體的中心，但沒用bounding box）。

對邊界片段打分

候選的邊界片段需要滿足：（i）匹配的邊緣鏈經常在正例樣本而不在負例樣本；（ii）能較好的預測正例中的物體中心。根據以上兩點對邊界片段打分。邊界片段的代價函數爲：

其中：

選擇邊界片段

步驟：在邊界片段上隨機撒一些種子——讓種子在邊界片段上生長，並隨時計算在驗證集的代價——選擇最佳的邊界片段，得到碼本。碼本中有邊界片段相對於中心的幾何信息。——對碼本進行合併，降低冗餘。

用boosting的方法訓練物體檢測器。

弱分類器：幾個邊界片段的組合就有了較好的判別信息，可以組成弱分類器。如下圖：如果幾個邊界片段能匹配圖像的邊緣鏈，他們預測的中心比較靠近，並且與真正的物體中心接近。則形成弱分類器。

強分類器：用Adaboost的方法由弱分類器得到強分類器。這樣，每個弱分類器有各自的權重，用於後面的投票；整個強分類器也有輸出值，設置閾值後用於判斷物體是否存在。

物體檢測。

步驟：提取邊緣——用弱分類器匹配——每個弱分類器投票（弱分類器有自己的權重），得到候選點（該點來自弱分類器的投票數，即強分類器的輸出，必須大於一定閾值）——計算候選點的置信度，在候選點附近窗口內，用mean-shift的到新的中心——把對中心投票過的弱分類器重建出來——檢測物體——分割。

其中候選點的置信度用：

針對尺度、旋轉和視角變化，在文章末尾對算法提出改進。

對比：與ISM（implicit shape model）不同在於，ISM用所有的部分投票，本文只用物體的邊緣投票。

_____________________________________________________________________________________

文獻3： Class-Specific Hough Forests for Object Detection，CVPR 09。

內容簡介：通過訓練特定類的Hough森林，由各個部分對物體的中心位置投票，選取最大值作爲物體的中心。

創新點：Hough森林的引入。Hough森林的建立、在物體檢測中的應用是本文的重點。

算法細節：

Hough森林的特點。

葉子節點存的是具有判別性的碼本（一個patch是來自物體還是來自背景，物體中心距離當前patch中心的位置）。

建立Hough森林可以優化投票性能，即葉子節點投票時的不確定度將降低。

用有監督的方法建立樹，即一個patch是來自物體還是來自背景， patch來自物體的哪個部分。

Hough森林的建立。

用有監督的方式訓練Hough森林。訓練包括建樹、葉子節點信息的分配；測試時樣本從每個樹開始傳遞，輸出是到達的所有葉子節點分佈的平均。

建立Hough森林

訓練數據和葉子信息：訓練的patch表示爲：，分別代表patch的特徵、patch的類別（物體或是背景）、patch中心到bounding box中心的偏移量。葉子節點存儲總的類別構成和偏移量，形成碼本。

Patch的特徵和二值測試：一個patch的C種特徵爲，同一種特徵來自兩個位置的二值測試定義爲：。

樹的建立：建樹時，每個節點得到很多patch，如果達到成爲葉子節點的標準，該節點作爲葉子節點。否則，需要拆分該節點。選擇好的二值測試，將節點上的patch拆分給子節點。

一個好的二值測試，應該能使得後繼結點的數據儘可能的"純"。也就是說，越往葉子節點，類別和偏移量的不確定性應該越低。分別用類別不確定性和偏移量不確定性來度量節點的不純度，定義爲：

和

二值測試過程爲：給定一些patch，均勻採樣得到一系列測試像素；隨機選擇最下化類別不確定性還是偏移量不確定性；對不確定性求和：。隨機選取可以保證葉子結點的類別不確定性和偏移量不確定性都比較低。

Hough森林做物體檢測。

假設特定物體類別的bounding box大小固定，只要找到bounding box的中心即可。

E(x)代表隨機事件——物體中心位於x。給定一個patch，當patch的中心在bounding box內時,物體中心位於x的概率爲：

其中，上式第一項用核密度估計，給定一棵樹：

給定整個森林，取各個樹的平均。每個位置的得分是來自bounding box內各個patch投票的總和。所以檢測輸出最大得分的位置及其置信度。

注：爲了提高速度，文中提到簡化的策略。

處理不同尺度。將測試圖像按尺度縮放，共S組。各個尺度內進行投票，最後得到得分最高的位置。

實驗：將圖像設置爲相同的高度。訓練時先隨機選取正反例建立5棵樹，再用更難區分的正反例建立5棵樹，直到有15棵樹時停止，Hough森林建立成功。特徵用顏色、梯度、HOG。

對比：ISM和BFM用無監督的方法產生碼本，而Hough森林的方法是有監督的，而且是判別式，所以速度快。

發佈了18 篇原創文章 · 獲贊 3 · 訪問量 8萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】

最新文章

最新評論文章