弱分類器和強分類器

原文地址:http://blog.csdn.net/qinzx2004/article/details/2824323


英文原文地址:http://www.ricoh.com/about/company/technology/voice/column/020.html


將英文原文中的圖片搞過來了。


動物,包括人類在內,通常是通過判斷周邊的情況後做出行動,這種反應速度的迅速性和靈活性令人喫驚。大多數生物如一次判斷失誤,下次便會糾正失誤的判斷基準。信息識別技術通過借鑑生物的這種靈活的信息處理特徵,在信息技術處理方面獲得了巨大進步。人類通常以來採取的方法是對需識別的對象做盡可能詳細的調查,然後把調查得來的數據與預先獲得的數據進行統計、分析,然後得出結論。另外,人們也可以根據持有的經驗獲得有效的判斷效果。例如,對於路面上的一隻動物,首先我們根據它的輪廓判斷其大小,根據大小判斷它可能是一隻狗或貓;然後我們接近它,仔細觀察它的形狀和顏色,發現它既非狗也非貓,而是一隻狐狸。這時,我們的經驗庫裏就會增加同樣大小的動物也包括狐狸的可能性。各種生物就是通過不斷重複這種有機有序的判別方法,做出快速,準確,靈活的反應。

舉一個簡單的例子來說明圖像識別。如圖1所示平面上的一個圓形,傳統的方法是儘量採用強分類器來加以識別。假設對象物圓點爲(I,J),半徑爲5,針對標本點(x,y),我們來判斷以下公式(1)能否成立。

(x-I)2+(y-J)2=5(1)

圖 1

以座標點(I,J)爲圓心,半徑爲5的圓形(着色部分圖像)

從圖 1可以看出,圖中着色標本點不能完全滿足公式(1).例如,儘管點(5,0)完全滿足公式1,但是點(4,2)存在誤差-離散空間下誤差在所難免。但是,就整體來看,儘管存在誤差點,仍可把這個圖形識別爲一個“大致”圓形。那麼,如果把圖1進一步變形爲圖2會產生怎樣的效果呢?由公式(1)的評價結果來看,僅5個像素的偏移就增大了誤差,但從外觀上仍可將其識別爲圓形。因此,我們仍將圖2中的圖形視爲圓形,借用公式(1)來加以分析就很容易得出答案。總之,能否將其識別爲圓形,我們需要提出判定基準,根據實際狀況靈活地做出判斷。

圖 2

由圖1中圓形稍微變形後形成的圖形

針對上述單個分類器的性能不高的情況,我們可以考慮重複單純的是或否判定來獲得高精度的識別方法。如圖3所示,把作爲探索針的任意三條直線:γ123, 與上述圓形相交後形成相交區域。如果直線數量少的話,就很難形成圓形。如果有成百上千條直線,就很容易構成圓弧範圍。圖中用綠色線表示識別邊界。

圖 3

任意直線γ123與圖1中圓形相交情況。綠色線部分表示相交區域範圍。直線γ3與圓形部分區域重疊。

把圖2中變形後的圓形與這些直線重疊後形成圖4所示情況。變形部分是直線γ2 橫切圖形點A處。由於未改變圖形其它部分,對圖形的局部條件改變不影響對圖4中變形圓形的識別。由此看來,即便是複雜的圖形,如具備較多數量的直線,通過重複簡單特徵識別(有時被稱爲弱分類器)仍可以達到高度識別的目的。這種識別方法被稱作支持向量機算法(Support Vector Machine)或Booting算法。


圖 4

圖形變形及伴隨變形的交叉位置移動情況

讓我們來試用新近流行的識別方法,即利用數個弱分類器來進行人臉識別。用於人臉識別的有效而“簡單的分類器”究竟是什麼樣的?人們還是期待使用簡便,判定結果純粹的分類器。讓我們參考以下文獻來作進一步探討。

(P. Viola and M. Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features,” in Conf. On Computer Vision and Pattern Recognition, Hwaii, 2001;http://research.microsoft.com/~viola/Pubs/Detect/violaJones_CVPR2001.pdf(PDF: 194KB))。

參考文獻中建議將哈爾變換(Haar transform)作爲核心參數. 哈爾變換用一個包含(1, -1)行列的矩陣表達,如圖5所示 (1),(2), 用一組白色和黑色的篩選器表示。例如,把圖5-(1)的篩選器放到臉部的眼睛和額頭位置,由於額頭位置的亮度較眼睛位置的亮度高,符合(1)的濃淡模式。如果額頭被頭髮蓋住,那麼就不符合(1)的濃淡模式可能性。同樣,把同一篩選器放在嘴部和嘴部上方區域,也會產生同樣效果。儘管這種判定結果比較單純,如果準備數千個考慮尺寸和位置的識別特徵,然後把每次的識別結果加以組合,是可以得出非常精確的識別結果的。


圖 5

簡單識別特徵與可適用的臉部位置。
篩選器(1)適用於2處不同位置。

高速識別測試

但是,以上的測試流程多數是以弱分類器爲測試前提,測試流程難免煩瑣。換言之,分類器的數量越多,所需識別時間越長。因此人們總是配置部分強分類器。如進行人臉識別時可抽取出共通特徵,如不具備共同特徵則可將其忽略不計。在圖6中展示了用於圖5中兩種弱分類器組合後形成強分類器的功能。個體功能較弱的分類器通過三處測試結果的組合,可以識別出人類臉部的特徵。只有三個濃淡模式同時成立時,可以判定其爲人臉特徵。換言之,如無此圖像則無法做出評價。這種人臉判定流程如圖7所示。

如流程圖所示,最初判定時採用強分類器。但是把若干弱分類器組合後就形成功能較強的分類器,並具備相當高的威力。如分類器功能過於強大則使得識別結果時間延長而變得沒有意義。較強分類器在於它可以迅速將不具備人臉特徵的圖像排除。在弱識別特徵很多時,通過配置數個簡單而強大的分類器,可以迅速提高識別速度。


圖 6

特徵組合增強臉部識別


圖 7

根據識別器多段處理進行的人臉識別流程圖。識別成功後移動到下一圖像。


照片 1

被識別的“人臉”,比識別現代人臉要多出20倍時間。

對照片-1中的人臉識別要比現代人臉識別時間多出20倍。這是因爲記憶了現代人特徵的弱分類器對照片中的若干不同特徵的識別分值不夠大,還需要增加超過閾值的弱識別特徵。

我們在很多情況下需要根據弱特徵做出識別,判斷。本次介紹的利用弱分類器進行識別的方法,非常適合模糊判定條件下的應用。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章