SIFT特徵詳解

本文爲轉載文章,原文鏈接爲“https://www.cnblogs.com/wangguchangqing/p/4853263.html”

1.SIFT概述

SIFT的全稱是Scale Invariant Feature Transform,尺度不變特徵變換,由加拿大教授David G.Lowe提出的。SIFT特徵對旋轉、尺度縮放、亮度變化等保持不變性,是一種非常穩定的局部特徵。

1.1 SIFT算法具的特點

  1. 圖像的局部特徵,對旋轉、尺度縮放、亮度變化保持不變,對視角變化、仿射變換、噪聲也保持一定程度的穩定性。
  2. 獨特性好,信息量豐富,適用於海量特徵庫進行快速、準確的匹配。
  3. 多量性,即使是很少幾個物體也可以產生大量的SIFT特徵
  4. 高速性,經優化的SIFT匹配算法甚至可以達到實時性
  5. 擴招性,可以很方便的與其他的特徵向量進行聯合。

1.2 SIFT特徵檢測的步驟

有4個主要步驟

  1. 尺度空間的極值檢測 搜索所有尺度空間上的圖像,通過高斯微分函數來識別潛在的對尺度和選擇不變的興趣點。
  2. 特徵點定位 在每個候選的位置上,通過一個擬合精細模型來確定位置尺度,關鍵點的選取依據他們的穩定程度。
  3. 特徵方向賦值 基於圖像局部的梯度方向,分配給每個關鍵點位置一個或多個方向,後續的所有操作都是對於關鍵點的方向、尺度和位置進行變換,從而提供這些特徵的不變性。
  4. 特徵點描述 在每個特徵點周圍的鄰域內,在選定的尺度上測量圖像的局部梯度,這些梯度被變換成一種表示,這種表示允許比較大的局部形狀的變形和光照變換。

2. 尺度空間

在一定的範圍內,無論物體是大還是小,人眼都可以分辨出來。然而計算機要有相同的能力卻不是那麼的容易,在未知的場景中,計算機視覺並不能提供物體的尺度大小,其中的一種方法是把物體不同尺度下的圖像都提供給機器,讓機器能夠對物體在不同的尺度下有一個統一的認知。在建立統一認知的過程中,要考慮的就是在圖像在不同的尺度下都存在的特徵點。

2.1 多分辨率圖像金字塔

在早期圖像的多尺度通常使用圖像金字塔表示形式。圖像金字塔是同一圖像在不同的分辨率下得到的一組結果,其生成過程一般包括兩個步驟:

  1. 對原始圖像進行平滑
  2. 對處理後的圖像進行降採樣(通常是水平、垂直方向的1/2)
    降採樣後得到一系列不斷尺寸縮小的圖像。顯然,一個傳統的金字塔中,每一層的圖像是其上一層圖像長、高的各一半。多分辨率的圖像金字塔雖然生成簡單,但其本質是降採樣,圖像的局部特徵則難以保持,也就是無法保持特徵的尺度不變性。

    2.2 高斯尺度空間

    我們還可以通過圖像的模糊程度來模擬人在距離物體由遠到近時物體在視網膜上成像過程,距離物體越近其尺寸越大圖像也越模糊,這就是高斯尺度空間,使用不同的參數模糊圖像(分辨率不變),是尺度空間的另一種表現形式。
    我們知道圖像和高斯函數進行卷積運算能夠對圖像進行模糊,使用不同的“高斯核”可得到不同模糊程度的圖像。一副圖像其高斯尺度空間可由其和不同的高斯卷積得到:

    L(x,y,σ)=G(x,y,σ)I(x,y)L(x,y,σ)=G(x,y,σ)∗I(x,y)
    特徵值得比例。設α=λmaxα=

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章