圖像歸一化

一、簡介

圖像歸一化是計算機視覺、模式識別等領域廣泛使用的一種技術。所謂圖像歸一化, 就是通過一系列變換, 將待處理的原始圖像轉換成相應的唯一標準形式(該標準形式圖像對平移、旋轉、縮放等仿射變換具有不變特性)。 近年來, 基於矩的圖像歸一化技術受到了人們的普遍關注, 其基本工作原理爲: 首先利用圖像中對仿射變換具有不變性的矩來確定變換函數的參數, 然後利用此參數確定的變換函數把原始圖像變換爲一個標準形式的圖像(該圖像與仿射變換無關)。  一般說來, 基於矩的圖像歸一化過程包括 4 個步驟 即座標中心化、x-shearing 歸一化、縮放歸一化和旋轉歸一化。

基本上歸一化思想是利用圖像的不變矩尋找一組參數使其能夠消除其他變換函數對圖像變換的影響。也就是轉換成唯一的標準形式以抵抗仿射變換。圖像歸一化使得圖像可以抵抗幾何變換的攻擊,它能夠找出圖像中的那些不變量,從而得知這些圖像原本就是一樣的或者一個系列的。以下你要知道的: 1.歸一化處理並沒有改變圖像的對比度 2.歸一化處理很簡單,假設原圖像是8位灰度圖像,那麼讀入的像素矩陣最大值爲256,最小值爲1,定義矩陣爲I,J=I/256,就是歸一化的圖像矩陣,就是說歸一化之後所有的像素值都在[0,1]區間內。

二、什麼是歸一化

歸一化就是通過一系列變換(即利用圖像的不變矩尋找一組參數使其能夠消除其他變換函數對圖像變換的影響),將待處理的原始圖像轉換成相應的唯一標準形式(該標準形式圖像對平移、旋轉、縮放等仿射變換具有不變特性)。

基於矩的圖像歸一化技術基本工作原理爲:首先利用圖像中對仿射變換具有不變性的矩來確定變換函數的參數, 然後利用此參數確定的變換函數把原始圖像變換爲一個標準形式的圖像(該圖像與仿射變換無關)。 一般說來,基於矩的圖像歸一化過程包括4個步驟,即座標中心化、x-shearing 歸一化、縮放歸一化和旋轉歸一化。

圖像歸一化使得圖像可以抵抗幾何變換的攻擊,它能夠找出圖像中的那些不變量,從而得知這些圖像原本就是一樣的或者一個系列的。

三、爲什麼歸一化

1.基本上歸一化思想是利用圖像的不變矩尋找一組參數使其能夠消除其他變換函數對圖像變換的影響。也就是轉換成唯一的標準形式以抵抗仿射變換。圖像歸一化使得圖像可以抵抗幾何變換的攻擊,它能夠找出圖像中的那些不變量,從而得知這些圖像原本就是一樣的或者一個系列的。

  1. Matlab中的圖像數據有時候必須是浮點型才能處理,而圖像數據本身是0-255的UNIT型數據所以需要歸一化,轉換到0-1之間。

3.歸一化是一種簡化計算的方式,即將有量綱的表達式,經過變換,化爲無量綱的表達式,成爲純量。目的是爲了:

(1)避免具有不同物理意義和量綱的輸入變量不能平等使用

(2)bp中常採用sigmoid函數作爲轉移函數,歸一化能夠防止淨輸入絕對值過大引起的神經元輸出飽和現象

(3)保證輸出數據中數值小的不被吞食

3.神經網絡中歸一化的原因:

歸一化是爲了加快訓練網絡的收斂性,可以不進行歸一化處理;

歸一化的具體作用是歸納統一樣本的統計分佈性。歸一化在0-1之間是統計的概率分佈,歸一化在-1–+1之間是統計的座標分佈。歸一化有同一、統一和合一的意思。無論是爲了建模還是爲了計算,首先基本度量單位要同一,神經網絡是以樣本在事件中的統計分別機率來進行訓練(概率計算)和預測的,歸一化是同一在0-1之間的統計概率分佈;當所有樣本的輸入信號都爲正值時,與第一隱含層神經元相連的權值只能同時增加或減小,從而導致學習速度很慢。爲了避免出現這種情況,加快網絡學習速度,可以對輸入信號進行歸一化,使得所有樣本的輸入信號其均值接近於0或與其均方差相比很小。

歸一化是因爲sigmoid函數的取值是0到1之間的,網絡最後一個節點的輸出也是如此,所以經常要對樣本的輸出歸一化處理。所以這樣做分類的問題時用[0.9 0.1 0.1]就要比用[1 0 0]要好。

但是歸一化處理並不總是合適的,根據輸出值的分佈情況,標準化等其它統計變換方法有時可能更好。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章