數字圖像期末複習

目錄

緒論

一幅圖像可定義爲一個二維函數f(x,y),其中x和y是空間平面座標,而在任何一對空間座標(x,y)處的幅值f稱爲圖像在該點的強度灰度。當x和y的灰度值f是有限的離散數值時,我們稱該圖像爲數字圖像
數字圖像是由有限數量的元素組成的,每個元素都有一個特定的位置和幅值。這些元素稱爲圖畫元素、圖像元素或像素。
一類是輸入和輸出都是圖像;另一類是其輸入可能是圖像但是輸出是從這些圖像中提取的屬性。

數字圖像基礎

圖像感知和獲取

簡單的圖像形成模型

用f(x,y)的二維函數來表示圖像,在空間座標(x,y)處,f的值或幅度是一個正的標量,其物理意義由圖像源決定。
函數f(x,y)可由兩個分量來表徵:
入射到被觀察場景的場景照射總量–入射分量 i(x.y)
場景中物體所反射的光照總量–反射分量 r(x,y)

f(x,y) = i(x,y)r(x,y)
0<i(x,y)<∞
0<r(x,y)<1 # 反射分量限制在0(全吸收)和1(全反射)之間
i(x,y) 取決於照射源
r(x,y)的性質則取決於成像物體的特性

圖像的取樣和量化

獲取圖像的目標是從感知的數據中產生數字圖像,但是傳感器的輸出是連續的電壓波形,因此需要把連續的感知數據轉換爲數字形式。這一過程由圖像的取樣與量化來完成。 數字化座標值稱爲取樣數字化幅度值稱爲量化

數字圖像表示

灰度級數典型地取爲2的整數次冪,即 L = 2k
有時,由灰度跨越的值域非正式地成爲動態範圍
我們將圖像系統共的動態範圍定義爲系統中最大可度量的灰度與最小可檢測灰度之比
作爲一條規則, 上限取決於飽和度,下限取決於噪聲
我們定義一幅圖像中最高和最低灰度級間的灰度差爲對比度
存儲數字圖像所需的比特數b爲 b = M X N X k
當一幅圖像有2k個灰度級,實質上稱該圖像爲“K比特圖像”

空間和灰度分辨率

dpi 每英寸點數 Dots Per Inch

  • 空間分辨率
    每單位距離先對數和每單位距離點數(像素數)是最通用的度量
  • 灰度分辨率
    灰度級中可分辨的最小變化

像素間的一些基本關係

相鄰像素

位於座標(x,y)處像素p有4個水平垂直的相鄰像素,其座標由下式給出:
(x+1,y)(x-1,y)(x,y+1)(x,y-1)
這組像素稱爲p的4領域,用 N4(P) 表示,每個像素距(x,y)一個單位距離
同時我們可以得到p的四個對角相鄰像素**ND(P)**的座標:
(x+1,y+1)(x-1,y+1)(x-1,y+1)(x-1,y-1)
N8(P)= N4(P)+ND(P)

鄰接性、連通性、區域和邊界

鄰接性
令V是用於定義鄰接性的灰度值集合,在二值圖像中,如果把具有1值的像素歸諸於鄰接像素,則V={1}。在灰度圖像中給,概念是一樣的,但是集合V一般包含有更多的元素。例如具有可能的灰度值範圍爲0到255的鄰接像素中,集合V可能是這256個值的任何一個子集。

  1. 4領接
    如果q在集合N4(p)中,則具有V中數值的兩個像素p和q是4鄰接的。
    如下圖所示,q和p是4鄰接的:
    在這裏插入圖片描述
  2. 8鄰接
    如果q在集合N8(p)中,則具有V中數值的兩個像素p和q是8鄰接的。
    如下圖所示,q和p是對角鄰接的:
    在這裏插入圖片描述
  3. m鄰接

(i)q在N4( p )中
(ii)在ND( q )中,且集合N4( p )∩N4( q )中沒有來自V中數值的元素

連通性
反映兩個像素的空間關係。

  • 通路
    在這裏插入圖片描述
  • 連通
    連通:通路上的所有像素灰度值滿足相似準則,即(xi,yi)與(xi-1,yi-1)鄰接
    種類:4-連通,8-連通,m-連通
    在這裏插入圖片描述
    如果要從像素s到像素t:
    在4連通的條件下:s不能到t,因爲中心像素和右下角像素不滿足4鄰接關係。
    在8連通的條件下:s可以到t
    在m連通的條件下:s可以到t

區域和邊界
令S是圖像中的一個像素子集。如果S的全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的。對於S中任何元素p,S中連通到該像素集稱爲S的連通分量。如果S僅有一個連通分量,則集合S稱爲連通集。

令R是圖像中的一個像素子集。如果R是連通集,則稱R爲一個區域。在談區域時,必須制定鄰接的類型(4鄰接或8鄰接)。一個R的邊界(也稱爲邊緣或輪廓)是區域中像素的集合。

灰度變換與空間濾波

基礎知識

本節討論的所有圖像處理技術都是在空間域進行的,空間域處理可由下式表達:
g(x,y) = T[f(x,y)]
其中f(x,y)是輸入圖像,g(x,y)是處理後的圖像,T是在點(x,y)的鄰域上定義的關於f的一種算子

一些基本的灰度變換函數

圖像反轉

將灰度範圍爲[0,L-1]的一幅圖像進行反轉,由下式給出:
s = L-1-r
通過這種方法增加強一幅圖像中的暗區域的白色或灰色細節。特別是當黑色面積在尺寸上占主導地位的時候; 作用:增強嵌入於圖像暗區的白色或灰色細節。

對數變換

在這裏插入圖片描述
c爲常數
作用:用來擴展被壓縮的高值圖像中的暗像素。不過在很大程度上壓縮了圖像像素的動態範圍。具體應用是縮小傅氏變換的譜範圍。

冪次變換

在這裏插入圖片描述
c、r爲正常數
有偏移量時:
在這裏插入圖片描述
r大於和小於1有相反的效果。
在這裏插入圖片描述
圖像獲取,打印和顯示的各種裝置存在多種冪次規律響應,用來修正這些冪次的過程叫γ校正

分段線性變換函數

這種方法與前述方法相對,最大的優點是形式可任意組合。缺點是需要更多的用戶輸入。
最簡單的分段線性函數之一是:對比度拉伸,其思想是提高圖像處理時灰度分及動態範圍。
灰度切割:提高特一範圍的灰度值。

直方圖處理

灰度級範圍爲[0,L-1]的數字圖像的直方圖是離散函數h(rk)=nk,其中rk是第k級灰度值,nk是圖像中灰度爲rk的像素個數,歸一化的直方圖又p(rk)=nk/MN給出,且分量之和應等於1.
設S=T® 0<=r<=L-1
應滿足下列條件:
1)在0<=r<=L-1區間內T®爲單值單調增加;
2)對於0<=r<=1,有0<=T®<=L-1。
條件1)使灰度級保持從黑到白的次序;
條件2)保證映射變換後的像素灰度值在允許範圍內

離散直方圖均衡化

設一幅圖象的象素總數爲n,分L個灰度級。
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

局部直方圖處理

在實際中可以僅對圖像的一部分進行增強處理,這時,可以一個像素的鄰域內進行計算。
核心在於計算:圖像的平均值可以表示圖像的平均強度和方差(或標準差)表示平均對比度
在這裏插入圖片描述
在這裏插入圖片描述
基於局部平均值和方差可以得到一些圖像增強技術。

空間濾波

濾波是指接受或拒絕一定的頻率分量。譬如通過低頻的濾波器稱爲低通濾波器

平滑空間濾波器

平滑濾波器用於模糊處理降低噪聲。模糊處理經常用於預處理任務中,例如在(大)目標提取之前去除圖像中的一些瑣碎洗潔,以及橋接直線或曲線的縫隙。

平滑線性濾波器

包含在模板內像素平均值,也叫均值濾波器(低通)
如:9點平滑
在這裏插入圖片描述
還有加權均值濾波器
在這裏插入圖片描述

統計排序濾波器

一種非線性空間濾波器,其響應是基於圖像濾波器所包圍區域中像素(灰度)的排序。
常見的如中值濾波器,該濾波器對脈衝噪聲特有效:它是將像素鄰域內灰度的中值(在中值計算終包括包括原像素值)代替該像素的值。

銳化空間濾波器

銳化的目的是突出圖像中細節或被模糊的細節,銳化可用微分來完成,而微分算術的響應強度與圖像在該點的突變程度有關。
圖像銳化(image sharpening)是補償圖像的輪廓,增強圖像的邊緣及灰度跳變的部分,使圖像變得清晰,分爲空間域處理和頻域處理兩類。圖像銳化是爲了突出圖像上地物的邊緣、輪廓,或某些線性目標要素的特徵。這種濾波方法提高了地物邊緣與周圍像元之間的反差,因此也被稱爲邊緣增強

基礎

對微分的定義可以有各種表述,這裏必須保證如下幾點
(1)在平坦段爲0
(2)在灰度階梯或斜坡的起始點處爲非0
(3)沿着斜坡面微分值非0
二階微分也類似:
(1)平坦區爲0
(2)在灰度階梯或斜坡的起始點及中止點處爲非0
(3)沿常數斜率的斜坡面的微分0
對於一元函數表達一階微分:
在這裏插入圖片描述
二階微分:
在這裏插入圖片描述
結論:
(1)一階微分產生的邊緣寬(如:沿斜坡很長一段非0);
(2)二階微分對細節反應強烈如細線、孤立點(斜坡起止點爲非0);
(3)一階微分對灰度階躍反應強烈;
(4)二階微分對灰度階梯變化產生雙響應,在大多數應用中,對圖像增強來說,二階微分化一階微分好一些。

基於二階微分的圖像增強一拉普拉斯算子

拉普拉斯算子:
在這裏插入圖片描述
在x方向上:
在這裏插入圖片描述
在y方向上:
在這裏插入圖片描述
在這裏插入圖片描述
拉普拉斯算子是強調灰度突變而降低灰度慢變化的區域。
具體辦法是:把原圖像拉普拉斯圖像疊加在一起,這樣既能保護拉氏銳化效果,同時又能復原背景信息。
在這裏插入圖片描述
拉氏模板中心軸爲負
拉氏模板中心軸爲正

基於一階微分的圖像增強一梯度法

在這裏插入圖片描述
實際中往往用梯度模值代替梯度爲減少計算量,用下式算近似:
在這裏插入圖片描述

頻率域濾波

法國數學家傅立葉提出,任何周期函數都可以表示爲不同頻率正弦或餘弦的形式。
→傅氏級數;對於非周期函數,則用正弦和餘弦及加權函數的積分來表示。
→傅氏變換:應用極爲廣泛,尤其是數字計算和快速算法的發明,在信號處理領域產生了具大變革
一般不大可能建立圖像特定分量和其變換之間的直接聯繫,但可以建立傅氏變換的頻率圖像中的強度變化模式之間的聯繫。
例如,低頻對應圖像的慢變化分量(牆,地板),而高頻分量對應着圖像中灰度變化聯繫地方(邊緣,噪聲)

使用頻率域濾波器平滑圖像

低通濾波器:

  1. 理想濾波器
  2. 布特沃斯濾波器
  3. 高斯濾波器
    這三種濾波器涵蓋了從非常尖銳(理想)的濾波器到非常平滑(高斯)的濾波範圍

理想低通濾波器

在這裏插入圖片描述
理想濾波器表明在半徑爲D0的圓內,所有頻率無衰減通過,而在此圓之外的所有頻率則完全被衰減。
在這裏插入圖片描述
但是理想濾波器會導致一個問題:振鈴現象
圖像處理中,對一幅圖像進行濾波處理,若選用的頻域濾波器具有陡峭的變化,則會使濾波圖像產生“振鈴”,所謂“振鈴”,就是指輸出圖像的灰度劇烈變化處產生的震盪,就好像鐘被敲擊後產生的空氣震盪。
振鈴現象產生的本質原因是:

對於辛格函數sinc而言,經過傅里葉變換之後的函數形式爲窗函數(理想低通濾波器)形式,用圖像表示如:
在這裏插入圖片描述
因此凡具有接近窗函數的濾波器,IFT之後,其空域函數形式多少接近sinc函數。sinc是進行圖像濾波的主要因素,兩邊的餘波將對圖像產生振鈴現象。

巴特沃思低通濾波器

在這裏插入圖片描述
截止頻率距原點距離爲D0,截止頻率是當D(u,v)=D0時,H(u,v)從最大值下降到了0.5
在這裏插入圖片描述
一階巴特沃思無“振鈴”,二階微小,高階則很顯著。
二階的BLPF是在有效的低通濾波和可接受的振鈴特性之間的好的折中。

高斯低通濾波器

在這裏插入圖片描述
D0截止頻率,當D(u,v)=D0時,濾波器下降到其最大值的0.607處。
無振鈴現象,曲線見下圖所示:

使用頻率域濾波器銳化圖像

突出邊緣,用高通濾波來處理可從上面討論中直接取反
在這裏插入圖片描述
在這裏插入圖片描述

理想高通濾波器

在這裏插入圖片描述

巴特沃思高通濾波器

n階巴特沃思型高通濾波器:
在這裏插入圖片描述
D0: 截止頻率距原點距離。

高斯型高通濾波器

截止頻率距原點爲的GHPF傳函爲:
在這裏插入圖片描述

圖像復原與重建

圖像復原技術的主要目的是以預先確定的目標來改善圖像,是客觀過程,利用某種光驗知識,重建原圖像而圖像增強是一個主觀過程。

圖像退化/復原過程的模型

退化過程被建模成一個退化函數H和一個加性噪聲項n(x,y),對一幅輸入圖像f(x,y)進行處理,產生一幅退化後的圖像g(x,y)。圖像復原的目的就是獲得原始圖像的一個估計f(x,y)。
在這裏插入圖片描述
加性嗓聲和圖像信號強度是不相關的,這類帶有噪聲的圖像g可看成爲理想無噪聲圖像f與噪聲n之和
乘性嗓聲和圖像信號是相關的,往往隨圖像信號的變化而變化,載送每一個象素信息的載體的變化而產生的噪聲受信息本身調製。在某些情況下,如信號變化很小,噪聲也不大。爲了分析處理方便,常常將乘性噪聲近似認爲是加性噪聲,而且總是假定信號和噪聲是互相統計獨立。

噪聲模型

噪聲主要來源於圖像的獲取和/或傳輸過程。

噪聲的空間和頻率特性

假設:噪聲獨立於空間座標,並與圖像本身無關聯
相關性:噪聲是否與圖像相關
頻率特性:噪聲在傅立葉域的頻率內容
白噪聲:當噪聲的傅立葉譜是常量,稱爲白噪聲

一些重要噪聲的概率密度函數

在這裏插入圖片描述
圖片分別代表高斯,瑞麗,伽馬,指數,均勻,脈衝噪聲。
高斯噪聲(亦正態噪聲)
在這裏插入圖片描述
瑞利噪聲
在這裏插入圖片描述
伽馬噪聲
在這裏插入圖片描述
指數分佈噪聲
在這裏插入圖片描述
均勻噪聲
在這裏插入圖片描述
脈衝噪聲
在這裏插入圖片描述
椒鹽噪聲也稱爲脈衝噪聲,是圖像中經常見到的一種噪聲,它是一種隨機出現的白點或者黑點,可能是亮的區域有黑色像素或是在暗的區域有白色像素(或是兩者皆有)。

在這裏插入圖片描述
在這裏插入圖片描述

週期噪聲

在圖像獲取中來自於電力或機電干擾而產生是空間依賴型噪聲。

噪聲參數的估計

  1. 週期性噪聲:通過譜來估計
  2. 從傳感器的技術說明中可以得到
  3. 成像裝量:對固體的光照均勻的灰度極成像
  4. 當僅有Sensor產生的圖像可以利用時,從恆定灰度值的一小部分估計PDF

僅存在噪聲時的復原–空間濾波

僅存在噪聲時的復原——空間濾波當圖像中的退化僅僅是噪聲(產生)的時候
在這裏插入圖片描述
當僅存在加性噪聲時,可選擇空間濾波的方法。

均值濾波器

1. 算數均值濾波器
在這裏插入圖片描述
雖然模糊了結果,但降了噪聲
2. 幾何均值濾波器
在這裏插入圖片描述
這種處理中丟失的圖像細節更少

3. 諧波均值濾波器
在這裏插入圖片描述
4. 逆諧波均值濾波器
在這裏插入圖片描述

統計排序濾波器

空間濾波器,其響應基於濾波器所包圍的圖像區域中像素點的排序。
1. 中值濾波器
在這裏插入圖片描述
在噪能力好,模糊少,對單極或雙極脈衝噪聲很有效。
2. 最大值和最小值濾波器
在這裏插入圖片描述
發現最亮點時有用,可除“胡椒”
在這裏插入圖片描述
發現最暗點,可消除“鹽”中點濾波器
3. 中點濾波器
在這裏插入圖片描述
對高斯及均勻噪聲效果最好。
4. 修正的阿爾法均值濾波器
修正後的阿爾法均值濾波器 去掉內最高灰度值d/2個,去掉內最低灰度值d/2個,其餘mn-d個的均值,叫修正的阿爾法均值小組波器。
在這裏插入圖片描述
取0~mn-1,d=0 趨近算術均值,d=(mn-1)/2趨近中值

自適應濾波器

到目前爲止,我們所討論的濾波器都是:一但選定了一種濾波器,就不考慮從一點到另一點圖像性能(特徵)的變化。
介紹兩種濾波器,其行爲變化是基於mxn內矩形窗口Sxy內的統計特徵,叫自適應濾波器,其性能優於前邊所有濾波器性能。
自適應局部降低噪聲濾波器
在這裏插入圖片描述
自適應中值濾波器
前述的中值濾波一般可以處理衝激噪聲空間密度不大的情況(Pa,Pb<0.2)而自適應中值濾波則可以處理更大概率的衝激噪聲,且保持圖像細節。
不同之處,Sxy大小可變。
具體如下:
規定符號:
Zmin:Sxy中最小
Zmax:Sxy中最大
Zmed:Sxy中中值
Zxy:Sxy中中心值
Smax:Sxy允許的最大尺寸

頻域濾波削減週期噪聲

陷波濾波器

阻止(或通過)事先定義的中心頻率鄰域內的頻率,圖形見右圖示:
以對稱的形式出現,對象任意,形狀也任意。
在這裏插入圖片描述

逆濾波

當知道退化函數H後,最簡單的復原方法是直接濾波。
在這裏插入圖片描述
原圖像估計譜
在這裏插入圖片描述
得到:
在這裏插入圖片描述
如果退化函數很小或是0,則N(u,v)/H(u,v)之比很容易支配估計值。解決方法是限制濾波的頻率,接近原點

彩色圖像處理

彩色基礎

圖像中應用彩色主要是因爲:(1)簡化區分目標;(2)人眼可以辨別幾千種顏色色調和亮度,而對灰度辨別僅幾十種,進行人工圖像分析,彩色圖像處理可分爲2個主要領域:全綵色、僞彩色。
原則上講,前面各章的灰度處理方法均可直接用於彩色處理。
彩色可見光:400~700nm
我們可以用3個基本量來描述光源的質量:
radiance(輻射度 輻射通量):W總能量
luminace(光通量):可見光
brightness(亮度):主觀描述
人眼的錐狀細胞負責彩色傳感的,人眼的6~7百萬個錐狀細胞分三類:
紅:65%,
綠:33%,
藍:2%。
CIE(國際照明委員會)規定了如下三種波爲主原色:藍:435.8nm,綠:546.1nm,紅:700nm。
紅色,只是一個帶,而不是單一一個波長
綠藍也是一樣。
原色相加→二次色
R+B=深紅=紅+藍
G+B=青色=綠+藍
R+G=黃=紅+綠
R+G+B可得白色,或一個二次色與其,補色→白光
顏料或着色劑中,原色的定義:
白:減去一種原色, 反射或傳輸另兩種原色。故其原色是:深紅、青、黃。而二次色是R、G、B。
通常區分顏色的特徵是亮度,色調和飽和度

  1. 亮度( brightness ):明亮程度
  2. 色調( hue ):光波混合中,與主波長相關的屬性,指觀察的主要顏色。
  3. 飽和度( saturation ):純色+白色多少

色調+飽和度→色度( chroma ),即顏色用色度和亮度來表徵。
形成任何特殊顏色需要R,G,B,叫三色值,分別用X,Y,Z,表示。
一種顏色由三色值係數定義:
在這裏插入圖片描述
顏色的另一種表示方法用CIE色度圖。該圖以紅、綠函數表示顏色組成。
圖中邊界上的顏色爲純色,內部的表示混和色。等能量點→白,等能量點的飽和度爲0。
規律:連接任意兩點的直線所定義的不同顏色,均可由這兩類顏色相加得到同樣,從等能量點到邊界上任一點的連線,可以定義特定譜色的所有色調。還可以擴展到三種顏色,圖中任何三點連成一三角形,內部所有顏色均可用三個頂點色來混合形成。

彩色模型

亦彩色空間或彩色系統。最通用的就是RGB模型(用於如攝像機等)。
CMY(青,深紅,黃)、CMYK(青,深紅,黃,黑)是針對彩色打印機,而HIS(色調,飽和度,亮度)更符合人描述顏色,也適合本書給出的灰度處理技術。

RGB彩色模型

爲方便,假定所有顏色都歸一化。如果每一分量用8比特表示,共有24 稱爲全綵色。
在這裏插入圖片描述
在這裏插入圖片描述

CMY和CMYK模型

等量的青,深紅,黃產生黑色。而實際中,組合產生的黑色不純,爲產生真正的黑色,加入第四種顏色——黑色。即CMYK模型
在這裏插入圖片描述

HIS彩色模型

上述模型中適應人眼。這裏介紹的HIS彩色模型恰好能滿足這個要求。

  • H:色調
    描述一種純色的顏色屬性
  • S:飽和度
    是一種純色被白光稀釋的程度的度量
  • I:亮度
  • H+S表示了彩色信息。
    下面說明HSI可以從RGB信息中得來的。
    在圖中,白(1,1,1),黑(0,0,0),其連線是垂直的。經過一彩色點,作⊥該連線的平面,則該平面與垂直連線的交點位置即是強度值。強度軸上的飽和度是0,其上全部是灰度點
    連接白、青、黑三點組成一平面,則該平面(三角形)點有相的色調,理由是:三角形內任一點的顏色均爲由頂點來得出,而黑白點不改變色調。旋轉這個平面可以得到不同的色調,該平面與立方體的橫截面決定的邊界不是呈三角形就是六邊形。這樣我們可以用六邊形來表示色調和飽和度。具體參見下頁圖所示:
    在這裏插入圖片描述
    用六邊形來表示色調和飽和度。
    在這裏插入圖片描述
    從RGB到HIS的彩色轉換
    在這裏插入圖片描述
    從HIS到RGB的轉換
    在[0,1]內給出HSI→RGB分三個區域(相隔120°)
    在這裏插入圖片描述
    在這裏插入圖片描述
    在這裏插入圖片描述

僞彩色處理

給特定的灰度值賦以彩色。僞彩色的目的是爲了人眼觀察和解釋圖像中的目標。

強度分層

可以簡單地按如下方式來把灰度→彩色
在這裏插入圖片描述

灰度級到彩色轉換

另一種更加通用的灰度級到彩色的轉換是對輸入灰度級進行3個獨立的處理,得到3個結果→紅,綠,藍通道
- [ ] List item

全綵色圖像處理基礎

全綵色圖像處理分爲
(1)處理每一分量,然後合成
(2)直接對彩色處理
全綵色至少有3個分量。
原則上前邊的灰度處理可移植到彩色,而對每一分量進行處理。
令c代表RGB彩色空間中的任意向量:
在這裏插入圖片描述

彩色變換

公式

在這裏插入圖片描述
在這裏插入圖片描述
RGB分量圖及HSI分量圖。
假設要改變圖像亮度,在HSI空間中,
令 S3=kr3
而S1=r1,S2=r2即可
在RGB空間中,
Si=kri
CMY空間中,Si=kri+(1-k)

補色

彩色環上,與一種色調相對立的另一種色調稱爲補色。
在這裏插入圖片描述

彩色分層

可以採用突出特殊區域的顏色來把目標分離出來。可以採用類似於前邊的灰度分層技術,這裏叫彩色分層。 最簡單的情況,假設感興趣的顏色中心在(a1,a2…an),寬度爲W的立方體中,則:
在這裏插入圖片描述
如果用一圈球確定感興趣的顏色
在這裏插入圖片描述

色調和彩色校正

背景:在圖像形成、傳輸、顯示過程中,存在非線性,可能造成顏色的不平衡,如CRT顯示,掃描儀。通過變換(彩色校正)來達到一定的平衡。這裏我們介紹另外一種常用的彩色模型。
在這裏插入圖片描述
其中,Xw,Yw,Zw是參考白色的三刺激值(在D65下,完美漫反射白色)
所謂三刺激值是形成某種顏色所需要的原色的數量。
這種彩色模型特點:比色的(感覺相同,編碼相同),感覺一致的,獨立於設備的。
在圖像操作(色調和對比度編輯)和圖像壓縮方面很有用。
顏色類的變換主要有:
(1)灰度變換
(2)彩色平衡
在這裏插入圖片描述
第一種情況是對比度的拉伸,暗的更暗了,亮得更亮了,增加了對比度,之後類似,上拉都是變亮,下拉都是變暗。
在這裏插入圖片描述

  1. 黑色較重
  2. 黑色較弱
  3. 青色較重
  4. 青色較弱
  5. 深紅色較重
  6. 深紅色較弱
  7. 黃色較重
  8. 黃色較弱

直方圖處理

將前邊灰度直方圖處理方法移植到彩色圖像處理中,如直方圖均衡。

平滑和尖銳化

彩色圖像的平滑

例如,在RGB彩色空間中,令Sxy表示中心在(x,y)的鄰域的座標集,在該鄰域中,RGB分量的平均值:
在這裏插入圖片描述

彩色圖像的尖銳化

本節考慮用拉普拉斯的方法進行尖銳化,在RGB彩色系統中,向量C的拉氐變換:
在這裏插入圖片描述

彩色分割

HSI彩色空間分割

在這裏插入圖片描述

RGB向量空間的分割

假如,某目標在RGB圖像中,“平均”彩色估計用向量a來表示,此時,用歐氏距離來進行判定。令z代表RGB空間的一點歐氏距離
在這裏插入圖片描述
把上式推廣,得到距離測度
在這裏插入圖片描述

彩色邊緣檢測

令r,g,b是RGB彩色空間沿R,G,B軸的單位向量,可定義:
在這裏插入圖片描述
在這裏插入圖片描述

圖像壓縮

圖像壓縮就是解決這樣的問題:減少表示數字圖像時需要的數據量

基礎

數據壓縮:減少表示給定信息量所需的數據。
同一件事情可以有不同的描述版本,至少一個可能包含是不必要的數據。
數據冗餘是圖像壓縮的主要問題,例如:表示一個相同信息的兩個數據集合中,攜載的信息的單元數量分別爲n1、n2
相對數據冗餘RD
在這裏插入圖片描述
三種基本數據冗餘

  • 編碼冗餘
  • 像素間冗餘
  • 心理視覺冗餘

編碼冗餘

利用直方圖的原理,減少數據量。
設直方圖、灰度都歸一化到[0,T]
在這裏插入圖片描述
表示rk的比特數爲l(rk),則每像素所需平均比特爲:
在這裏插入圖片描述
在M X N圖像,編碼所需比特數MN Lavg,用m比特二進制編碼,則表示灰度的可減少到m如8位。
在這裏插入圖片描述
一般用二進制編碼時,冗餘總存在。總之,利用少比待,表示出現概率大的灰度數,實現數據壓縮,亦叫變長編碼。

像素間冗餘

像素間冗餘是一種與像素間相關性有直接聯繫的數據冗餘。
對於一張靜態圖片,存在空間冗餘(幾何冗餘),這是由於在一張圖片中單個像素對圖像的視覺貢獻常常是冗餘的,可藉助其相鄰像素的灰度值進行推斷。
對於連續圖片或視頻,還會存在時間冗餘(幀間冗餘),大部分相鄰圖片間的對應點像素都是緩慢過度的。
在這裏插入圖片描述
說明:像素間存在相關性(尤其是相鄰像素),任何給定像素可據其相鄰像素,適當的預測而得,因此,單個像素所攜載信息相對較少
像素間冗餘:
空間冗餘
幾何冗餘
幀間冗餘

心理視覺冗餘

心理視覺冗餘與實在的視覺信息相關,它是因人而異的,不同的人對於同一張照片產生的心理視覺冗餘是不同的。去除心理視覺冗餘數據必然導致定量信息的損失,並且該視覺信息損失是不可逆轉的操作。就好比一張圖像(無法放大)比較小時,人眼是無法直接判斷出其分辨率,爲了壓縮圖像的數據量,可以去除一些人眼無法直接觀察出的信息,但當其放大時,沒有去除心理視覺冗餘的圖像將和去除心理視覺冗餘的圖像產生明顯差別。
IGS量化方法:爲減少顆粒狀紋路用相鄰像素灰度的低位產生—隨機數,加到當前像素

保真度準則

評估的兩類準則:(1)客觀;(2)主觀
客觀: 表示解壓縮圖像
在這裏插入圖片描述

圖像信息的度量

一個具有概率P(E)的隨機事件E可以被說成是包含
I(E)=-log2P(E)單位的信息,如果P(E)=1,I(E)=0,並且認爲它沒有信息,因爲相關事件沒有不確定性所以在事件發生的通信中不會傳遞任何信息。
對數的底決定了度量信息所用的單位。如果使用以m爲底的對數,則這種度量稱爲m元單位。如果底選擇爲2,則信息的單位是比特。注意如果p(E)=1/2,那麼那麼I(E)爲1比特,也就是說出現兩個概率相等的事件之一發生時,傳達的信息量是1比特。一個簡單的例子就是投擲一枚硬幣及傳遞的結果。
則每個人信源輸出的平均嘻嘻稱爲該信源的熵,即
在這裏插入圖片描述
如果將一幅圖考慮成一個虛構的零記憶“灰度信源”的輸出,我們可以通過觀察直方圖來估計該信源的符號概率。這時,灰度信源的熵變即把P(aj)替換成p(rk)
香農第一定理/無噪聲編碼定理
當信道和通信系統中不存在噪聲時,香農第一定理定義了每個信源符號的最小平均碼錶。
概念:零記憶信源;一個具有有限集合(A,Z)和在統計上獨立的符號源的信息源。

圖像壓縮模型

用一整長爲l(ai)的碼爲ai進行編碼
在這裏插入圖片描述
碼字爲超出 自信息的最小整數。可導出:(平均值)
在這裏插入圖片描述
L’avg表示對應於非擴充信源的n次擴充編碼的平均字長
得到最終的香農第一定理
在這裏插入圖片描述
即有lim[Lavg,n/n] =H 當n趨近正無窮
信源編碼
在這裏插入圖片描述
圖中信源編碼目的是消除輸入冗餘,信道編碼是增強信源編碼器抗噪性。

信道編碼
向信源編碼數據中插入冗餘數據,減少信道噪聲的影響。
最有用的信道編碼技術是,R. W. Hamming
思想:向被編碼數據中加入足夠位數,以確保有效的碼字間變化的位數最少。如:將3位冗餘碼加到4位碼上,使得任意2個有效碼字間距離爲3,則1位錯誤可檢出來

一些基本的壓縮方法

霍夫曼編碼

霍夫曼編碼是一種無損的統計編碼方法,利用信息符號概率分佈特性來改編字長進行編碼。適用於多元獨立信源。霍夫曼編碼對於出現概率大的信息符號用字長小的符號表示,對於出現概率小的信息用字長大的符號代替。如果碼字長嚴格按照所對應符號出現的概率大小逆序排列,則編碼結果的平均字長一定小於其他排列形式。
在這裏插入圖片描述

算術編碼

與變長編碼不同,算術編碼生成的非塊碼。
在信源符號和碼字之間不存在一一對應的關係。它是給整個信源符號序列分配一個單一的算術碼字,該碼字定義了一個介於0~1之間的實數間隔。
在這裏插入圖片描述
在編碼中,只有加法和移位,因而得名。上邊用3位有效數字的十進制數表示了5個符號序列,相當於每個信源符號0.6個十進制數(信源熵0.58十進制位/符號),很接近信源熵,但有兩個因素會影響編碼性能而達不到極限:
①爲了分開各個符號序列,需另加上序列結束標誌
②算術操作精度有限

行程編碼

RLE(Run Length Encoding)行程長度壓縮算法(也稱遊程長度壓縮算法),是最早出現、也是最簡單的無損數據壓縮算法。RLE算法的基本思路是把數據按照線性序列分成兩種情況:一種是連續的重複數據塊,另一種是連續的不重複數據塊。對於第一種情況,對連續的重複數據塊進行壓縮,壓縮方法就是用一個表示塊數的屬性加上一個數據塊代表原來連續的若干塊數據。對於第二種情況,RLE算法有兩種處理方法,一種處理方法是用和第一種情況一樣的方法處理連續的不重複數據塊,僅僅是表示塊數的屬性總是1;另一種處理方法是不對數據進行任何處理,直接將原始數據作爲壓縮後的數據。
令符號aj代表長爲j的一個黑色遊程,可按公式計算黑色遊程源的熵的估計Hb,同理爲→Hw
這樣,圖像的遊程熵近似爲:
在這裏插入圖片描述
Lb、Lw分別代表黑色和白色遊程長度的平均值。
用上式估計每個像來所需的平均化特數。

塊變換編碼

定義:該技術把圖像分成大小相等且不重疊的小塊,並使用二維變換單獨地處理這些塊。在塊變換編碼中,用一種可逆線性變換把每個塊或自圖像映射爲變換系數集合,然後,對於這些變換系數進行量化和編碼。

形態學圖像處理

腐蝕和膨脹

腐蝕

對z中集合A、B,B對A腐蝕
在這裏插入圖片描述
在這裏插入圖片描述
腐蝕縮小了或細化了二值圖像中的物體。事實上,我們可以將腐蝕看作是形態學濾波操作,這種操作將小於結構元的圖像細節從圖像中濾除了

膨脹

A、B是z2中的集合,A被B膨脹定義:
在這裏插入圖片描述

對偶性

變換下式子就行

開操作和閉操作

使用結構元素B對集合A進行開操作:
在這裏插入圖片描述
作用:使用對象輪廓平滑,斷開狹窄的間斷、消除細的凸出物,去除小亮點(相對於結構元素)----“減”

使用結構元素B對集合A進行閉操作:
在這裏插入圖片描述
作用:使輪廓平滑,融聯狹窄間斷和長細的深溝,消除小孔洞,填補輪廓線的斷裂----“加”
總之:
開操作體現“分開
閉操作體現“聯接
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

灰度級形態學

擴展到灰度圖像的基本操作(膨脹、腐蝕,開操作和閉操作→基本形態學算法),這些算法在圖像預處理和後處理中非常有用。以下討論設f(x,y)是圖像,而b(x,y)是結構元素。

膨脹

用b對f進行的灰度膨脹表示爲:
在這裏插入圖片描述
Df爲f定義域 Db爲b的定義域
(s-x)和(t-y)必須在f定義域內,以及x,y∈Db與以前的膨脹定義很相似的。(2個集合交集不爲空) 上式與卷積又很相似。
在這裏插入圖片描述
對灰度圖像進行膨脹,結果是雙重的:
(1)如果所有元素爲正,輸出圖像變亮
(2)暗的細節全部或部分被減少或消除取決於結構元素

腐蝕

在這裏插入圖片描述
同樣與前邊的腐蝕定義相類似,表達式有點類似於相關 一維情況:
在這裏插入圖片描述
s>0,f(s+x)向左移 s<0,f(s+x)向右移
在這裏插入圖片描述
對灰度圖像進行腐蝕也是雙重的:
(1)如果所有結構元素爲正,輸出圖像變暗
(2)在輸入圖像中,亮的細節的面積,比結構元素面積小,則亮的將被消弱。
消弱程度取決於亮細節周圍的灰度值和結構元素本身。

開操作和閉操作

在這裏插入圖片描述
在這裏插入圖片描述

圖像分割

分割是將圖像細分成一個個子區域或對像的過程,比如:電子(路)元件的自動檢測,斷線檢測等等。
精確的分割往往決定着計算分析過程的成敗,系統設計時,如果能對檢測環境加以控制,則應優先採用這種主動控制環境的方法,如果難以控制,則可考慮選擇合適的傳感器類型,如軍事上的紅外傳感器。
圖像分割算法一般基於亮度值的兩個基本特性:
①不連續性:邊緣邊界
②相似性:門限處理,區域生長

點、線和邊緣檢測

一階導數=f(x+1)-f(x)
二階導數=f(x+1)+f(x-1)-2f(x)

  1. 一階導數通常在圖像中產生較粗得邊緣;
  2. 二階導數對精細細節,如細線、孤立點和噪聲有較強的響應;
  3. 二階導數在灰度斜坡和灰度臺階過渡處會產生雙邊緣響應;
  4. 二階導數的符號可以用於確定邊緣的過渡是從亮到暗還是從暗到亮

在這裏插入圖片描述

孤立點的檢測

孤立點的檢測:|R|>=T
和爲0,故常數區域模板響應爲0
在這裏插入圖片描述

線檢測

在這裏插入圖片描述
這四個線檢測模板是有方向的,分別代表水平方向,正45°方向,垂直方向,負45°方向

邊緣模型

在這裏插入圖片描述

一階導數:檢測邊緣點
二階導數:判斷邊緣像素在邊緣亮的一邊,還是暗的一邊
有噪聲的邊緣附近一階和二階導數性質:
在這裏插入圖片描述

閾值處理

基礎知識

灰度閾值處理基礎
在這裏插入圖片描述
第一類稱爲對象點,第二類稱爲背景點,該公式稱爲全局閾值處理。而當T值在一幅圖像上改變時,我們可以使用可變閾值處理技術或者可以乘坐局部閾值處理或區域閾值處理。
光照和反射的作用
在這裏插入圖片描述

基本的全局閾值處理

自動門限的獲得:
①選一個T的初值
②用T分割圖像,分成了兩類像素
在這裏插入圖片描述
③對區域G1, G2計算平均灰度在這裏插入圖片描述
④新門限
在這裏插入圖片描述
⑤重複②—④,直至T值變化小於T。
在這裏插入圖片描述

用Otsu方法的最佳全局閾值處理

OTSU算法也稱最大類間差法,有時也稱之爲大津算法,由大津於1979年提出,被認爲是圖像分割中閾值選取的最佳算法,計算簡單,不受圖像亮度和對比度的影響,因此在數字圖像處理上得到了廣泛的應用。它是按圖像的灰度特性,將圖像分成背景和前景兩部分。因方差是灰度分佈均勻性的一種度量,背景和前景之間的類間方差越大,說明構成圖像的兩部分的差別越大,當部分前景錯分爲背景或部分背景錯分爲前景都會導致兩部分差別變小。因此,使類間方差最大的分割意味着錯分概率最小

該算法主要包括一下幾個步驟:

先計算圖像的直方圖,即將圖像所有的像素點按照0255共256個bin,統計落在每個bin的像素點數量,這個很簡單啦
歸一化直方圖,也即將每個bin中像素點數量除以總的像素點,使其限制在0~1之間
在這裏設置一個分類的閾值ii,也即一個灰度級,開始從0迭代
通過歸一化的直方圖,統計0~i 灰度級的像素(假設像素值在此範圍的像素叫做前景像素) 所佔整幅圖像的比例w0w0,並統計前景像素的平均灰度u0u0;統計i~255灰度級的像素(假設像素值在此範圍的像素叫做背景像素) 所佔整幅圖像的比例w1w1,並統計背景像素的平均灰度u1u1;在這裏,設圖像的總平均灰度爲u2u2,類間方差記爲gg。

其中:
u20∗u01∗u1
g=ω0(u0−μ2)21(u1−u2)2
將u2帶入gg中,可得:

g=ω0ω1(u0−u1)^2
++ii,閾值的灰度值加1,並轉到第4個步驟,直到i爲256時結束迭代

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章