數字圖像處理(第三版,Rafeal C. Gonzalez, Richard E. Woods)--基礎

圖像處理 圖像分析 計算機視覺
低級 中級 高級
降噪
對比度增強
銳化
分割,邊緣,標誌等 人工智能
視覺認知
圖像 = f(圖像) 特徵 = f(圖像) 認知 = f(特徵)

在這裏插入圖片描述
人的直覺和分析在選擇技工具術時起到核心作用,這種選擇通常基於主觀的視覺判斷!
在這裏插入圖片描述
在這裏插入圖片描述
亮度適應與辨別
在這裏插入圖片描述
人眼的 ()=log主觀(感知)亮度 = log{入眼光強}
[log0.001,log0.1][3,1]mL[log{0.001},log{0.1}] 即 [-3,-1] mL 爲暗視覺到亮視覺過渡區
視覺系統能夠適應106的光強度級,原因在於動態調整靈敏度,即亮度適應
同時辨別強度範圍只佔適應範圍很小一部分
當前靈敏度級別稱爲亮度適應級別(會隨着“背景”強度變化而變化)

人眼辨別能力的實驗:A區域(相對漫反射區很小)使用增強光閃爍照射,人眼評判能否被識別
在這裏插入圖片描述
韋伯比 = ΔICI=ΔI×%50I\frac{\Delta I_C}{I}=\frac{\Delta I\times \%50}{I} 其中ΔI\Delta I爲測試對象100%能夠區分區域A時的值
在這裏插入圖片描述
眼睛在掃視時背景的平均值在變化,適應級發生變化,人眼能夠辨別更寬的範圍

相關效應 :馬赫帶
在這裏插入圖片描述
相關效應 :同時對比
在這裏插入圖片描述
沒有顏色的光稱爲單色光(monochromatic or achromatic light)
單色光唯一的屬性是他的強度(intensity),使用 灰度級(gray level) 表示,即
取值區間內可取灰度值的個數,出於存儲和量化硬件考慮,灰度級數典型取2k
電磁波並不是成像的唯一方法,聲波、電子束都可以。

單色值f(x,y)=i(x,y)r(x,y)f(x,y)=i(x,y)r(x,y)i(x,y)i(x,y)爲場景入射分量(0,)(0,\infty)r(x,y)r(x,y)爲場景反射分量(0,1)(0,1)
Lmin=iminrminf(x,y)Lmax=imaxrmaxL_{min} = i_{min}r_{min}\leq f(x,y)\leq L_{max}=i_{max}r_{max}
[Lmin,Lmax][L_{min},L_{max}]稱爲 灰度級
通常使用[0,L1][0,L-1]表示[黑色,白色]

圖像取樣和量化
取樣=座標離散
量化=幅值離散
在這裏插入圖片描述
=(maximum  measurable  intensity)(minimum  detectable  intensity)圖像系統動態範圍=\frac{最大可測\red{強度}(maximum\;measurable\;intensity)}{最小可檢\red{強度}(minimum\;detectable\;intensity)}上限取決於飽和度,下限取決於噪聲
在這裏插入圖片描述

空間分辨率:每單位距離線對數(顯示器是黑白線交錯排列)和每單位距離點數(像素數,dpi)
灰度分辨率:灰度級中可分辨的最小變化,使用量化的位數bit描述

內插:使用已知數據估計未知位置的數值(一種重取樣)

方法 原理 特點
最近鄰內插 最近鄰灰度賦予臨近像素 直線邊緣的嚴重失真
雙線性內插 v(x,y)=ax+by+cxy+dv(x,y)=ax+by+cxy+d
相鄰4個點得到4個方程
xy=>本質非線性的
計算量增加 低通濾波
雙三次內插 v(x,y)=0303aijxiyjv(x,y)=\sum_0^3\sum_0^3 a_{ij}x^iy^j
相鄰16個點得到16個方程
將距離帶入sin(x)x\frac{sin(x)}{x}的三次插值函數得到權值
效果更好 計算量更大

在這裏插入圖片描述
矩形上下兩塊三角形面積相等,則有兩個黃色矩形面積相等,y則滿足面積關係
y=(a+b)y1ay1+ay2a+b=by1+ay2a+b y=\frac{(a+b)y_1-ay_1+ay_2}{a+b}=\frac{by_1+ay_2}{a+b}
可以得到
y=x2xx2x1y1+xx1x2x1y2 y=\frac{x_2-x}{x_2-x_1}y_1+\frac{x-x_1}{x_2-x_1}y_2
以上方法對Q11,Q21Q_{11},Q_{21}Q12,Q22Q_{12},Q_{22}分別線性插值得到R1R_1R2R_2
再對R1R_1R2R_2進行線性插值得到f(x,y)f(x,y)

2fxy\frac{\partial ^2f}{\partial x\partial y}的關係 待探討!!!!!!!

像素間的基本關係
與P點上、下、左、右 直接相鄰P的4鄰域 N4(P)N_4(P)對角相鄰ND(P)N_D(P),總稱 P的8鄰域N8(P)=N4(P)+ND(P)N_8(P) =N_4(P)+N_D(P)
V爲定義鄰接性的灰度值集合,可能是任何[0,L1][0,L-1]的子集
(1) qN4(p)f(q)f(p)Vq\in N_4(p),f(q)與f(p)\in V,則pqp與q是4鄰接的
(2) qN8(p)f(q)f(p)Vq\in N_8(p),f(q)與f(p)\in V,則pqp與q是8鄰接的
(3) p與q混合鄰接(m鄰接) 避免多重8鄰接的二義性(如下圖所示)
{qN4(p)qND(p)f(N4(q))f(N4(p))Vf(q)f(p)V\begin{cases} q\in N_4(p) &\\ q\in N_D(p)且f(N_4(q))\cap f(N_4(p))\notin V且f(q)與f(p)\in V & \end{cases}
在這裏插入圖片描述
(x0,y0)(x_0,y_0)(xn,yn)(x_n,y_n)號,前後兩點鄰接成通路,長n
(x0,y0)(x_0,y_0)=(xn,yn)(x_n,y_n)時稱爲閉合通路
圖像子集S{…},任意P S\in S,連通到P的一個像素集稱爲S的一個連通分量
S只有一個連通分量,S稱爲連通集(區域)
圖像前景Ru=RKR_u={\sum R_K},圖像背景=(Ru)c(R_u)^c=前景的補集
PRuP\in R_uN8(P)N_8(P)中至少一個背景點,P稱爲內邊界(內邊緣,內輪廓)
爲保證邊界是閉合通路,通常運用外邊界(背景的內邊界)
圖像的邊界={第0行,第N-1行,第0列,第N-1列}
注意連通的類型(4連通、8連通),區分“邊緣”(導數在閾值之外的點)和“邊界”
(){De=[(P1P2)T(P1P2)]12D4=x1x2+y1y2D8=max(x1x2y1y2) 距離僅與座標有關(\color{red}與連通無關\color{black}) \begin{cases} 歐拉距離D_e=[(\vec P_1 - \vec P_2)^T(\vec P_1 - \vec P_2)]^\frac{1}{2}\\ 城市中心距離D_4=|x_1-x_2|+|y_1-y_2| 棱形& \\ 棋盤距離D_8=max(|x_1-x_2|,|y_1-y_2|) 正方形& \end{cases}
DmD_m距離=點間最短通路長度
數學工具

工具 定義
線性操作H H(af1+bf2)=aH(f1)+bH(f2)=ag1+bg2H(af_1+bf_2)=aH(f_1)+bH(f_2)=ag_1+bg_2
像素操作 類似 ../±.* 或 ./或 \pm{}{}像素間的操作

eg:帶噪相加降噪
污染圖=g(x,y)=f(x,y)+η(x,y)g(x,y)=f(x,y)+\eta(x,y)=原圖+隨機噪聲(待證明)
g(x,y)=k=1Kgk(x,y)K=f(x,y)+k=1Kη(x,y)KE{g(x,y)}=f(x,y)σg(x,y)=1Kση(x,y) \overline g(x,y)=\frac{\sum_{k=1}^{K} g_k(x,y)}{K} =f(x,y)+\frac{\sum_{k=1}^{K} \eta(x,y)}{K}\\ E\{\overline g(x,y)\}=f(x,y)\\ \sigma_{\overline g(x,y)}=\frac{1}{\sqrt K}\sigma_{\eta(x,y)}

eg:相減圖像增強g(x,y)=f(x,y)h(x,y)g(x,y)=f(x,y)-h(x,y)h(x,y)h(x,y)爲對象模板,獲取細節,圖像分割
eg:相乘相除g(x,y)=f(x,y)h(x,y)g(x,y)=f(x,y)h(x,y)
校正陰影,其中h(x,y)h(x,y)可以通過取樣陰影得到近似
模板操作,感興趣區域(ROI), 如“遮蔽”
在這裏插入圖片描述
圖像的歸一化:fs=Kffminmax(ffmin)f_s=K\frac{f-f_{min}}{max(f-f_{min})}
圖像灰度補集:Ac=An={(x,y,2kz)(x,y,z)A}A^c=A_n=\{(x,y,2^k-z)|(x,y,z)\in A\}
圖像灰度並集:AB={maxz(a,b)aAbB}A\cup B=\{\max\limits_{z}(a,b)|a\in A,b\in B\}
幾何空間變換
幾何變換=座標空間變換+灰度內插
常見空間座標變換—仿射變換(affine transformation):尺度(縮放),平移,旋轉,偏移
[x  y  1]=[v  w  1][t11t120t21t220t31t321] [x\;y\;1]=[v\;w\;1] \begin{bmatrix} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 1 \\ \end{bmatrix}
旋轉證明
在這裏插入圖片描述
前向映射:由T(vw)T(v,w)計算f(xy)f(x,y),可能多值合併,可能越界
反向映射:由T1T^{-1}(x,y)計算(v,w),取最近的點作爲輸入,效率更高
eg:圖像配準
對兩幅或多幅相同場景的圖像因時間,視角,距離,方向,分辨率,位移和其他因素產生的幾何畸變進行修正,主要方法有約束(控制)點矯正
根據輸入圖像和參考圖像建立估計變換函數進行建模,之後進行內插
4×{x=c1v+c2w+c3vw+c4y=c5v+c6w+c7vw+c84\times\begin{cases} x=c_1v+c_2w+c_3vw+c_4 &\\ y=c_5v+c_6w+c_7vw+c_8 & \end{cases}
4對約束點座標解得8個係數,效果不理想時可以進行區域劃分,分區域建模,也可用高階模型
圖像變換
工作域{像素空間} ⇒ 變換核 ⇒ 變換域 ⇒ 反變換核 ⇒ 工作域T(u,v)=x=0M1y=0N1f(x,y)r(x,y,u,v)f(x,y)=x=0M1y=0N1T(x,y)s(x,y,u,v) T(u,v)=\sum\limits_{x=0}^{M-1}\sum\limits_{y=0}^{N-1}f(x,y)r(x,y,u,v)\\ f(x,y)=\sum\limits_{x=0}^{M-1}\sum\limits_{y=0}^{N-1}T(x,y)s(x,y,u,v) 如果r(x,y,u,v)=r1(x,u)r2(y,v)r(x,y,u,v)=r_1(x,u)r_2(y,v)稱變換核(兩個維度上)可分(獨立)
如果r1(x,u)=r2(y,v)r_1(x,u)=r_2(y,v)稱變換核(兩個維度上的變化)對稱
傅里葉變換r(x,y,u,v)=ej2π(uxM+vyN)s(x,y,u,v)=1MNej2π(uxM+vyN)r(x,y,u,v)=e^{-j2\pi(\frac{ux}{M}+\frac{vy}{N})}\\ s(x,y,u,v)=\frac{1}{MN}e^{j2\pi(\frac{ux}{M}+\frac{vy}{N})}
可分對稱的傅里葉變換的矩陣形式:T=AFAF=BTB=BATABB=A1T=AFA\\F=BTB=BATAB\\B=A^{-1}
概率論方法
某灰度值的概率 p(zk)=nkMNp(z_k)=\frac{n_k}{MN}
概率滿足 k=0L1p(zk)=1\sum\limits_{k=0}^{L-1}p(z_k)=1
平均灰度 m=k=0L1zkp(zk)m=\sum\limits_{k=0}^{L-1}z_kp(z_k)
灰度方差(平均值展開度量=對比度測度) μ2(z)=k=0L1(zkm)2p(zk)\mu_2(z)=\sum^{L-1}\limits_{k=0}(z_k-m)^2p(z_k)
圖像(序列) = 空間隨機事件( + 時間隨機時間)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章