卷積是一種數學計算核心意義是加權求和其被廣泛的應用於信號處理,聲學,統計學,概論論等衆多領域,在深度學習領域最有名的應用就是卷積神經網絡(CNN),本文中只簡單介紹在卷積神經網絡中應用到的矩陣間卷積運算過程及模式,最終簡單介紹瞭如何通過矩陣間的卷積運算進行邊緣檢測。
矩陣卷積運算
如上所示在兩個矩陣進行卷積運算時,以紅框爲窗口,圖上窗口位置爲運算時窗口的起始位置,每次子運算紅窗口右移一個單位,直到到達右側邊緣後回到最左側然後下移一個單位如此循環直到窗口處於矩陣的右下角,每次取出窗口內的子矩陣與第二個參數矩陣進行對應位相乘然後加和得到的結果依次放入結果矩陣的對應位置。接下來給一個動態的計算過程:
三種計算方式
卷積計算有三種運算形式,接下來以下述代碼中定義的矩陣爲例對三種運算形式進行講解:
a = numpy.array([[1,2,4,5],[2,3,4,5],[3,4,5,6],[4,5,6,7]])
Out[52]:
array([[1, 2, 4, 5],
[2, 3, 4, 5],
[3, 4, 5, 6],
[4, 5, 6, 7]])
b = numpy.array([[1,2,3],[-1,-2,3],[4,-3,-1]])
Out[53]:
array([[ 1, 2, 3],
[-1, -2, 3],
[ 4, -3, -1]])
將要涉及到的數學符號表:
- :第一個參數矩陣的高
- :第一個參數矩陣的寬
- :核矩陣的邊長
- :步長
- :填充
valid:當filter或者說kernel全覆蓋遍歷第一個矩陣參數
-
原理:最基本的計算
圖片來源 -
尺寸變化
其中爲步長。 -
代碼實現
signal.convolve2d(a,b,mode='valid')
Out[56]:
array([[27, 30],
[29, 35]])
- 缺點
- 這種方式處理圖片,圖片的尺寸會變小
- 邊緣像素點只使用了一次而中間的像素點使用了很多次
same:filter或者說kernel的中心元素遍歷第一個矩陣參數的每個元素
-
原理:爲了解決valid方法中圖片尺寸及邊緣像素參與計算次數少的問題,same方法首先對圖片進行像素點填充
圖片來源 -
尺寸變化
爲邊緣像素填充數量且一般爲奇數,爲步長。 -
代碼實現
signal.convolve2d(a,b,mode='same')
Out[55]:
array([[ 3, 11, 15, 24],
[ 8, 27, 30, 10],
[ 9, 29, 35, 16],
[ -6, 1, 1, -19]])
full:filter或者說kernel的右下角遍歷第一個矩陣參數的每個元素
signal.convolve2d(a,b,mode='full')
Out[54]:
array([[ 1, 4, 11, 19, 22, 15],
[ 1, 3, 11, 15, 24, 30],
[ 5, 8, 27, 30, 10, 28],
[ 9, 9, 29, 35, 16, 34],
[ 8, -6, 1, 1, -19, 15],
[ 16, 8, 5, 5, -27, -7]])
各參數關係如下圖所示:
實際應用:邊緣檢測
原理如下圖所示:
上圖來自吳恩達CNN教學
代碼如下:
from PIL import Image
from scipy import signal
import numpy as np
I = Image.open(r"C:\Users\myalie\Downloads\timg.jpg")
L = I.convert("L")
L.show()
kernel1 = [[1,0,-1],[1,0,-1],[1,0,-1]]
kernel2 = [[1,1,1],[0,0,0],[-1,-1,-1]]
m = np.asarray(L)
IM1 = Image.fromarray(signal.convolve2d(m,kernel1,mode='valid'))
IM2 = Image.fromarray(signal.convolve2d(m,kernel2,mode='valid'))
IM1.show()
IM2.show()
實例圖:
縱向邊緣檢測:
橫向邊緣檢測
RGB模式下的邊緣檢測
代碼如下:
from PIL import Image
from scipy import signal
import numpy as np
I = Image.open(r"C:\Users\myalie\Downloads\timg.jpg")
kernel = [[1,0,-1],[1,0,-1],[1,0,-1]]
final = []
for i in range(3):
tmp = np.asarray(I.getchannel(i))
final.append(signal.convolve2d(tmp,kernel,mode='valid'))
Image.merge("RGB",[Image.fromarray(np.array(np.uint8(final[i])))for i in range(3)])
檢測結果如下: