計算機視覺-卷積基本要素及實例

前言

本文將介紹 padding,卷積步長,池化層等概念。

1.基本概念

1.1. padding

        綜合兩個缺點,第一個缺點是每次做卷積操作,你的圖像就會縮小,從 6×6 縮小到 4×4,你可能做了幾次之後,你的圖像就會變得很小了,可能會縮小到只有 1×1 的大小。圖像在每次識別邊緣或其他特徵時都縮小。第二個不利因素是那些在角落或者邊緣區域的像素點在輸出中採用較少,意味着丟掉了圖像邊緣位置的許多信息。所以引入了padding概念,簡單來說就是在矩陣外加邊。

 

爲了解決這些問題,你可以在卷積操作之前填充這幅圖像。在這個案例中,你可以沿着圖像邊緣再填充一層像素。如果你這樣操作了,那麼 6×6 的圖像就被你填充成了一個 8×8 的圖像。如果你用 3×3 的圖像對這個 8×8 的圖像卷積,你得到的輸出就不是 4×4 的,而是 6×6的圖像,你就得到了一個尺寸和原始圖像 6×6 的圖像。習慣上,你可以用 0 去填充,如果𝑞是填充的數量,在這個案例中,𝑞 = 1,因爲我們在周圍都填充了一個像素點,輸出也就變成了(𝑜 + 2𝑞 − 𝑔 + 1) × (𝑜 + 2𝑞 − 𝑔 + 1),所以就變成了(6 + 2 × 1 − 3 + 1) × (6 + 2 × 1 −3 + 1) = 6 × 6,和輸入的圖像一樣大。這個塗綠的像素點(左邊矩陣)影響了輸出中的這些格子(右邊矩陣)。這樣一來,丟失信息或者更準確來說角落或圖像邊緣的信息發揮的作用較小的這一缺點就被削弱了。

        三種填充方式,第一種是 Valid

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章