2021 卷積神經網絡—揭開卷積背後的面紗

原創

2021-03-22 18:42

在開始介紹卷積神經網絡之前，覺得有必要先說一說計算機是如何讀解圖像語義的。在計算機中是採用什麼樣數據結構來保存圖像。只有理解這些內容我們還此基礎上開始研究讓給你計算機像人類一樣讀取圖片語義來做一些計算機任務。

我在西瓜視頻發佈相關視頻，賬號 zidea 頭像和簡書一致，希望大家多多關注。

其實用矩陣來保存一張圖像，通過將 3 維矩陣來表示一張圖像，可以理解將圖像切分一個一個小方塊 (pixel) 每個小方塊都有一個位置信息座標，pixel 顏色通過 RBG 來表示，可能還具有透明通道，或者帶有表示深度的通道，就用這些信息來表示一張圖像輸入給計算機。這樣這種表示存儲圖像方式比較低級，會丟失許多語義信息。

我們可以將圖像理解爲一個函數 $f(x,y)$ 其中 $x$ 和 $y$ 表示像素位置，輸出一個像素 RGB 值。

那麼計算機在面對這些只有位置和顏色的信息數據，想要得到更多信息就需要靠自己，因爲信息不足，這樣對於計算機來理解或者讀懂一張圖片的語義無形帶來困難。

以及有關圖像的一些問題，我們需要讀懂一張圖像就像知道圖像變化，計算機通過感知這些變化(邊緣變化)，有了邊緣信息可以將圖像進行分隔具有一定含義區域。

爲了把握圖片 intensity 變化看層空間上變換，空間變化程度可以看成圖片的一些特徵，在邊和角是圖片。

我們可以將圖像處理爲灰度圖，在灰度圖中明暗可以 intensity 來描述圖片。這裏 intensity 可以簡單理解爲我們某一像素(點)對光感知程度。怎麼把這件事說清楚呢。我們看到物體是物體反射的光，發生不同顏色光以及光強度來反映一個物體。在計算機上我們將圖像數字化過程，就是給圖像每一個位置一個像素值，這個值可以分解爲多個通道，值大小表示感光的程度。這就是我們在計算機視覺中要研究的對象。

通過 3D 視圖形象地將我們如何通過灰度圖 intensity 來表示圖。接下來說一說卷積，

卷積

學習卷積神經也有一段時間，雖然已經瞭解到瞭如何將卷積應用到圖像進行運算來得到特徵圖，以及卷積如何應用圖片上進行濾波、降噪、銳化以及邊緣檢測。但是如何要深究卷積，還是有點摸不到頭腦。所以收集一些資料。

我們先把公式拋出來，大家先看一看，覺得有點陌生也不要緊，接下來我們就來詳細解釋這個公式由來以及其應用

$(f * g)(n) = \int_{-\infty}^{+ \infty} f(\tau)g(n - \tau) d \tau$

$(f*g)(n) = \sum_{-\infty}^{ \infty} f(\tau)g(n - \tau) d \tau$

$f(x),g(x)$ 是在 $\mathbb{R}$ 上可以積分的函數
大家可能已經注意到了 $\tau + (n - \tau) = n$
所謂積分就是曲線進行切分很小的間隔然後進行求和，其實所謂的積分就是求和

$P_1(x) = \frac{1}{6}$

$z= (x+y) = 3$

假設兩次抽取撲克牌概率是獨立
$P(z=3) = P_1(1)P_1(2)+ \cdots + P_1(2)P_1(1)$

接下來用圖解方式給大家詳細介紹卷積，以及卷積的過程，假設我們有兩個骰子，每次一起投擲骰子。通過連線來表示兩兩組合。

如果我們找出兩個骰子數加起來爲 6 的組合，通過連線方式表達出來

同上，如果我們想要找出兩個骰子數加起來爲 8 的組合，通過連線方式表達出來。不過這樣連線看起來不是很舒服，所以我們可以通過翻卷得到就得到下面的形式，這就是卷積的由來。

這張圖

我們把一個骰子做行，另一個骰子作爲列組成一個矩陣，如果再次選擇讓兩個骰子數值相加得到某一個數值時，組合情況用顏色表示出來如以下幾張圖，就有點像將一張 paper 從右上角開始捲起。

卷積的特性

濾波Filtering
卷積Convolution
矩陣Matrix
顏色值Color values
卷積核 kernel:

空間頻率

卷積濾波用於修改圖像的空間頻率特性。

卷積的定義

一般卷積可以用於圖片的濾鏡效果，是對圖像
卷積是運算，用整數組成的矩陣掃過圖像
卷積在圖片上作用可以看作，通過將所有相鄰像素的加權值相加來確定中心像素的值
輸出經過過濾的圖像
卷積核就是放置權重的模版

卷積是如何處理圖片

通過將一個像素及其相鄰像素的顏色值乘以一個矩陣，也就是對應位置數值相乘。

<img src="./images/conv_001.png">

$V = \frac{\sum_i^q \left( \sum_j^q f_{ij} d_{ij} \right)}{F}$

$f_{ij}$ 卷積的像素
$d_{ij}$ 像素的值
F 係數
V 表示輸出像素

卷積核進行旋轉 180 度後，再去做卷積操作，如果不進行旋轉卷積核的操作叫做相關，其實通常卷積核都是對稱的。可以將我們神經網絡學習到卷積核

<img src="./images/conv_003.png">

卷積的性質

疊加性: $filter(f_1 + f_2) = filter(f_1) + filter(f_2)$
平移不變性: $filter(shift(f)) = shift(filter(f))$
交換律
結合律
分配律
標量

邊界填充

一般經過卷積操作的圖像會變小，所以爲了保持輸入和輸出圖像一樣大小，需要在做卷積前對邊界進行填充。

拉伸填充
鏡像填充
0 填充

平滑和銳化

<img src="./images/conv_005.png">

紋理特徵(Texture Features)
形態特徵(Morphological Features)

圖像平滑

根據某一個像素其周圍值來重新計算得到改點的新的值從而實現平滑。
$\frac{10 + 5 + 3 + 4 + 5 + 1 + 1+ 1+ 7}{9} = 7$

互相關

$G[i,j] = \sum_{u = -k}^k \sum_{v = -k}^k H[u,v] F[i + u, j+ v]$

卷積

$G[i,j] = \sum_{u = -k}^k \sum_{v = -k}^k H[u,v] F[i - u, j - v]$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

C#開源的兩款功能強大的錄屏神器

ScreenToGif ScreenToGif是一款由C#語言開發且開源的操作簡單、免費的屏幕錄製和GIF動畫製作神器。它可以幫助用戶捕捉計算機屏幕上的實時動畫，並將其保存爲高質量的 GIF 圖像格式。該工具不僅適用於技術支持、軟件演示和教

2024-05-03 14:28:27

前端 Vue yarn.lock文件：詳解和使用指南

yarn.lock文件：詳解和使用指南 https://www.python100.com/html/38KF796X6BHM.html 一、什麼是yarn.lock文件 yarn.lock文件是一個產生於Yarn 0.22及以後版

2024-05-03 14:15:26

前端 Vue webpack配置之 webpack.config.js 文件配置

Webpack 在執行的時候，除了在命令行傳入參數，還可以通過指定的配置文件來執行。默認情況下，會搜索當前目錄的 webpack.config.js 文件，這個文件是一個 node.js 模塊，返回一個 json 格式的配置信息對象，或

2024-05-03 14:15:26

Vue package-lock.json的作用

package-lock.json的作用 "node_modules/@aashutoshrathi/word-wrap": { "version": "1.2.6", "resolved": "h

2024-05-03 14:15:26

前端 Vue-cli中 vue.config.js 的配置詳解

Vue-cli 3 / Vue-cli 4 目錄結構 ├── README.md # 說明 |-- dist # 打包後文件夾 ├── babel.config.js

2024-05-03 14:15:26

druid數據源 xml配置

https://blog.csdn.net/h273979586/article/details/87932220 pom依賴 <dependency> <groupId>com.alibaba</groupId>

2024-05-03 14:14:55

Windows中Redis怎麼設置密碼

Windows中Redis怎麼設置密碼

2024-05-03 14:11:15

JDK8和JDK17共存以及切換的方法

1、先安裝"jdk-8u381-windows-x64.exe"，再安裝"jdk-17_windows-x64_bin.exe" 2、"系統屬性"-"高級"-"環境變量"-"系統變量"-"Path"-"編輯"，刪除以下2條 C:\Progr

2024-05-03 14:11:15

centos7修改redis密碼

檢查Redis配置文件首先，我們需要確保Redis的配置文件中包含了設置密碼的選項。打開Redis的配置文件/etc/redis.conf，查找以下行並確保取消註釋（去掉行首的#）： requirepass your_password 啓

2024-05-03 14:11:15

基於SSM的在線外賣訂餐系統畢業設計論文【範文】

摘要隨着互聯網技術的迅猛發展和人們生活節奏的加快，在線外賣訂餐系統因其便捷性和高效率而受到廣泛歡迎。本文圍繞《基於SSM框架的在線外賣訂餐系統》這一課題展開研究，旨在設計並實現一個功能全面、操作簡便且安全可靠的在線外賣訂餐平臺。首先，文

2024-05-03 14:08:24

基於CodeMirror開發在線編輯器時遇到的問題及解決方案

需求：實現json在線編輯並支持校驗，基於此使用了 CodeMirror在線編輯，jsonlint校驗輸入數據 // package.json: "dependencies": { "codemirror": "^5.53.2"

2024-05-03 14:04:44

《軟件性能測試、分析與調優實踐之路》(第2版) PPT課件流出

掃描圖書前言中的如下圖所示的二維碼，即可進入到下載頁面。如下圖所示即爲課件的下載頁面，免費提供下載

2024-05-03 14:01:24

2024年感想

　　看了一眼之前到博客，最近的一次博客還在一年之前，時間如白駒過隙，飛快流逝。這兩年生活和工作都經歷裏很多，想想是應該在這裏好好梳理總結下。我總是感慨，自己從二十六七歲到現在三十多的年紀，好像經歷別人的半輩子，感悟衆多。　　我以前是個朋友

兜兜有糖的博客

2024-05-03 13:57:53

AWS S3 Lambda Python腳本函數實現圖片自動轉換爲webp並上傳至s3

Amazon S3 自動轉換圖片格式 Amazon S3 存儲桶新增文件自動觸發 AWS Lambda。Lambda 取 S3 文件做轉換並存回去 S3 同一個目錄下，並增加相應的後綴名。並且支持通過API Gateway的方式觸發對

2024-05-03 13:51:42

Eclipse Memory Analyzer (MAT)的安裝後提示JDK版本不對要升級到jdk_17

背景在啓動MAT分析內存時報錯：Version1.8.0 of the jvm is not suitable for this product，Version17 or greater isrequired。問題原因很明顯，我電腦的J

2024-05-03 13:51:42

24小時熱門文章

最新文章

最新評論文章