閱讀筆記：基於深度學習的圖像預處理技術

原創

2020-06-25 13:10

文章目錄

文獻名：

Fu R , Xu H , Wang Z , et al. Enhanced Intelligent Identification of Concrete Cracks Using Multi-Layered Image Preprocessing-Aided Convolutional Neural Networks[J]. Sensors, 2020, 20(7):2021.

主要創新思想

在不同的智能算法中，卷積神經網絡（CNN）已被證明是一種有前途的工具，能夠通過自適應地從大量混凝土表面圖像中識別裂縫特徵來有效地識別混凝土裂縫的存在和發展。然而，由於混凝土表面圖像的背景中所包含的噪聲的影響，常規CNN在裂紋識別中的準確性以及通用性受到很大限制。噪聲源自高度多樣化的來源，例如光斑，模糊，表面粗糙度/磨損/污點。爲了提高基於CNN的裂紋識別方法的準確性，抗噪性和多功能性，基於常規CNN與多層圖像預處理策略（MLP）的混合利用。
基於CNN的混合利用和多層圖像預處理（MLP）策略（定義爲MLP–CNN框架），從混凝土表面圖像中進行裂縫識別，其主要成分是同態濾波和Otsu閾值化方法。MLP–CNN框架除了可以顯着提高檢測準確性和抗噪性外，還能夠增強裂紋識別的多功能性，這意味着可以使用統一的框架來處理不同類型和水平的背景噪聲。具體而言，基於由許多混凝土裂縫圖像組成的數據集，裂縫位置檢測（CPD）和裂縫類型識別（CTI）網絡均已構建，訓練和測試。通過比較使用和不使用MLP策略的裂縫檢測結果，檢查了開發框架的有效性和效率。研究了不同來源和噪聲影響水平下的裂紋識別精度。

主要原理剖析及說明

第一層是MLP中的關鍵組件之一，是同態濾波，用於處理頻域中的混凝土表面圖像。對於圖像處理，同態濾波能夠抑制低頻分量（例如與照明變化相關的分量），同時突出顯示與局部細節（例如裂紋邊緣）相關的高頻分量。考慮到頻域濾波會導致輸出圖像中的灰度振盪，這被稱爲振鈴效果，同態濾波中濾波器類型的選擇直接影響降噪效果。通常用於同態濾波的三個高通濾波器是高斯濾波器，巴特沃思濾波器和理想的高通濾波器。如可在可見圖中 B，高斯濾波產生最佳去噪效果，通過顯示具有最小振鈴效應的顯著裂紋特徵，裂紋特徵大部分被淹沒在背景中。由巴特沃思濾波器處理過的，被可能與振鈴效應有關的高頻噪聲嚴重污染了；經過理想的高通濾波器處理後，在裂縫和背景的顏色中對比度太弱。這些不令人滿意的結果歸因於濾波器的特性，例如濾波器功能中梯度的急劇變化。因此，採用高斯濾波器進行同態濾波。

該結構主要由三層組成，即輸入層，特徵提取層和最終層，其中可以考慮實際情況重複特徵提取層中的子層（即L2，L3，L4和L5）需要。對於特定的裂縫檢測目標，構建了兩種具有類似結構的網絡類型，分別定義爲裂縫位置檢測（CPD）和裂縫類型識別（CTI）網絡。
特徵提取層由多個卷積層（CONV）和池化層組成。CONV具有卷積內核與輸入圖像的像素矩陣之間的稀疏連接的特性，從而可以利用相對較少的網絡參數來實現有效的網絡訓練。此外，由於CONV的權重共享，可以減少用於計算的內存使用量。L2中卷積核的初始權重和偏差是隨機生成的。激活函數（L3）被用來將非線性特性引入網絡。非線性函數示例如所示。可以看出，在0到1之間的S型函數顯示出小的梯度，這會導致收斂速度慢，並且在CNN訓練過程中梯度消失的問題。介於-1和1之間的雙曲正切（tanh）顯示出比S形曲線更大的梯度，因此更易於優化。簡單的數學形式的整流線性單位（ReLU）具有最大的梯度，可以提高CNN的訓練效率和準確性。因此，在以下研究中，ReLU被選爲激活功能，位於L3所示的CONV之後。

最後一層通常包含多個完全連接的層（FC），激活功能和softmax層。還可以包括脫落層以提高準確性。通過在CNN訓練過程中將完全連接層的權重或輸出部分隨機重置爲零，Dropout減少了節點之間的相互依賴性，從而可以防止過擬合的問題。降層往往在最終的層之間的FC。

主要實驗結果（現有原文章中的）

與原始的CNN網絡（即CPD和CTI）相比，MLP-CNN框架被證明能夠改善裂紋識別。具體而言，在中等噪聲水平下，使用MLP–CNN可以將CPD的準確性提高3.1％。但是，CTI的改善尚不清楚。然後引入了嚴重的噪聲影響，其來源包括光斑，模糊或表面異常。觀察到明顯的裂紋識別增強：（a）受光斑和模糊的噪聲影響，使用原始CPD會大量誤解大部分裂紋信息，而MLP–CNN可以準確地識別裂紋，保留了大多數破解信息。對於CTI，在光斑和模糊的影響下，MLP–CNN分別將識別準確率提高了2.8％和5.4％。（b）受表面異常（特別是表面不平整，裂紋和背景之間的顏色收縮程度低以及污漬）的噪聲影響，原始CPD遇到缺少裂紋信息以及對背景區域發出錯誤警報的問題。通過應用MLP-CNN，可以很好地解決這兩個缺點。對於CTI，MLP–CNN將識別準確率提高了4.7％。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

閱讀筆記：基於深度學習的圖像預處理技術

文章目錄

文獻名：

主要創新思想

主要原理剖析及說明

主要實驗結果（現有原文章中的）

如何在低代碼平臺中引用 JavaScript ？

探究職業發展的關鍵：能力模型解讀

高效率使用windows

如何使用 JavaScript 獲取當前頁面幀率 FPS

工程款拖欠，農民工怎麼了？就得一直忍着委屈求全嗎？

HarmonyOS 實現下拉刷新，上拉加載更多

語音信號處理中的“窗函數”

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

數據庫系列綜述

數據庫SQL（十二）：分佈式鎖服務Chubby

數據庫SQL（十）：水平擴展及數據一致性

數據庫SQL(十一)：Bigtable

數據庫SQL（九）：NoSQL介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結