圖像處理算法回顧基本框架

一、引言

接觸圖像處理、計算機視覺這個領域已經有兩年了，感覺有必要對自己所瞭解的知識點進行簡單的總結與概括，其實也就是複習一下，更好的面對找工作時可能問道的問題。

計算機視覺的知識點相對比較龐大，如果沒有在特定的領域有項目或經驗，那一些知識還是比較陌生的，同時沒有去再看了，因此大部分的知識是圖像處理相關的。

二、基本概念概念

1.計算機視覺、計算機圖形學、數字圖像處理的區別：

計算機視覺：往往對一副圖像，通過變換、提取特徵來推斷圖像中的物體的三維信息，簡單的說偏向於從2d圖像推斷三維信息。

計算機圖形學：通過各種手段，構造三維場景並逼真的在二維圖像中顯示，屬於從三維到二維的一個過程。

數字圖像處理：通過一些算法對圖像進行基本的變換，其實屬於二維圖像到二維圖像的過程。這些基本趨勢可以看做是這些知識領域的區分方式吧。有差異，同時也有相似之處。

三、圖像基礎；

1.相機模型；常見的攝像機抽象模型包括針孔模型和薄透鏡模型。針孔模型其成像面和物體在一條水平線上，且成像與實際物體方向相反。透鏡模型其光軸有折射特性，因此物體成像位置的計算相對要複雜些。

2.圖像基本概念：圖像是由coms傳感器接受的數據並以特定矩陣存儲方式得到的數據，從實際物體到圖像，需要經過世界座標系到相機座標系變換，相機座標系再到圖像座標系的變換。圖像像素值的位數決定了圖像的數據質量，位數越高，所包含的圖像信息就越豐富。常見的格式有TIFF GIF PNG JEPG BMP等。

3.直方圖：代表了在某個特定像素值下圖像中這樣像素的個數。一般像素值從0-255，則整個直方圖表示圖像像素值的分佈情況。

曝光：表示較高像素值區域的像素數量在真個圖像中所佔的比例情況。

對比度：表示直方圖中高像素值與低像素值之間的差距範圍。

動態範圍：只圖像中不同像素值所佔的數目。即圖像值在0-255之間的值是否都出現了。

四、圖像處理

1.點算子：

圖像強度修正：包括亮度（像素值均增加某個單位）、對比度調整（像素值均乘以某個值）、閾值化（對象素值進行閾值處理）

2.濾波器；以濾波矩陣對圖像進行卷積操作，濾波矩陣的形式決定了對圖像的濾波操作。濾波器具有可交換性與線性疊加性質。

線性濾波器：平滑濾波、高斯濾波、均值濾波、差分濾波。

非線性濾波器：最大最小值濾波、中值濾波。

3.區域算子：

4.傅里葉變換：

5.金字塔和小波

6.圖像形態學：腐蝕、膨脹、開運算、閉運算；

計算機視覺領域算法

一、特徵檢測與匹配：

1.點特徵：

Harris角點特徵、SIFT特徵（具有尺度不變性）、MSER特徵；

特徵匹配：根據特徵點計算匹配度；通過ROC曲線進行結果分析；

2.邊沿特徵：

sobel算子 Roberts算子 Canny算子等；

3.輪廓：二值圖像的輪廓特徵；包含周長、矩、面積、形心等。

4.線條特徵：

基於霍夫變換的直線檢測、基於RANSAC(隨機樣本一致性)的直線檢測

霍夫變換也可以用於圓檢測、橢圓檢測。

二、圖像分割：

1.活動輪廓、蛇行算法；

2.分水嶺算法；

3.meansift、k-均值和高斯混合方法；

4.graphCut方法、grabCut方法；

三、基於特徵的匹配

1、相機參數標定；通過相機標定板去估計相機的內部參數，包括焦距、鏡頭畸變、像素比例等參數、

2.三角測量法：採用雙目相機，根據兩個相機位置關係確定出兩幅圖像中對應相同像素點的深度值，此點便成爲了3維點。

四、其他領域：

稠密運動估計、圖像拼接、計算攝影學、立體視覺、3D重建、基於圖像的繪製、圖像識別等領域。

五、總結

可以發現計算機視覺領域非常廣泛，引用的場景很多，而每個領域都包含大量的論文與新的算法，因此在未對其中的某個領域進行深入的研究之前，不能對其妄下結論。

然而現在的參考書目，如《計算機視覺一種現代方法》和《計算機視覺算法與應用》這類書包含了計算機視覺的大部分領域內的知識點，但是又沒有對具體的算法細節做過多的解釋，每一個算法不不可能都能說清楚，因此只能去了解這個領域的目標與發展，具體的算法還得去搜算法對應的原始論文。

基本庫：

OPENCV；

除了opencv貌似其他的用的真不多，畢竟OPENCV太強大了。

圖像處理算法回顧基本框架

[轉載] 2019年目標分類、目標檢測、圖像分割、弱監督的綜述文章

軟件技術基礎知識複習

文本分類文章記錄

神經網絡中參數量以及計算量的計算

DTW算法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結