圖像處理算法回顧基本框架

一、引言

接觸圖像處理、計算機視覺這個領域已經有兩年了,感覺有必要對自己所瞭解的知識點進行簡單的總結與概括,其實也就是複習一下,更好的面對找工作時可能問道的問題。

計算機視覺的知識點相對比較龐大,如果沒有在特定的領域有項目或經驗,那一些知識還是比較陌生的,同時沒有去再看了,因此大部分的知識是圖像處理相關的。

 二、基本概念概念

1.計算機視覺、計算機圖形學、數字圖像處理的區別:

計算機視覺:往往對一副圖像,通過變換、提取特徵來推斷圖像中的物體的三維信息,簡單的說偏向於從2d圖像推斷三維信息。

計算機圖形學:通過各種手段,構造三維場景並逼真的在二維圖像中顯示,屬於從三維到二維的一個過程。

數字圖像處理:通過一些算法對圖像進行基本的變換,其實屬於二維圖像到二維圖像的過程。這些基本趨勢可以看做是這些知識領域的區分方式吧。有差異,同時也有相似之處。

 

三、圖像基礎;

1.相機模型;常見的攝像機抽象模型包括針孔模型和薄透鏡模型。針孔模型其成像面和物體在一條水平線上,且成像與實際物體方向相反。透鏡模型其光軸有折射特性,因此物體成像位置的計算相對要複雜些。

2.圖像基本概念:圖像是由coms傳感器接受的數據並以特定矩陣存儲方式得到的數據,從實際物體到圖像,需要經過世界座標系到相機座標系變換,相機座標系再到圖像座標系的變換。圖像像素值的位數決定了圖像的數據質量,位數越高,所包含的圖像信息就越豐富。常見的格式有TIFF GIF PNG JEPG BMP等。

3.直方圖:代表了在某個特定像素值下圖像中這樣像素的個數。一般像素值從0-255,則整個直方圖表示圖像像素值的分佈情況。

曝光:表示較高像素值區域的像素數量在真個圖像中所佔的比例情況。

對比度:表示直方圖中高像素值與低像素值之間的差距範圍。

動態範圍:只圖像中不同像素值所佔的數目。即圖像值在0-255之間的值是否都出現了。

四、圖像處理

1.點算子:

圖像強度修正:包括亮度(像素值均增加某個單位)、對比度調整(像素值均乘以某個值)、閾值化(對象素值進行閾值處理)

2.濾波器;以濾波矩陣對圖像進行卷積操作,濾波矩陣的形式決定了對圖像的濾波操作。濾波器具有可交換性與線性疊加性質。

線性濾波器:平滑濾波、高斯濾波、均值濾波、差分濾波。

非線性濾波器:最大最小值濾波、中值濾波。

3.區域算子:

4.傅里葉變換:

5.金字塔和小波

6.圖像形態學:腐蝕、膨脹、開運算、閉運算;



計算機視覺領域算法

一、特徵檢測與匹配:

1.點特徵:

Harris角點特徵、SIFT特徵(具有尺度不變性)、MSER特徵;

特徵匹配:根據特徵點計算匹配度;通過ROC曲線進行結果分析;

2.邊沿特徵:

sobel算子 Roberts算子 Canny算子等;

3.輪廓:二值圖像的輪廓特徵;包含周長、矩、面積、形心等。

4.線條特徵:

基於霍夫變換的直線檢測、基於RANSAC(隨機樣本一致性)的直線檢測

霍夫變換也可以用於圓檢測、橢圓檢測。


二、圖像分割:

1.活動輪廓、蛇行算法;

2.分水嶺算法;

3.meansift、k-均值和高斯混合方法;

4.graphCut方法、grabCut方法;


三、基於特徵的匹配

1、相機參數標定;通過相機標定板去估計相機的內部參數,包括焦距、鏡頭畸變、像素比例等參數、

2.三角測量法:採用雙目相機,根據兩個相機位置關係確定出兩幅圖像中對應相同像素點的深度值,此點便成爲了3維點。


四、其他領域:

稠密運動估計、圖像拼接、計算攝影學、立體視覺、3D重建、基於圖像的繪製、圖像識別等領域。


五、總結

可以發現計算機視覺領域非常廣泛,引用的場景很多,而每個領域都包含大量的論文與新的算法,因此在未對其中的某個領域進行深入的研究之前,不能對其妄下結論。

然而現在的參考書目,如《計算機視覺一種現代方法》和《計算機視覺算法與應用》這類書包含了計算機視覺的大部分領域內的知識點,但是又沒有對具體的算法細節做過多的解釋,每一個算法不不可能都能說清楚,因此只能去了解這個領域的目標與發展,具體的算法還得去搜算法對應的原始論文。


基本庫:

OPENCV;

除了opencv貌似其他的用的真不多,畢竟OPENCV太強大了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章