目的
本篇教程中,你將學到:
- 訪問像素值
- 用0初始化矩陣
- saturate_cast 是做什麼用的,以及它爲什麼有用
- 一些有關像素變換的精彩內容
原理
Note:以下解釋節選自Richard Szeliski所著 Computer Vision: Algorithms and Applications
圖像處理
- 一般來說,圖像處理算子是帶有一幅或多幅輸入圖像、產生一幅輸出圖像的函數。
- 圖像變換可分爲以下兩種:
- 點算子(像素變換)
- 鄰域(基於區域的)算子
像素變換
- 在這一類圖像處理變換中,僅僅根據輸入像素值(有時可加上某些全局信息或參數)計算相應的輸出像素值。
- 這類算子包括 亮度和對比度調整 ,以及顏色校正和變換。
亮度和對比度調整
-
兩種常用的點過程(即點算子),是用常數對點進行 乘法 和 加法 運算:
-
兩個參數 和 一般稱作 增益 和 偏置 參數。我們往往用這兩個參數來分別控制 對比度 和 亮度 。
-
你可以把 看成源圖像像素,把 看成輸出圖像像素。這樣一來,上面的式子就能寫得更清楚些:
其中, 和 表示像素位於 第i行 和 第j列 。
代碼
- 下列代碼執行運算 :
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <iostream>
using namespace std;
using namespace cv;
double alpha; /**< 控制對比度 */
int beta; /**< 控制亮度 */
int main( int argc, char** argv )
{
/// 讀入用戶提供的圖像
Mat image = imread( argv[1] );
Mat new_image = Mat::zeros( image.size(), image.type() );
/// 初始化
cout << " Basic Linear Transforms " << endl;
cout << "-------------------------" << endl;
cout << "* Enter the alpha value [1.0-3.0]: ";
cin >> alpha;
cout << "* Enter the beta value [0-100]: ";
cin >> beta;
/// 執行運算 new_image(i,j) = alpha*image(i,j) + beta
for( int y = 0; y < image.rows; y++ )
{
for( int x = 0; x < image.cols; x++ )
{
for( int c = 0; c < 3; c++ )
{
new_image.at<Vec3b>(y,x)[c] = saturate_cast<uchar>( alpha*( image.at<Vec3b>(y,x)[c] ) + beta );
}
}
}
/// 創建窗口
namedWindow("Original Image", 1);
namedWindow("New Image", 1);
/// 顯示圖像
imshow("Original Image", image);
imshow("New Image", new_image);
/// 等待用戶按鍵
waitKey();
return 0;
}
說明
-
一上來,我們要建立兩個變量,以存儲用戶輸入的 和 :
double alpha; int beta;
然後,用 imread 載入圖像,並將其存入一個Mat對象:
-
Mat image = imread( argv[1] );
此時,因爲要對圖像進行一些變換,所以我們需要一個新的Mat對象,以存儲變換後的圖像。我們希望這個Mat對象擁有下面的性質:
-
- 像素值初始化爲0
- 與原圖像有相同的大小和類型
Mat new_image = Mat::zeros( image.size(), image.type() );
注意到, Mat::zeros 採用Matlab風格的初始化方式,用 image.size() 和 image.type() 來對Mat對象進行0初始化。
-
現在,爲了執行運算 ,我們要訪問圖像的每一個像素。因爲是對RGB圖像進行運算,每個像素有三個值(R、G、B),所以我們要分別訪問它們。下面是訪問像素的代碼片段:
for( int y = 0; y < image.rows; y++ ) { for( int x = 0; x < image.cols; x++ ) { for( int c = 0; c < 3; c++ ) { new_image.at<Vec3b>(y,x)[c] = saturate_cast<uchar>( alpha*( image.at<Vec3b>(y,x)[c] ) + beta ); } } }
注意以下兩點:
- 爲了訪問圖像的每一個像素,我們使用這一語法: image.at<Vec3b>(y,x)[c] 其中, y 是像素所在的行, x 是像素所在的列, c 是R、G、B(0、1、2)之一。
- 因爲 的運算結果可能超出像素取值範圍,還可能是非整數(如果 是浮點數的話),所以我們要用 saturate_cast 對結果進行轉換,以確保它爲有效值。
-
最後,用傳統方法創建窗口並顯示圖像。
namedWindow("Original Image", 1); namedWindow("New Image", 1); imshow("Original Image", image); imshow("New Image", new_image); waitKey(0);
Note:我們可以不用 for 循環來訪問每個像素,而是直接採用下面這個命令:
image.convertTo(new_image, -1, alpha, beta);
這裏的 convertTo 將執行我們想做的 new_image = a*image + beta 。然而,我們想展現訪問每一個像素的過程,所以選用了for循環的方式。實際上,這兩種方式都能返回同樣的結果。
結果
-
運行代碼,取參數 和
$ ./BasicLinearTransforms lena.jpg Basic Linear Transforms ------------------------- * Enter the alpha value [1.0-3.0]: 2.2 * Enter the beta value [0-100]: 50
我們將得到下面的結果: