Opencv——DFT變換(實現兩個Mat的卷積以及顯示Mat的頻域圖像)

DFT原理:(單變量離散傅里葉變換)

數學基礎:
任何一個函數都可以轉換成無數個正弦和餘弦函數的和的形式。
通常觀察傅里葉變換後的頻域函數可以獲得兩個重要的信息:幅頻曲線和相頻曲線。
在數字圖像處理中的作用:
在數字圖像處理中,對一張圖片進行傅里葉變換後我們獲得的是:實數圖像(幅度圖像)+虛數圖像(相位圖像)
傅里葉變換在數字圖像處理中將空間域信息轉爲頻域信息。
如果需要得到圖像中的幾何結構信息,就要用到離散傅里葉變換

在頻域中高頻和低頻意義:

高頻代表了圖像的細節、紋理信息,(噪聲)
低頻代表圖像的輪廓信息。
所以低通濾波器可以得到輪廓。

傅里葉變換可以應用的場景:

圖像的增強與圖像去噪
圖像分割的邊緣檢測
圖像特徵提取
圖像壓縮

Opencv中離散傅里葉變換函數:

dft(input,output,flags,nonzeroRows);
//flags:標識符
//nonzeroRows:默認值爲0,非零時,表示你想處理的那一行C.rows,計算時更加高效

標識符

dft函數應用實例

例1:用dft函數計算兩個二維實矩陣卷積

例子包含的小知識點
1、Size類型

CvSize結構表示矩形尺寸的結構,結構體中分別定義了矩形的寬度和高度,具體定義如下:
typedef struct CvSize {
int width; /* 矩形寬度,單位爲象素 /
int height; /
矩形高度,單位爲象素 */
}CvSize;

2、getOptimalDFTSize()函數

返回DFT最優尺寸大小:getOpimalDFTSize()
函數返回給定向量尺寸的傅里葉最優尺寸大小、
input:向量尺寸,即圖像的rows\cols

3、mulSpectrums()函數

void cvMulSpectrums( const CvArr* src1, const CvArr* src2, CvArr* dst, int flags );
src1
第一輸入數組
src2
第二輸入數組
dst
輸出數組,和輸入數組有相同的類型和大小。
flags
下面列舉的值的組合:
DFT_COMPLEX_OUTPUT- 把數組的每一行視爲一個單獨的頻譜 (參見 cvDFT 的參數討論).
DFT_REAL_OUTPUT - 在做乘法之前取第二個輸入數組的共軛.
函數 cvMulSpectrums 執行兩個 CCS-packed 或者實數或複數傅立葉變換的結果複數矩陣的每個元素的乘法。

4、dft只能處理浮點數,所以需要將輸入圖像轉爲float類型
全部代碼:

void convolveDFT(Mat& A,Mat& B, Mat& C)
{
	//【1】初始化輸出矩陣
	C.create(abs(A.rows - B.rows) + 1, abs(A.cols - B.cols) + 1, A.type());
	Size dftSize;	//???什麼意思
	//【2】計算DFT變換的尺寸
	dftSize.width = getOptimalDFTSize(A.cols + B.cols - 1);
	dftSize.height = getOptimalDFTSize(A.rows + B.rows - 1);
	//【3】分配臨時緩衝區並初始化置零
	Mat tempA(dftSize, A.type(), Scalar::all(0));
	Mat tempB(dftSize, B.type(), Scalar::all(0));
	//【4】分別複製A和B到tempA和tempB的左上角
	Mat roiA(tempA, Rect(0, 0, A.cols, A.rows));
	A.copyTo(roiA);
	Mat roiB(tempB, Rect(0, 0, B.cols, B.rows));
	B.copyTo(roiB);
	//【5】就地操作,進行快速傅里葉變換,並將nonzeroRows參數置爲非零,以進行更加快速的處理???爲什麼
	dft(tempA, tempA, 0, A.rows);
	dft(tempB, tempB, 0, B.rows);
	//【6】將得到的頻譜相乘,結果存放於tempA中
	mulSpectrums(tempA,tempB,tempA, DFT_COMPLEX_OUTPUT);//DFT_REAL_OUTPUT
	//【7】將結果變換爲頻域且儘管行結果都爲非零,我們只需要其中C.rows的第一行,所以採用nonzeroRows==C.rows
	dft(tempA, tempA, DFT_INVERSE + DFT_SCALE, C.rows);
	//【8】將結果複製到C中
	tempA(Rect(0, 0, C.cols, C.rows)).copyTo(C);
	//所有的臨時緩衝區將被自動釋放,所以無須收尾操作
}
int main()
{
	SetConsoleTextAttribute(GetStdHandle(STD_OUTPUT_HANDLE), FOREGROUND_INTENSITY | FOREGROUND_GREEN);		//字體爲綠色
	//載入原圖
	Mat srcImage = imread("D:\\opencv_picture_test\\形態學操作\\coin_inv.png", 0);	//讀取灰度圖
	Mat kernel = (Mat_<float>(3, 3) << 1, 1, 1, 1, 1, 1, 1, 1, 1);
	cout << kernel;
	Mat floatI = Mat_<float>(srcImage);// change image type into float
	Mat filteredI;
	convolveDFT(floatI, kernel, filteredI);
	normalize(filteredI, filteredI, 0, 1,NORM_MINMAX); // Transform the matrix with float values into a
											// viewable image form (float between values 0 and 1).
	//imshow("image", srcImage);
	imshow("filtered", filteredI);		//這裏顯示報錯,但是可以用ImageWatch查看,暫時不知道原因
	waitKey(0);
	return 0;
}

參考鏈接:
https://blog.csdn.net/lichengyu/article/details/18848281

利用傅里葉變換卷積和利用核遊走整個圖像進行卷積運算的區別

一般求法中,利用核遊走整個圖像進行卷積運算,實際上進行的是相關運算,真正意義上的卷積,應該首先把核翻轉180度,再在整個圖像上進行遊走。OpenCV中的filter2D實際上做的也只是相關,而非卷積。

例2:顯示一幅圖像傅里葉變換後的頻域圖像

需要用的函數:
1、擴充圖像邊界:copyMakeBorder()

C++: void copyMakeBorder (InputArray src, OutputArray dst, int top, int bottom, int left, int right,int borderType, const Scalar&
value=Scalar () );
top
bottom
left
right
分別表示在四個方向上擴充多少個像素。
第七個參數:邊界類型,常見取值BORDER_CONSTANT;
第八個參數:默認值爲0,當邊界類型取值爲BORDER_CONSTANT時,這個參數表示邊界值。

2、計算二維矢量的幅值:magnitude()

C++: void magnitude (InputArray X,InputArray Y, OutputArray magnitude)
X:矢量實部
Y:矢量虛部
magnitude:輸出幅值,與x有相同的尺寸和類型
算法原理

3、log()函數

C++: void 1og (InputArray srC, OutputArray dst)
計算每個數組元素絕對值的自然對數。
傅里葉變換的幅值範圍大到不適合在屏幕上顯示。
爲了凸顯出高低變化的連續性,可以用對數尺度來替換線性尺度。

3、矩陣歸一化:normalize()函數

void cv::normalize(InputArry src,InputOutputArray dst,double alpha=1,double beta=0,int norm_type=NORM_L2,int dtype=-1,InputArray mark=noArry())
alpha 用來規範值或者規範範圍,並且是下限;
beta 只用來規範範圍並且是上限,因此只在NORM_MINMAX中起作用;
1.NORM_L1、NORM_INF、NORM_L2模式下歸一化結果與beta無關,只與alpha有關,詳見第4部分的公式說明;
2.NORM_MINMAX中alpha、beta都起作用,同時需要注意的是alpha和beta的取值順序與歸一化結果無關。即alpha=255,beta=0和alpha=0,beta=255最後的歸一化結果是相同的。

歸一化公式:
公式
而其中的dtype爲負數時,輸出數組的type與輸入數組的type相同;
否則,輸出數組與輸入數組只是通道數相同,而tpye=CV_MAT_DEPTH(dtype).

參考鏈接

實現流程:
1、載入原圖
2、將圖像擴大到合適的尺寸(當圖像的尺寸是2.3.5的整數倍時,運行速度最快)
//將輸入圖像延擴到最佳尺寸,邊界用0補充
3、爲傅里葉變換的結果(實部和虛部)分配存儲空間
4、進行離散傅里葉變化
5、將複數轉化爲幅值
6、進行對數尺度縮放(傅里葉變換的幅值範圍大到不適合在屏幕上顯示。爲了凸顯出高低變化的連續性,可以用對數尺度來替換線性尺度。)
公式:M1 = log(1+M);
7、剪切和重分佈幅度圖像限
因爲在第二部中延擴了圖像,現在需要將添加的像素剔除
爲了方便顯示,也可以重新分佈幅度圖像象限位置(將第五步得到的幅度圖從中間劃開得到4張1/4子圖像,將每張子圖都看成幅度圖的一個象限,重新分佈即將4個交點重疊到圖像中心)這樣的話原點(0,0)就爲一道圖像中心了。
//剪切和重分佈幅度圖像限
//如有奇數行或奇數列,進行頻譜裁剪
//重新排列傅里葉圖像中的象限,使得原點位於圖像中心。
//交換象限(左上與右下進行交換)
//交換象限(左下與右上進行交換)
8、歸一化
這一步仍然是爲了顯示。現在有了重分佈後的幅度圖,但是幅度值仍然超過了可顯示範圍【0,1】。這裏使用歸一化函數。
9、顯示效果圖
全部代碼:

#include <opencv2/opencv.hpp>
#include <iostream>
#include "windows.h"
#include <stdio.h>
//#include "My_ImageProssing_base.h"

using namespace cv;
using namespace std;

void convolveDFT(Mat& A,Mat& B, Mat& C)
{
	//【1】初始化輸出矩陣
	C.create(abs(A.rows - B.rows) + 1, abs(A.cols - B.cols) + 1, A.type());
	Size dftSize;	//???什麼意思
	//【2】計算DFT變換的尺寸
	dftSize.width = getOptimalDFTSize(A.cols + B.cols - 1);
	dftSize.height = getOptimalDFTSize(A.rows + B.rows - 1);
	//【3】分配臨時緩衝區並初始化置零
	Mat tempA(dftSize, A.type(), Scalar::all(0));
	Mat tempB(dftSize, B.type(), Scalar::all(0));
	//【4】分別複製A和B到tempA和tempB的左上角
	Mat roiA(tempA, Rect(0, 0, A.cols, A.rows));
	A.copyTo(roiA);
	Mat roiB(tempB, Rect(0, 0, B.cols, B.rows));
	B.copyTo(roiB);
	//【5】就地操作,進行快速傅里葉變換,並將nonzeroRows參數置爲非零,以進行更加快速的處理???爲什麼
	dft(tempA, tempA, 0, A.rows);
	dft(tempB, tempB, 0, B.rows);
	//【6】將得到的頻譜相乘,結果存放於tempA中
	mulSpectrums(tempA,tempB,tempA, DFT_COMPLEX_OUTPUT);//DFT_REAL_OUTPUT
	//【7】將結果變換爲頻域且儘管行結果都爲非零,我們只需要其中C.rows的第一行,所以採用nonzeroRows==C.rows
	dft(tempA, tempA, DFT_INVERSE + DFT_SCALE, C.rows);
	//【8】將結果複製到C中
	tempA(Rect(0, 0, C.cols, C.rows)).copyTo(C);
	//所有的臨時緩衝區將被自動釋放,所以無須收尾操作
}
int main()
{
	SetConsoleTextAttribute(GetStdHandle(STD_OUTPUT_HANDLE), FOREGROUND_INTENSITY | FOREGROUND_GREEN);		//字體爲綠色
	//1、載入原圖
	Mat srcImage = imread("D:\\opencv_picture_test\\形態學操作\\coin_inv.png",0);	//讀取灰度圖
	//2、將圖像擴大到合適的尺寸(當圖像的尺寸是2.3.5的整數倍時,運行速度最快)
	//【2】將輸入圖像延擴到最佳尺寸,邊界用0補充
	int m = getOptimalDFTSize(srcImage.rows);
	int n = getOptimalDFTSize(srcImage.cols);
	//將添加的像素初始化爲0
	Mat padded;
	copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, n - srcImage.cols, BORDER_CONSTANT,0);
	//3、爲傅里葉變換的結果(實部和虛部)分配存儲空間
	Mat planes[] = { Mat_<float>(padded),Mat::zeros(padded.size(),CV_32F) };
	Mat complexI;
	merge(planes, 2, complexI);
	//4、進行離散傅里葉變化
		dft(complexI, complexI);
	//5、將複數轉化爲幅值
		split(complexI, planes);//將多通道數組complexI分離成幾個單通道數
		//planes[0] = Re(DFT(I));
		//planes[1] = Im(DFT(I));
		//計算矢量幅值
	magnitude(planes[0], planes[1], planes[0]);//將幅值存入planes[0] 
	Mat magnitudeImage = planes[0];
	//6、進行對數尺度縮放
	magnitudeImage += Scalar::all(1);
	log(magnitudeImage, magnitudeImage);//就地操作,求自然對數
	//7、剪切和重分佈幅度圖像限
	magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));//這個&-2什麼鬼???
	//重新排列傅里葉圖像中的象限,使得原點位於圖像中心。
	int cx = magnitudeImage.cols / 2;
	int cy = magnitudeImage.rows / 2;
	Mat q0(magnitudeImage, Rect(0, 0, cx, cy));	//ROI區域左上
	Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));//ROI區域右上
	Mat q2(magnitudeImage, Rect(0, cy, cx, cy));//ROI區域左下
	Mat q3(magnitudeImage, Rect(cx, cy, cx, cy));//ROI區域右下
	//交換象限(左上與右下進行交換)
	Mat tmp;
	q0.copyTo(tmp);		//將q0與q3互換
	q3.copyTo(q0);
	tmp.copyTo(q3);
	//交換象限(左下與右上進行交換)
	q1.copyTo(tmp);		//將q1與q2互換
	q2.copyTo(q1);
	tmp.copyTo(q2);
	//8、歸一化
	//這一步仍然是爲了顯示。現在有了重分佈後的幅度圖,但是幅度值仍然超過了可顯示範圍【0, 1】。這裏使用歸一化函數。
	normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);
	//9、顯示效果圖
	imshow("原圖", srcImage);
	imshow("頻譜幅值", magnitudeImage);
	waitKey(0);
	return 0;
}

srcImage:
原圖
padded:
padded
magnitudeImage:
magnitudeImage
每個圖像的具體性質:
每個圖像的具體性質

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章