1.介紹
圖像金字塔是圖像中多尺度的一種表現,主要用於分割,目前最流行的方法:深度學習裏面也有它的身影,比如文本檢測方法“TextBoxes++”就用到它了,爲什麼要用它,效果會好一些呢?因爲一張圖片中,有些字體比較大,有些字體比較小。今天的豬腳是介紹傳統圖像金字塔:高斯金字塔和拉普拉斯金字塔,至於深度學習的,我就不展開講了。
2.高斯金字塔
高斯金字塔的生成,主要用到pyrDown函數,其生成原理:
(1)輸入圖片
(2)對圖像進行高斯內核卷積
(3)將所有偶數行和列去除,得到(1)中圖片的1/4大小
(4)將(3)中得到的圖片重複(2)和(3)步驟,直到得到n級圖像金字塔
注意:在生成圖像金字塔過程中,圖像的信息是在不斷的被丟失
#include <opencv2/opencv.hpp>
#include <opencv2/imgproc/imgproc.hpp>
using namespace cv;
int main()
{
Mat srcImage = imread("kodim23.png");
Mat dstImage1, dstImage2;
pyrDown(srcImage, dstImage1, Size(srcImage.cols / 2, srcImage.rows / 2));
pyrDown(dstImage1, dstImage2, Size(dstImage1.cols / 2, dstImage1.rows / 2));
imshow("srcImage", srcImage);
imshow("dstImage1", dstImage1);
imshow("dstImage2", dstImage2);
waitKey(0);
return 0;
}
效果:
3.拉普拉斯金字塔
拉普拉斯金字塔的生成,主要是基於高斯金字塔以及用到pyrUp函數,其生成原理:
(1)輸入圖片
(2)縮小圖片,對應高斯金字塔步驟中的(2)和(3)
(3)將上一步驟得到的圖像在每個方向擴大爲原來的兩倍,新增的行和列以0填充
(4)進行高斯內核卷積(縮小的時候,用什麼核,這裏就用什麼核)
(5)步驟(1)的圖片 - 步驟(4)所得到的圖片(所得到的圖片具有高頻信息)
(6)重複(2)-(5),直到得到n級圖像金字塔
#include <opencv2/opencv.hpp>
#include <opencv2/imgproc/imgproc.hpp>
using namespace cv;
int main()
{
Mat srcImage = imread("kodim23.png");
Mat downImage1, downImage2;
Mat upImage1, upImage2;
Mat lapImage1, lapImage2;
pyrDown(srcImage, downImage1, Size(srcImage.cols / 2, srcImage.rows / 2));
pyrDown(downImage1, downImage2, Size(downImage1.cols / 2, downImage1.rows / 2));
pyrUp(downImage2, upImage2, Size(downImage2.cols * 2, downImage2.rows * 2));
pyrUp(downImage1, upImage1, Size(downImage1.cols * 2, downImage1.rows * 2));
lapImage1 = srcImage - upImage1;
lapImage2 = downImage1 - upImage2;
imwrite("lapImage1.png", lapImage1);
imwrite("lapImage2.png", lapImage2);
return 0;
}
效果: