【OpenCV學習筆記】之基於距離變換與分水嶺圖像分割算法

什麼是圖像分割？

圖像分割(Image Segmentation)是圖像處理最重要的處理手段之一。
圖像分割的目標是將圖像中像素根據一定的規則分爲若干(N)個cluster集合，每個集合包含一類像素。
根據算法分爲監督學習方法和無監督學習方法，圖像分割的算法多數都是無監督學習方法 - KMeans

距離變換常見算法有兩種：

距離變換的定義 ：計算圖像中像素點到最近零像素點的距離，也就是零像素點的最短距離。

距離變換的方法：首先對圖像進行二值化處理，然後給每個像素賦值爲離它最近的背景像素點與其距離（Manhattan距離or歐氏距離），得到distance metric(距離矩陣)，那麼離邊界越遠的點越亮。

距離變換常用應用：

細化輪廓；
尋找質心；

分水嶺變換常見的算法：

- 基於浸泡理論實現，假設圖像每個位置的像素值爲不同的地貌勢必會形成山峯和山谷，在山底不停加水，直到各大山頭之間形成了明顯的分水線——分水嶺算法的基本思想。

這個鏈接裏面的分水嶺算法的詳細解釋：https://blog.csdn.net/iracer/article/details/49225823

需要的一些OpenCV的API介紹：

C++: void distanceTransform(InputArray src, OutputArray dst, int distanceType, int maskSize,int labelType)
//InputArray src：輸入的圖像，一般爲二值圖像

// OutputArray dst：輸出的圖像

//int distanceType：所用的求解距離的類型、

//It can be CV_DIST_L1, CV_DIST_L2 , or CV_DIST_C

//mask_size  距離變換掩模的大小，可以是 3 或 5. 對 CV_DIST_L1 或 CV_DIST_C 的情況，參數值被強制設定爲 3, 因爲 3×3 mask 給出 5×5 mask 一樣的結果，而且速度還更快。
//int labelType; oepncv2X裏面不需要參數六

參數四距離可選類型：

參數六標籤可選類型：

C++ void watershed(InputArray image, InputOutputArray markers)
//參數一：輸入圖像，需爲8位的三通道彩色圖像；
//參數二：調用函數後的結果放在這裏，輸入\輸出32位單通道圖像的標記結果，即這個參數用於存放函數調用後的輸出結果，需和源圖像有一樣的尺寸

示例程序：

//基於距離變換和分水嶺的圖像分割（image segmentation）
//圖像分割的目標是將圖像中像素根據一定的規則分爲若干(N)個cluster集合，每個集合包含一類像素。
//步驟：1.將白色背景變成黑色-目的是爲後面的變換做準備
//2. 使用filter2D與拉普拉斯算子實現圖像對比度提高，sharp
//3. 轉爲二值圖像通過threshold
//4. 距離變換
//5. 對距離變換結果進行歸一化到[0~1]之間
//6. 使用閾值，再次二值化，得到標記
//7. 腐蝕得到每個Peak - erode
//8.發現輪廓 – findContours
//9. 繪製輪廓 - drawContours
//10.分水嶺變換 watershed
//11. 對每個分割區域着色輸出結果

#include "stdafx.h"
#include<opencv2/opencv.hpp>
#include<iostream>
#include<math.h>

using namespace std;
using namespace cv;

int main(int argc, char*argv)
{
	Mat src;
	src = imread("C:/Users/59235/Desktop/imag/Pentagram.jpg");
	if (!src.data)
	{
		printf("could not load image...\n");
		return -1;
	}
	namedWindow("input", CV_WINDOW_AUTOSIZE);
	imshow("input", src);

	//將白色背景變成黑色-目的是爲後面的變換做準備
	for (int row = 0; row < src.rows; row++)
	{
		for (int col = 0; col<src.cols; col++)
		{
			if (src.at<Vec3b>(row, col)[0]>200 && src.at<Vec3b>(row, col)[1]>200 && src.at<Vec3b>(row, col)[2]>200)
			{
				src.at<Vec3b>(row, col)[0] = 0;
				src.at<Vec3b>(row, col)[1] = 0;
				src.at<Vec3b>(row, col)[2] = 0;
			}
		}
	}
	const char*input = "change backgroud image";
	namedWindow(input, CV_WINDOW_AUTOSIZE);
	imshow(input, src);

	//使用filter2D與拉普拉斯算子實現圖像對比度提高，sharp
	Mat imgLaplance;
	Mat sharp = src;
	Mat kernel = (Mat_<float>(3, 3) << 1, 1, 1, 1, -8, 1, 1, 1, 1);
	filter2D(sharp, imgLaplance, CV_32F, kernel, Point(-1, -1), 0, BORDER_DEFAULT);
	src.convertTo(sharp, CV_32F);
	Mat imgResult = sharp - imgLaplance;

	//顯示
	imgResult.convertTo(imgResult, CV_8UC3);
	imgLaplance.convertTo(imgLaplance, CV_8UC3);
	namedWindow("Sharp image", CV_WINDOW_AUTOSIZE);
	imshow("Sharp image", imgResult);
	// src = resultImg; // copy back

	//binary image轉爲二值圖像通過threshold
	Mat binaryImag;
	cvtColor(src, binaryImag, CV_BGR2GRAY);
	threshold(binaryImag, binaryImag, 40, 255, THRESH_OTSU | THRESH_BINARY);
	namedWindow("binary image", CV_WINDOW_AUTOSIZE);
	imshow("binary image", binaryImag);

	//距離變換（distance transform ）
	Mat distImg;
	distanceTransform(binaryImag, distImg, DIST_L1, 3, 5);
	//cv::distanceTransform(InputArray  src, OutputArray dst,  OutputArray  labels,  int  distanceType,  int maskSize,  int labelType=DIST_LABEL_CCOMP)
	//distanceType = DIST_L1 / DIST_L2,
	//maskSize = 3x3, 最新的支持5x5，推薦3x3、
	//labels離散維諾圖輸出
	//dst輸出8位或者32位的浮點數，單一通道，大小與輸入圖像一致

	//對距離變換結果進行歸一化到[0~1]之間
	normalize(distImg, distImg, 0, 1, NORM_MINMAX);
	imshow("distance image", distImg);

	//使用閾值，再次二值化，得到標記(binary again)
	threshold(distImg, distImg, .2, 1, THRESH_BINARY);

	//腐蝕得到每個Peak - erode
	Mat kernel1 = Mat::ones(13, 13, CV_8UC1);
	erode(distImg, distImg, kernel1, Point(-1, -1));
	imshow("distance binary image", distImg);

	// markers (發現輪廓 – findContours)
	Mat dist_8u;
	distImg.convertTo(dist_8u, CV_8U);
	vector<vector<Point>> contours;
	findContours(dist_8u, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE, Point(0, 0));

	// create makers(繪製輪廓 - drawContours)
	Mat markers = Mat::zeros(src.size(), CV_32SC1);
	for (size_t i = 0; i < contours.size(); i++) {
		drawContours(markers, contours, static_cast<int>(i), Scalar::all(static_cast<int>(i) + 1), -1);
	}
	circle(markers, Point(5, 5), 3, Scalar(255, 255, 255), -1);
	imshow("my markers", markers * 1000);

	// perform watershed(基於浸泡理論實現 )
	watershed(src, markers);
	Mat mark = Mat::zeros(markers.size(), CV_8UC1);
	markers.convertTo(mark, CV_8UC1);
	//src.convertTo(dst, type, scale, shift)
	//dst：目的矩陣；
	//type：需要的輸出矩陣類型，或者更明確的，是輸出矩陣的深度，如果是負值（常用 - 1）則輸出矩陣和輸入矩陣類型相同；
	//scale : 比例因子；
	//shift：將輸入數組元素按比例縮放後添加的值；
	bitwise_not(mark, mark, Mat());
	imshow("watershed image", mark);


	// generate random color
	vector<Vec3b> colors;
	for (size_t i = 0; i < contours.size(); i++) {
		int r = theRNG().uniform(0, 255);
		int g = theRNG().uniform(0, 255);
		int b = theRNG().uniform(0, 255);
		colors.push_back(Vec3b((uchar)b, (uchar)g, (uchar)r));
	}

	// fill with color and display final result(對每個分割區域着色輸出結果)
	Mat dst = Mat::zeros(markers.size(), CV_8UC3);
	for (int row = 0; row < markers.rows; row++) {
		for (int col = 0; col < markers.cols; col++) {
			int index = markers.at<int>(row, col);
			if (index > 0 && index <= static_cast<int>(contours.size())) {
				dst.at<Vec3b>(row, col) = colors[index - 1];
			}
			else {
				dst.at<Vec3b>(row, col) = Vec3b(0, 0, 0);
			}
		}
	}
	imshow("Final Result", dst);

	waitKey(0);
	return 0;
}

效果圖：