什麼是圖像分割?
- 圖像分割(Image Segmentation)是圖像處理最重要的處理手段之一。
- 圖像分割的目標是將圖像中像素根據一定的規則分爲若干(N)個cluster集合,每個集合包含一類像素。
- 根據算法分爲監督學習方法和無監督學習方法,圖像分割的算法多數都是無監督學習方法 - KMeans
距離變換常見算法有兩種:
距離變換的定義 :計算圖像中像素點到最近零像素點的距離,也就是零像素點的最短距離。
距離變換的方法:首先對圖像進行二值化處理,然後給每個像素賦值爲離它最近的背景像素點與其距離(Manhattan距離or歐氏距離),得到distance metric(距離矩陣),那麼離邊界越遠的點越亮。
距離變換常用應用:
- 細化輪廓;
- 尋找質心;
分水嶺變換常見的算法 :
- 基於浸泡理論實現,假設圖像每個位置的像素值爲不同的地貌勢必會形成山峯和山谷,在山底不停加水,直到各大山頭之間形成了明顯的分水線——分水嶺算法的基本思想。
這個鏈接裏面的分水嶺算法的詳細解釋:https://blog.csdn.net/iracer/article/details/49225823
需要的一些OpenCV的API介紹:
C++: void distanceTransform(InputArray src, OutputArray dst, int distanceType, int maskSize,int labelType)
//InputArray src:輸入的圖像,一般爲二值圖像
// OutputArray dst:輸出的圖像
//int distanceType:所用的求解距離的類型、
//It can be CV_DIST_L1, CV_DIST_L2 , or CV_DIST_C
//mask_size 距離變換掩模的大小,可以是 3 或 5. 對 CV_DIST_L1 或 CV_DIST_C 的情況,參數值被強制設定爲 3, 因爲 3×3 mask 給出 5×5 mask 一樣的結果,而且速度還更快。
//int labelType; oepncv2X裏面不需要參數六
參數四距離可選類型:
參數六標籤可選類型:
C++ void watershed(InputArray image, InputOutputArray markers)
//參數一:輸入圖像,需爲8位的三通道彩色圖像;
//參數二:調用函數後的結果放在這裏,輸入\輸出32位單通道圖像的標記結果,即這個參數用於存放函數調用後的輸出結果,需和源圖像有一樣的尺寸
示例程序:
//基於距離變換和分水嶺的圖像分割(image segmentation)
//圖像分割的目標是將圖像中像素根據一定的規則分爲若干(N)個cluster集合,每個集合包含一類像素。
//步驟:1.將白色背景變成黑色-目的是爲後面的變換做準備
//2. 使用filter2D與拉普拉斯算子實現圖像對比度提高,sharp
//3. 轉爲二值圖像通過threshold
//4. 距離變換
//5. 對距離變換結果進行歸一化到[0~1]之間
//6. 使用閾值,再次二值化,得到標記
//7. 腐蝕得到每個Peak - erode
//8.發現輪廓 – findContours
//9. 繪製輪廓 - drawContours
//10.分水嶺變換 watershed
//11. 對每個分割區域着色輸出結果
#include "stdafx.h"
#include<opencv2/opencv.hpp>
#include<iostream>
#include<math.h>
using namespace std;
using namespace cv;
int main(int argc, char*argv)
{
Mat src;
src = imread("C:/Users/59235/Desktop/imag/Pentagram.jpg");
if (!src.data)
{
printf("could not load image...\n");
return -1;
}
namedWindow("input", CV_WINDOW_AUTOSIZE);
imshow("input", src);
//將白色背景變成黑色-目的是爲後面的變換做準備
for (int row = 0; row < src.rows; row++)
{
for (int col = 0; col<src.cols; col++)
{
if (src.at<Vec3b>(row, col)[0]>200 && src.at<Vec3b>(row, col)[1]>200 && src.at<Vec3b>(row, col)[2]>200)
{
src.at<Vec3b>(row, col)[0] = 0;
src.at<Vec3b>(row, col)[1] = 0;
src.at<Vec3b>(row, col)[2] = 0;
}
}
}
const char*input = "change backgroud image";
namedWindow(input, CV_WINDOW_AUTOSIZE);
imshow(input, src);
//使用filter2D與拉普拉斯算子實現圖像對比度提高,sharp
Mat imgLaplance;
Mat sharp = src;
Mat kernel = (Mat_<float>(3, 3) << 1, 1, 1, 1, -8, 1, 1, 1, 1);
filter2D(sharp, imgLaplance, CV_32F, kernel, Point(-1, -1), 0, BORDER_DEFAULT);
src.convertTo(sharp, CV_32F);
Mat imgResult = sharp - imgLaplance;
//顯示
imgResult.convertTo(imgResult, CV_8UC3);
imgLaplance.convertTo(imgLaplance, CV_8UC3);
namedWindow("Sharp image", CV_WINDOW_AUTOSIZE);
imshow("Sharp image", imgResult);
// src = resultImg; // copy back
//binary image轉爲二值圖像通過threshold
Mat binaryImag;
cvtColor(src, binaryImag, CV_BGR2GRAY);
threshold(binaryImag, binaryImag, 40, 255, THRESH_OTSU | THRESH_BINARY);
namedWindow("binary image", CV_WINDOW_AUTOSIZE);
imshow("binary image", binaryImag);
//距離變換(distance transform )
Mat distImg;
distanceTransform(binaryImag, distImg, DIST_L1, 3, 5);
//cv::distanceTransform(InputArray src, OutputArray dst, OutputArray labels, int distanceType, int maskSize, int labelType=DIST_LABEL_CCOMP)
//distanceType = DIST_L1 / DIST_L2,
//maskSize = 3x3, 最新的支持5x5,推薦3x3、
//labels離散維諾圖輸出
//dst輸出8位或者32位的浮點數,單一通道,大小與輸入圖像一致
//對距離變換結果進行歸一化到[0~1]之間
normalize(distImg, distImg, 0, 1, NORM_MINMAX);
imshow("distance image", distImg);
//使用閾值,再次二值化,得到標記(binary again)
threshold(distImg, distImg, .2, 1, THRESH_BINARY);
//腐蝕得到每個Peak - erode
Mat kernel1 = Mat::ones(13, 13, CV_8UC1);
erode(distImg, distImg, kernel1, Point(-1, -1));
imshow("distance binary image", distImg);
// markers (發現輪廓 – findContours)
Mat dist_8u;
distImg.convertTo(dist_8u, CV_8U);
vector<vector<Point>> contours;
findContours(dist_8u, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE, Point(0, 0));
// create makers(繪製輪廓 - drawContours)
Mat markers = Mat::zeros(src.size(), CV_32SC1);
for (size_t i = 0; i < contours.size(); i++) {
drawContours(markers, contours, static_cast<int>(i), Scalar::all(static_cast<int>(i) + 1), -1);
}
circle(markers, Point(5, 5), 3, Scalar(255, 255, 255), -1);
imshow("my markers", markers * 1000);
// perform watershed(基於浸泡理論實現 )
watershed(src, markers);
Mat mark = Mat::zeros(markers.size(), CV_8UC1);
markers.convertTo(mark, CV_8UC1);
//src.convertTo(dst, type, scale, shift)
//dst:目的矩陣;
//type:需要的輸出矩陣類型,或者更明確的,是輸出矩陣的深度,如果是負值(常用 - 1)則輸出矩陣和輸入矩陣類型相同;
//scale : 比例因子;
//shift:將輸入數組元素按比例縮放後添加的值;
bitwise_not(mark, mark, Mat());
imshow("watershed image", mark);
// generate random color
vector<Vec3b> colors;
for (size_t i = 0; i < contours.size(); i++) {
int r = theRNG().uniform(0, 255);
int g = theRNG().uniform(0, 255);
int b = theRNG().uniform(0, 255);
colors.push_back(Vec3b((uchar)b, (uchar)g, (uchar)r));
}
// fill with color and display final result(對每個分割區域着色輸出結果)
Mat dst = Mat::zeros(markers.size(), CV_8UC3);
for (int row = 0; row < markers.rows; row++) {
for (int col = 0; col < markers.cols; col++) {
int index = markers.at<int>(row, col);
if (index > 0 && index <= static_cast<int>(contours.size())) {
dst.at<Vec3b>(row, col) = colors[index - 1];
}
else {
dst.at<Vec3b>(row, col) = Vec3b(0, 0, 0);
}
}
}
imshow("Final Result", dst);
waitKey(0);
return 0;
}
效果圖: