opencv——GMM图像分割

原創

2020-06-04 06:25

GMM即高斯混合模型，GMM加上贝叶斯就能对图像进行分割。

在说高斯混合模型之前，得先认识单高斯模型,即高斯分布（正态分布），由图可知，以某个点为例，它的高斯分布含义：离该点越近其权重越大影响越大，越远其权重越小影响越小，中心点的大小要受到周围点的影响。比如 5 _ 10 _ _ 6，以10为中心点的高斯分布，_代表距离，因为5离10更近，权值更大，设为0.8，则5变成5*0.8=4。因为6离10更远，权值更小，设为0.4，则6变成6*0.4=2.4。

对于GMM高斯混合模型：图中是一个直方图，我用曲线去大概模拟走势，可以看到为凹凸曲线，仔细想想，是不是像一个个单高斯分布组合起来的？GMM高斯混合模型就是一个个单高斯分布组合的。可以用来拟合直方图。

图像处理知识：对于图像明显的类别，在其直方图上可以明显看出，若直方图上存在两个波峰，则图像分为两类。

贝叶斯：贝叶斯就是一个概率估计算法，就是估计一个东西最有可能属于哪类。

图像分割：对于上图，由直方图可以认为图像分为两类，即A和B类。现在要判断每个像素点属于哪一类。以K像素点为例，我们能从经验认为，它有很大概率属于A类。如何对每个像素点都能自动分类呢？用贝叶斯算法，关于贝叶斯算法，可以自查资料，这样就把图像每个像素点都找到属于自己的类别。

以上都是自己对于GMM算法的个人理解。

// GMM——图像分割.cpp: 定义控制台应用程序的入口点。
//

#include<opencv2\opencv.hpp>
using namespace cv;
using namespace ml;

int main(int arc, char** argv) {
	Mat src = imread("C:/Users/zhang/Desktop/1.png");
	imshow("input", src);

	int width = src.cols;
	int height = src.rows;
	int dims = src.channels();
	int pointsCount = width * height;//总共数据点的个数

	Mat points(pointsCount, dims, CV_64FC1);//输入数据，与原图像有着相同通道 
	Mat labels;//输出数据，为各个数据点最终的分类索引
	int k = 3;//分别个数
	Scalar color[] = { //每个分类的颜色
		Scalar(0,0,255), 
		Scalar(0,255,0), 
		Scalar(255,0,0)
	};

	//将图像转换为数据点
	int index = 0;
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			//把RGB图像的三个通道的各个像素点值分别赋给points的三个通道
			index = i * width + j;
			points.at<double>(index, 0) = src.at<Vec3b>(i, j)[0];
			points.at<double>(index, 1) = src.at<Vec3b>(i, j)[1];
			points.at<double>(index, 2) = src.at<Vec3b>(i, j)[2];
		}
	}
	//GMM分割（基于高斯混合模型的期望最大值）
	TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 100, 0.1);
	//10代表最大循环数目，1.0代表阈值
	Ptr<EM> em = EM::create();
	em->setClustersNumber(k);//分类个数
	em->setCovarianceMatrixType(EM::COV_MAT_SPHERICAL);//协方差矩阵类型
	em->setTermCriteria(criteria);//停止条件
	em->trainEM(points, noArray(), labels, noArray());
	//第一个：表示输入的数据集合，可以一维或者多维数据，类型是Mat类型，
	//第二个：可选项，输出一个矩阵，里面包含每个样本的似然对数值，如果不需要则为noArray()
	//第三个：labels表示计算之后各个数据点的最终的分类索引，是一个INT类型的Mat对象，类型和长宽与原图像一致
	//第四个：//可选项，输出一个矩阵，里面包含每个隐性变量的后验概率，如果不需要则为noArray()

	//将数据点转换为图像并显示
	Mat result = Mat::zeros(src.size(), CV_8UC3);
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			index = i * width + j;
			int label = labels.at<int>(index, 0);////每个像素点的标签
			//把每个像素点对应的标签所对应的颜色赋给新图像
			result.at<Vec3b>(i, j)[0] = color[label][0];
			result.at<Vec3b>(i, j)[1] = color[label][1];
			result.at<Vec3b>(i, j)[2] = color[label][2];
		}
	}
	imshow("output", result);
	waitKey(0);
	return 0;
}

结果：分为3类

GMM进阶：如何确定应该分为几类？如何进行好坏评估？可以看看下面资料

https://blog.csdn.net/wangxiaopeng0329/article/details/53542606

https://blog.csdn.net/xiligey1/article/details/82457271

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

opencv——GMM图像分割

opencv視覺跟蹤——CAMshift（meanshift均值漂移）

opencv——基於kmeans的圖像分割

opencv視覺跟蹤——消除背景建模

opencv——GMM圖像分割

opencv——基於SVM的數字識別（1）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結