opencv——GMM图像分割

GMM即高斯混合模型,GMM加上贝叶斯就能对图像进行分割。

在说高斯混合模型之前,得先认识单高斯模型,即高斯分布(正态分布),由图可知,以某个点为例,它的高斯分布含义:离该点越近其权重越大影响越大,越远其权重越小影响越小,中心点的大小要受到周围点的影响。比如  5 _ 10 _ _ 6,以10为中心点的高斯分布,_代表距离,因为5离10更近,权值更大,设为0.8,则5变成5*0.8=4。因为6离10更远,权值更小,设为0.4,则6变成6*0.4=2.4。

高斯分布
高斯分布

对于GMM高斯混合模型:图中是一个直方图,我用曲线去大概模拟走势,可以看到为凹凸曲线,仔细想想,是不是像一个个单高斯分布组合起来的?GMM高斯混合模型就是一个个单高斯分布组合的。可以用来拟合直方图。

直方图

 

混合高斯模型去拟合直方图

 

图像处理知识:对于图像明显的类别,在其直方图上可以明显看出,若直方图上存在两个波峰,则图像分为两类。

贝叶斯:贝叶斯就是一个概率估计算法,就是估计一个东西最有可能属于哪类。

 图像分割:对于上图,由直方图可以认为图像分为两类,即A和B类。现在要判断每个像素点属于哪一类。以K像素点为例,我们能从经验认为,它有很大概率属于A类。 如何对每个像素点都能自动分类呢?用贝叶斯算法,关于贝叶斯算法,可以自查资料,这样就把图像每个像素点都找到属于自己的类别。

以上都是自己对于GMM算法的个人理解。

// GMM——图像分割.cpp: 定义控制台应用程序的入口点。
//

#include<opencv2\opencv.hpp>
using namespace cv;
using namespace ml;

int main(int arc, char** argv) {
	Mat src = imread("C:/Users/zhang/Desktop/1.png");
	imshow("input", src);

	int width = src.cols;
	int height = src.rows;
	int dims = src.channels();
	int pointsCount = width * height;//总共数据点的个数

	Mat points(pointsCount, dims, CV_64FC1);//输入数据,与原图像有着相同通道 
	Mat labels;//输出数据,为各个数据点最终的分类索引
	int k = 3;//分别个数
	Scalar color[] = { //每个分类的颜色
		Scalar(0,0,255), 
		Scalar(0,255,0), 
		Scalar(255,0,0)
	};

	//将图像转换为数据点
	int index = 0;
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			//把RGB图像的三个通道的各个像素点值分别赋给points的三个通道
			index = i * width + j;
			points.at<double>(index, 0) = src.at<Vec3b>(i, j)[0];
			points.at<double>(index, 1) = src.at<Vec3b>(i, j)[1];
			points.at<double>(index, 2) = src.at<Vec3b>(i, j)[2];
		}
	}
	//GMM分割(基于高斯混合模型的期望最大值)
	TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 100, 0.1);
	//10代表最大循环数目,1.0代表阈值
	Ptr<EM> em = EM::create();
	em->setClustersNumber(k);//分类个数
	em->setCovarianceMatrixType(EM::COV_MAT_SPHERICAL);//协方差矩阵类型
	em->setTermCriteria(criteria);//停止条件
	em->trainEM(points, noArray(), labels, noArray());
	//第一个:表示输入的数据集合,可以一维或者多维数据,类型是Mat类型,
	//第二个:可选项,输出一个矩阵,里面包含每个样本的似然对数值,如果不需要则为noArray()
	//第三个:labels表示计算之后各个数据点的最终的分类索引,是一个INT类型的Mat对象,类型和长宽与原图像一致
	//第四个://可选项,输出一个矩阵,里面包含每个隐性变量的后验概率,如果不需要则为noArray()

	//将数据点转换为图像并显示
	Mat result = Mat::zeros(src.size(), CV_8UC3);
	for (int i = 0; i < height; i++) {
		for (int j = 0; j < width; j++) {
			index = i * width + j;
			int label = labels.at<int>(index, 0);////每个像素点的标签
			//把每个像素点对应的标签所对应的颜色赋给新图像
			result.at<Vec3b>(i, j)[0] = color[label][0];
			result.at<Vec3b>(i, j)[1] = color[label][1];
			result.at<Vec3b>(i, j)[2] = color[label][2];
		}
	}
	imshow("output", result);
	waitKey(0);
	return 0;
}

结果:分为3类

 

 

GMM进阶:如何确定应该分为几类?如何进行好坏评估?可以看看下面资料

https://blog.csdn.net/wangxiaopeng0329/article/details/53542606

https://blog.csdn.net/xiligey1/article/details/82457271 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章