基于 Laplacian 实现简单的图像模糊检测 业务背景 Laplacian 算子 图像模糊检测算法 总结

业务背景

从去年年底开始,我们团队一直在做一款能够给电商商品自动拍照的智能硬件。拍完照后,会将商品的套图在电商平台上进行展示。

对于要展示的商品图片而言,我们对图片本身的质量要求会比较高,例如不能将模糊不清的图片进行展示。因此,需要一种图像模糊检测的方法,便于我们筛选出可用的图片。

我们使用基于 Laplacian 的算法来检测图片是否模糊。调用它比较简单,因为 OpenCV 内置了 Laplacian 函数。

Laplacian 算子

求多元函数的二阶导数的映射被称为 Laplacian 算子,它相当于二阶 Sobel 算子的导数。

Laplacian 算子的定义:

我们分别对 Laplace 算子 x,y 两个方向的二阶导数进行差分就得到了离散函数的 Laplace 算子。

以 x 方向为例:
一阶差分:f'(x) = f(x) - f(x - 1)
二阶差分:f''(x) = f'(x+1) - f'(x) = (f(x + 1) - f(x)) - (f(x) - f(x - 1))
化简后:f''(x) = f(x - 1) - 2 f(x)) + f(x + 1)

提取前面的系数:[1, -2, 1]

同理,可得 y 方向的系数[1,-2,1]

叠加起来就得到了拉普拉斯矩阵


也就是拉普拉斯 3x3 卷积核。

图像模糊检测算法

算法的主要思想:先将图像转换成灰度图像,然后单一通道的灰度图像经过刚才计算出来的拉普拉斯 3x3 卷积核计算后会得到一个响应图,最后再计算这个响应图的方差。

基于该方差和按照经验设定的阈值进行比较,就可以判断图像是否模糊。对于同一种类型的商品图片,可以采用同一个阈值。不同的商品、不同环境拍摄的图片可能需要调整阈值。

bool isImageBlurry(cv::Mat& img, double threshold)
{
    cv::Mat matImageGray;
    cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY);
    cv::Mat dst, abs_dst;
    cv::Laplacian(matImageGray, dst, CV_16S, 3);
    cv::convertScaleAbs( dst, abs_dst );
    cv::Mat tmp_m, tmp_sd;
    double sd = 0;
    cv::meanStdDev(dst, tmp_m, tmp_sd);
    sd = tmp_sd.at<double>(0,0); // 方差
    return ((sd * sd) <= threshold);
}

找一张模糊的图片,写一个简单的例子进行测试

using namespace std;
using namespace cv;

bool isImageBlurry(cv::Mat& img, double threshold=49.0);

int main(int argc,char *argv[])
{
    String imageName;
    cout << "Enter the image file name: " << endl;
    cin >> imageName;
    // read the image
    Mat image = imread(imageName);

    double time = (double)getTickCount();

    bool result = isImageBlurry(image);
    time = ((double)getTickCount() - time) / getTickFrequency();
    cout << "所用时间为:" << time << "s" << endl;
    cout << "result:" << result << endl;
    return 0;
}

bool isImageBlurry(cv::Mat& img, double threshold)
{
    cv::Mat matImageGray;
    cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY);
    cv::Mat dst, abs_dst;
    cv::Laplacian(matImageGray, dst, CV_16S, 3);
    cv::convertScaleAbs( dst, abs_dst );
    cv::Mat tmp_m, tmp_sd;
    double m = 0, sd = 0;
    cv::meanStdDev(dst, tmp_m, tmp_sd);
    m = tmp_m.at<double>(0,0); 
    sd = tmp_sd.at<double>(0,0);
    std::cout << "sd * sd: " << sd * sd << std::endl;
    return ((sd * sd) <= threshold);
}

执行结果:

Enter the image file name: 
test.jpeg
sd * sd: 31.0646
所用时间为:0.0219034s
result:1

可以通过上述程序判断出该图片是模糊的。

最后,我们团队主要使用的语言是 Java/Kotlin,还需要编写一个 jni 来调用该函数。

总结

在无参考图像的情况下,Laplacian 是一种常见的图像模糊检测的方式。除此之外,还可以采用 Brenner、Tenengrad、SMD、SMD2 等等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章