OpenCV--基於直線檢測的文本圖像傾斜校正

原創

熊叫大雄

2020-06-25 11:21

圖像傾斜矯正的方式有很多種，今天簡單介紹一種基於直線檢查的傾斜校正。

這種方法暫時在如下圖的文本文件上測試過，不一定能針對所有：

首先，因爲這種圖像基本是比較常見的白底黑字,所以首先對這幅圖做一個灰度化，灰度化之後做一個二值化，得到二值圖像：

二值化之後，將X軸方向的的像素點連起來，這裏我採用的是形態學的膨脹，因爲我做二值化的時候採用了取反的操作，這裏可以考慮不取反，但是要用腐蝕來做，這裏有個技巧，因爲是要對X軸來做連接，所以可以在構造形態學核上將Y軸設置爲1：

做了連接後可以使用canny邊緣檢測做一遍邊緣檢測，然後再做霍夫變化：

從上圖可以看出來基本上畫出來的直線方向跟文字的走向的一致的，然後根據霍夫變換得到的角度來求平均值，這個平均值就是圖像要旋轉的角度。

上代碼：

#include <opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;

void GetContoursPic(const char* pSrcFileName)
{
	Mat srcImg = imread(pSrcFileName);
	imshow("原始圖", srcImg);
	Mat gray, binImg;
	//灰度化
	cvtColor(srcImg, gray, COLOR_RGB2GRAY);
	imshow("灰度圖", gray);
	//二值化
	threshold(gray, binImg, 50, 255, CV_THRESH_BINARY_INV );
	imshow("二值化", binImg);

	Mat morphologyDst;
	cv::morphologyEx(binImg, morphologyDst, cv::MORPH_DILATE, 
	    cv::getStructuringElement(cv::MORPH_RECT, cv::Size(7, 1)));
	imshow("膨脹", morphologyDst);

	Mat cannyDst;
	Canny(morphologyDst, cannyDst, 150, 200);
	imshow("Canny", cannyDst);

	vector<Vec2f> lines;
	HoughLines(cannyDst, lines, 1, CV_PI / 180, 130, 0, 0);
	Mat houghDst;
	srcImg.copyTo(houghDst);
	double meanAngle = 0.0;
	int numCnt = 0;
	for (size_t i = 0; i < lines.size(); i++)
	{
		float rho = lines[i][0]; //就是圓的半徑r
		float theta = lines[i][1]; //就是直線的角度
		Point pt1, pt2;
		double a = cos(theta), b = sin(theta);
		double x0 = a*rho, y0 = b*rho;
		pt1.x = cvRound(x0 + 1000 * (-b));
		pt1.y = cvRound(y0 + 1000 * (a));
		pt2.x = cvRound(x0 - 1000 * (-b));
		pt2.y = cvRound(y0 - 1000 * (a));

		line(houghDst, pt1, pt2, Scalar(55, 100, 195), 1);
		
		theta = theta * 180 / CV_PI - 90;
		//if (theta > -45 && theta < 45)
		{
			meanAngle += theta;
			numCnt++;
		}
	}
	meanAngle /= numCnt;
	imshow("霍夫變換", houghDst);
	cv::Point2f center(srcImg.cols / 2., srcImg.rows / 2.);
	//獲取旋轉矩陣（2x3矩陣）
	cv::Mat rot_mat = cv::getRotationMatrix2D(center, meanAngle, 1.0);
	cv::Size dst_sz(srcImg.cols, srcImg.rows);
	Mat warpDst;
	cv::warpAffine(srcImg, warpDst, rot_mat, dst_sz);
	imshow("旋轉矯正", warpDst);

	cv::waitKey(0);
}

結果如下：

這個方法有幾個重要的影響點：

1、二值化：二值化的閾值選得不好的話結果是不能將前景和背景分離，我試過用OTSU，出來的二值化不是很好，然後檢測直線的時候就有一點不太準確，但是基本上也能檢測出來：

2、如果是白底黑字，就用腐蝕，反之有膨脹來做；

3、邊緣檢測也很重要，可想而知，不做邊緣檢測再來做霍夫變換，那得有多少條直線，直接冗餘不說，還非常容易干擾檢測。

4、另外，對於一些高度大於寬度的圖像，其實可以採用分段檢測求平均，以保證每一段的高度小於寬度，因爲我的檢測主要以X軸爲主。

路漫漫其修遠兮

吾將上下而求索

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

OpenCV--基於直線檢測的文本圖像傾斜校正

《日本蠟燭圖》讀書筆記 & 技術分析回測

Python多線程編程深度探索：從入門到實戰

《期貨-市場技術分析》讀書筆記

mongodb處理json數據很好

頂級 Javaer 都在用的 20 個類庫，真香！

[轉帖]cpupower

google瀏覽器插件開發

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

Python調用OpenCV像素操作

CNN:擴張卷積輸出分辨率計算

白平衡之灰度世界算法

[OpenCV] 直方圖均衡化

Cmake構建OpenCV測試例子

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結