使用OpenCV實現圖像中的文字切割

原創

2020-02-22 09:12

前言

1.做文字識別相關的項目，首先是檢測字符區域，然後進行水平切割，得到整行的文字，其次要考慮的就是怎麼將每一個字符分開，並且從圖片中切割下來，然後纔可以導入訓練好的模型進行字符識別。在字符單個切割的切割的過程中，可以使用OpenCV來實現。
2.我這裏用到的OpenCV的版本是3.30,IDE是Qt和VS2015。

代碼演示

void textCutting(Mat &src, vector<Mat> &out_char)
{	

	if (src.channels() > 1)
	{
		cvtColor(src, src, CV_BGR2GRAY);
	}

	//濾波
	//GaussianBlur(src, src, Size(1, 1), 5, 5, 4);
	adaptiveThreshold(src, src, 255, cv::ADAPTIVE_THRESH_MEAN_C, cv::THRESH_BINARY, 41, 0);

	//新建一個全白圖像
	Mat white_base(src.size(), src.type(), cv::Scalar(255));
	//相減得到反轉的圖像
	Mat input_src = white_base - src;

	const int src_width = input_src.cols;
	const int src_height = input_src.rows;

	//儲存每列白色像素個數的容器
	//取列白色像素個數
	vector<int> white_pice(src_width,0);
	for (size_t i = 0; i < src_height; i++)
	{
		for (size_t j = 0; j < src_width; j++)
		{
			if (input_src.at<uchar>(i, j))
			{
				white_pice.at(j)++;
			}
		}
	}

	//繪製垂直投影下每列白色像素的數目
	Mat vertical_projection(src_height, src_width, CV_8UC1, Scalar(0));
	for (int i = 0; i< src_width; i++)
	{
		for (int j = 0; j < white_pice[i]; j++)
		{
			vertical_projection.at<uchar>(src_height - j - 1, i) = 255;
		}
	}
	imshow("投影圖", vertical_projection);

	vector<Mat> split_src;

	bool white_block = false;
	bool black_block = false;
	
	int temp_col_forword = 0, temp_col_behind = 0;
	Mat split_temp;
	

	for (int i = 0; i < src_width; i++)
	{
		//表示區域有白色像素
		if (white_pice[i])
		{
			white_block = true;
			black_block = false;
		}
		else
		{	//若無白色像素（進入黑色區域）
			if (white_block)
			{
				//若前一列有白色像素
				temp_col_behind = i;
				//取當前列爲截止列
				//截取下一部分
				split_temp = input_src(Rect(temp_col_forword, 0, temp_col_behind - temp_col_forword, src_height)).clone();
				split_src.push_back(split_temp);
			}
			//記錄最新黑色區域的列號，記爲起始列
			temp_col_forword = i;
			//表示進入黑色區域
			black_block = true;
			white_block = false;
		}
	}

	for (int i = 0; i < split_src.size(); i++)
	{
		imshow(to_string(i), split_src[i]);
		//out_char.push_back(split_src[i]);
	}
}

函數調用：

Mat src;
src = imread("4.png");
vector<Mat> dst;
imshow("src", src);
textCutting(src, dst);

運行結果：

知來者逆

發佈了69 篇原創文章 · 獲贊 38 · 訪問量 3萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用OpenCV實現圖像中的文字切割

前言

代碼演示

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

Qt網絡編程——使用OpenCV與TCP搭建圖像處理服務器

使用OpenCV進行身份證號碼字符進行分割

C++對中文字符的處理

OpenCV圖像處理——深度學習樣本製造

圖像處理——基於深度學習HED實現目標邊緣檢測

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結