Tesseract-ocr 3.0.2源碼 + VS2010項目工程 + 簡單測試代碼

編譯環境:Visual Studio 2010

所用類庫版本:

zlib 1.2.7

lpng1514
jpegsr9
tiff-4.0.3
giflib-5.0.4
leptonica-1.69
tesseract-ocr3.0.2



下載地址http://pan.baidu.com/s/1c0pqvQg 密碼rlib


測試代碼

bool XYImage::RecognizeImage(const String &language /* = _T("eng") */,
							 const String &whitelist /* = _T("0123456789") */)
{
	tesseract::TessBaseAPI api;
	if (api.Init(GlobalizeString(AppBase::GetStartupPath()).toGBK(), GlobalizeString(language).toGBK(),
		tesseract::OEM_DEFAULT) == -1)
	{
		assert(!"ocr init failed!");
		return false;
	}

	api.SetVariable("classify_bln_numeric_mode", "1");
	api.SetVariable("tessedit_char_whitelist", GlobalizeString(whitelist).toGBK());

	auto pix = pixRead("F:\\1.bmp"); //把pixReadBmpStream函數從庫裏抄出來的, 可以實現加載內存圖像
	if (pix != nullptr)
	{
		api.SetImage(pix);		

		char *pUTF8 = api.GetUTF8Text();//UTF-8編碼

		if (pUTF8 != nullptr)
		{
			this->UTF8Text.Copy(pUTF8);
			delete[] pUTF8;
		}

		pixDestroy(&pix);

		return true;
	} //if

	return false;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章