最簡單的java使用tesserac ocr識別圖片文字之:簡單三步輕鬆識別圖片中的英文文字字符

前言

本篇文章屬於javacv系列的擴展篇。

在此之前我們已經通過javacv實現了流媒體這塊的音視頻編解碼等等操作,當然還有圖像處理。雖然使用opencv也可以實現文字識別,但是識別率不高,所以來試試google開源的tesserac ocr看看效果。

我們分爲三步就可以做到實現:

首先,我們要添加依賴;次之,準備資源(需要訓練好的語言包以及需要進行識別的圖片,這裏會提供最新的英文版下載以及中文簡繁體下載地址);最後就開始編寫代碼。

廢話少說,立刻開始吧。

1、添加依賴

(1)gradle方式

dependencies {

compile group: 'org.bytedeco', name: 'tesseract-platform', version: '4.1.1-1.5.3'

}

(2)maven方式

<dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>tesseract-platform</artifactId>
            <version>4.1.1-1.5.3</version>
</dependency>

(3)jar包方式

javacv的包太大,這個不用講了,建議用上面那兩個。

2、下載語言包

英文和簡體中文放在同一個壓縮包中,免費下載,不要積分。

(1)英文版:https://download.csdn.net/do

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章