javaCV文字識別之2:視頻文字識別和視頻提取字幕文字字符

javacv文字識別系列:

javaCV文字識別之1:基於google的tesserac ocr識別圖片中的文字,跨平臺支持英文中文簡體繁體等各種字符識別

javaCV文字識別之2:視頻文字識別和視頻提取字幕文字字符

前言

上一章我們實現了圖片的文字識別和提取,本章基於javacv中的tesserac 和ffmpeg實現視頻文字識別和提取

javacv中包含ffmpeg和tesserac兩個庫以及tesserac的依賴庫leptonica。

讀取視頻幀javacv已經幫我們封裝好了,直接就可以讀取到視頻幀,麻煩的是,測試的時候發現javacv設置像素格式不起效果,所以我們只能通過BufferedImage進行轉換後才能進行圖片文字識別,性能上肯定會有折扣,後面我會放出基於ffmpeg的解碼並轉換爲rgb像素後提供給tesserac進行識別。

那麼,就讓我們開始吧。

注意:由於我們是每一幀都進行識別,而且視頻播放和識別是相同線程,會阻塞,所以視頻播放速度會很慢。

實現功能

1、視頻讀取

2、視頻幀獲取

3、視頻幀轉換爲java的BuffredImage圖片

4、圖片轉像素

5、使用像素數據進行tesserac ocr文字識別

代碼實現

/**
     * 圖像像素文字識別
     * @author eguid (eguid.blog.csdn.net)
     * @param language 語言
    

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章