javaCV文字識別之2：視頻文字識別和視頻提取字幕文字字符

原創

-eguid-

2020-05-11 10:45

javacv文字識別系列：

javaCV文字識別之1：基於google的tesserac ocr識別圖片中的文字，跨平臺支持英文中文簡體繁體等各種字符識別

javaCV文字識別之2：視頻文字識別和視頻提取字幕文字字符

前言

上一章我們實現了圖片的文字識別和提取，本章基於javacv中的tesserac 和ffmpeg實現視頻文字識別和提取

javacv中包含ffmpeg和tesserac兩個庫以及tesserac的依賴庫leptonica。

讀取視頻幀javacv已經幫我們封裝好了，直接就可以讀取到視頻幀，麻煩的是，測試的時候發現javacv設置像素格式不起效果，所以我們只能通過BufferedImage進行轉換後才能進行圖片文字識別，性能上肯定會有折扣，後面我會放出基於ffmpeg的解碼並轉換爲rgb像素後提供給tesserac進行識別。

那麼，就讓我們開始吧。

注意：由於我們是每一幀都進行識別，而且視頻播放和識別是相同線程，會阻塞，所以視頻播放速度會很慢。

實現功能

1、視頻讀取

2、視頻幀獲取

3、視頻幀轉換爲java的BuffredImage圖片

4、圖片轉像素

5、使用像素數據進行tesserac ocr文字識別

代碼實現

/**
   * 圖像像素文字識別
   * @author eguid （eguid.blog.csdn.net）
   * @param language 語言

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

javaCV文字識別之2：視頻文字識別和視頻提取字幕文字字符

前言

實現功能

代碼實現

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

國內衛視和地方衛視的電視直播rtmp/hls/m3u8播放源地址（測試用，部分失效）

javacv實現實時視頻截圖和錄像服務easyCV，支持png,jpg截圖以及gif,apng動態圖片錄製

javaFX系列之launcher啓動器：兩種啓動javaFX的方式及launch(args[])參數設置和獲取

javaFX遊戲開發實戰：從零開始開發和實現自娛自樂小遊戲：奧賽羅（黑白棋、翻轉棋），支持可落子位置提示，原創翻轉算法，基於JavaFX2.0的Canvas畫板，界面邏輯與算法分離結構

javaFX系列之web組件：史上最簡單的javaFX瀏覽器實現（web component組件）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結