關於數字圖像人工文本定位論文撰寫的思路梳理

**研究問題:**隨着電影行業逐漸國際化,電影的展示方式也逐漸統一,大多數的電影,特別是國內的電影,都採用中英文雙字字幕的展示方式,而國外電影的引進,也都在後期添加了中英文雙字的字幕,這爲廣大英語愛好者學習英語口語提供了極大的便利,但是電影不同於教學視頻,文字轉變快,語速快慢不齊,給好多英語愛好者在通過電影學習口語的過程中造成了極大的困難,所以,目前急需一種科技方式,能將電影中的,每一句字幕提取出來,即將中英文雙字字幕完全脫離電影,獨立存放,獨立展示,以便供學習者參考學習。

**研究方式:**運用數字圖像處理相關知識完成對電影字幕的一系列操作

**具體研究方法:**通過對大量論文的閱讀和整理,將電影字幕提取歸納到視頻文本提取研究範疇中去。以下爲視頻文本提取相關知識:
(1)對視頻的文本提取,其實是對視頻中每一幀圖像上的文本進行的提取;
(2)圖像上的文本,分爲場景文本和人工文本。場景文本,即圖像中自然場景下的文本,如廣告牌上的文字,汽車的車牌號碼等。人工文本,即人爲後期添加在圖像上的文本信息,字幕,就是人工文本;’
(3)人工文本提取,分爲文本定位,文本分割,文本識別。文本定位,文本提取全過程中最重要一環,找到圖像中的文字區域,是後期一切操作的基礎。文本分割,將定位到的文字進行切分處理,得到一系列單個字符。分本識別,對單個字符進行識別,將識別結果返回到用戶眼前;
(4)文本定位,也稱爲文字區域提取,方法方向有四種,分別是:基於連通區域的文本定位,基於紋理的文本定位,基於邊緣的文本定位,基於學習的文字定位,每種方向涉及知識不同,需要有一定基礎;
(5)文本分割,方法方向也四種,分別是:顏色閾值法,分裂合併,顏色聚類法,基於顏色模型;
(6)文字識別,即文本識別,方法方向四種,分別是:統計識別方法,統計與結構相結合識別方法,人工神經網絡用於文字識別,SVM(支持向量機);
(7)以上,便是文本提取全過程,(4)、(5)、(6)每一步驟運用何種方法可以自由選擇,排列組合就可以得到最終結果(僅限於目前的想法),可能一些組合最終結果差強人意,說明這個組合效果不好,在這64種組合中(444)找出最優解,將是一件曠日持久的事情。
另:基於筆劃寬度,筆劃識別的文字定位方法也是最新的定位技術。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章