合成中文識別數據集的相關repo

介紹合成中文識別數據集的相關repo

SynthText_Chinese_version

修改自SynthText(CVPR2016),用於生成自然場景文本圖像。
備註:但代碼給人的感覺是很混亂,沒有清晰結構,目前作者也停止了維護,代碼基於OpenCV2.4,版本過舊無法pip直接安裝或者需要自己改動一些代碼。

TextRecognitionDataGenerator

一個合成數據生成器用於文本識別
備註:代碼結構清晰,作者一直在維護,有官方文檔。

注意事項

參數說明有官方手冊,這裏不再贅述。說一下實際遇到的幾個問題:

  1. 傾斜角度問題:傾斜角不宜過大,過大會導致它爲了在指定高度框中容下傾斜文本,將字體縮的很小。建議5度>以內。
  2. 模糊問題:模糊參數僅支持整型,設爲1合適。
  3. 標籤問題:源代碼中僅有三種標籤,不支持img_id to label_id,可以修改string_generator.py中的create_strings_from_dict,使其同時返回生成字符串的對應ID。
  4. 邊界問題:建議將邊界設爲0,字體大一些。
  5. 字體問題:直接將你想要的字體丟入fonts的cn文件夾,建議還是添加同時支持簡體和繁體的字體。

text_renderer

準確的說也是生成文本圖像用於文字識別
備註:代碼結構清晰,但很久沒維護了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章