介紹合成中文識別數據集的相關repo
SynthText_Chinese_version
修改自SynthText(CVPR2016),用於生成自然場景文本圖像。
備註:但代碼給人的感覺是很混亂,沒有清晰結構,目前作者也停止了維護,代碼基於OpenCV2.4,版本過舊無法pip直接安裝或者需要自己改動一些代碼。
TextRecognitionDataGenerator
一個合成數據生成器用於文本識別
備註:代碼結構清晰,作者一直在維護,有官方文檔。
注意事項
參數說明有官方手冊,這裏不再贅述。說一下實際遇到的幾個問題:
- 傾斜角度問題:傾斜角不宜過大,過大會導致它爲了在指定高度框中容下傾斜文本,將字體縮的很小。建議5度>以內。
- 模糊問題:模糊參數僅支持整型,設爲1合適。
- 標籤問題:源代碼中僅有三種標籤,不支持img_id to label_id,可以修改
string_generator.py
中的create_strings_from_dict
,使其同時返回生成字符串的對應ID。 - 邊界問題:建議將邊界設爲0,字體大一些。
- 字體問題:直接將你想要的字體丟入fonts的cn文件夾,建議還是添加同時支持簡體和繁體的字體。
text_renderer
準確的說也是生成文本圖像用於文字識別
備註:代碼結構清晰,但很久沒維護了。