【場景文本檢測】paper裏的實驗參數和數據集選擇

原創

Patrick Star@wust

2020-06-20 12:35

前言：

由於實驗需求，記錄一下最近（主要19年）場景文本檢測的實驗的實現細節和數據集選擇。

常用的預訓練模型

pre-train：

synthtext （800k） 1epoch
IC17 MLT（7200）40 epoch (psenet spcnet)

多尺度訓練

PSEnet: ：縮放旋轉水平翻轉隨機裁剪

常用參數

名稱	一階學習率	二階學習率	batch size	迭代次數	數據集	其他
PSEnet	0.001	0.0001	16	36k iteration	synth、MLT	-------

常用的不規則文本數據集

名稱	訓練集	驗證集	測試集	特點	文本形狀
ICDAR 2013	462	229	233	字符級	水平
ICDAR 2015	1000	——	500	字符級	任意四邊形
ICDAR 2017 MLT（*）	7200	1800	9000	字符級	多語言
Total-Text (*)	1255	——	300	----	水平，多方向，彎曲
CTW1500	1000	——	500	文本行	14點多邊形
SynthText	800k	——	——	-----	合成數據集
MSRA-TD500	500	300	200		彎曲文本

預訓練方法1 ：2017MLT
預訓練方法2 ：合成數據集（AAAI 2019）
預訓練方法3：全部訓練集一起

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

最新文章

最新評論文章