文本檢測數據集以及標籤形式說明

文本檢測數據集以及標籤形式說明

icdar15系列,帶角度的四邊形標籤

 

 

 

打開標籤文件,每行爲一個文本框座標以及語言類型,文字,###代表模糊不清

形式,是四邊形的四個點的座標。

 

ctw1500系列任意形狀的數據集標籤

 

 

每行共32個數字,前四個數字爲該彎曲文本在整張圖上的矩形框座標值,

剩下的28個值爲14個點,爲相對於矩形框左上角得誤差補償即爲與左上角座標所形成的差值,形成封閉的彎曲文本框,

其計算方式可以簡單的理解爲:

1.將前4個座標值的矩形框從原圖中截取出來(左上右下4個點)

2.在截取之後的圖中取14個點的座標值

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章