文本檢測數據集以及標籤形式說明
icdar15系列,帶角度的四邊形標籤
打開標籤文件,每行爲一個文本框座標以及語言類型,文字,###代表模糊不清
形式,是四邊形的四個點的座標。
ctw1500系列任意形狀的數據集標籤
每行共32個數字,前四個數字爲該彎曲文本在整張圖上的矩形框座標值,
剩下的28個值爲14個點,爲相對於矩形框左上角得誤差補償即爲與左上角座標所形成的差值,形成封閉的彎曲文本框,
其計算方式可以簡單的理解爲:
1.將前4個座標值的矩形框從原圖中截取出來(左上右下4個點)
2.在截取之後的圖中取14個點的座標值