Synthtext數據
最近碰到Synthtext數據,沒查到關於座標的解釋,所以自己研究了一下,完全原創。
Synthtext裏面的gt.mat包含如上字典的鍵,我們那wordBB來說明一下。
這是wordBB[0][0]是內容,對應得是mat[“imnames”][0][0]的[‘8/ballet_106_0.jpg’]圖片,這個張圖片裏面的英文單詞對應txt[0][0]
到這也就清楚了gt.mat裏面的內容。
座標操作
首先wordBB裏面的內容是圖片每個單詞的位置座標,大家可以看到上面座標圖片裏面中間空了一段,其實座標分成了兩部分,空段上面是單詞的x座標,下面試單詞的y座標,並且一 一對應,而且座標的順序是單詞的四個座標,以左頂點爲起始點,順時針描述。
至此座標已解釋完全。
如果需要在圖片上劃分出單詞的區域並製作標籤可以參考如下代碼:
到這就自定義了一個數據預處理的代碼了。接下來看看效果
效果還算可以。
學生黨一枚,如有錯誤請給我留言,非常感謝!