Synthtext數據座標

Synthtext數據


最近碰到Synthtext數據,沒查到關於座標的解釋,所以自己研究了一下,完全原創。


Synthtext裏面的gt.mat包含如上字典的鍵,我們那wordBB來說明一下。
在這裏插入圖片描述
這是wordBB[0][0]是內容,對應得是mat[“imnames”][0][0]的[‘8/ballet_106_0.jpg’]圖片,這個張圖片裏面的英文單詞對應txt[0][0]

在這裏插入圖片描述
到這也就清楚了gt.mat裏面的內容。

座標操作

首先wordBB裏面的內容是圖片每個單詞的位置座標,大家可以看到上面座標圖片裏面中間空了一段,其實座標分成了兩部分,空段上面是單詞的x座標,下面試單詞的y座標,並且一 一對應,而且座標的順序是單詞的四個座標,以左頂點爲起始點,順時針描述。
至此座標已解釋完全。

如果需要在圖片上劃分出單詞的區域並製作標籤可以參考如下代碼:

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
到這就自定義了一個數據預處理的代碼了。接下來看看效果
在這裏插入圖片描述
在這裏插入圖片描述
效果還算可以。

學生黨一枚,如有錯誤請給我留言,非常感謝!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章