COCO API的操作

寫作起因

在我的資源分享中有一個是COCO數據集的分享,裏面是COCO2017的數據集,因爲下載數據集是需要翻牆的,故我將資源上傳到百度雲,方便大家下載,順便自己拿一點積分。但有個人下載完後,評論資源是騙人的,一點用都沒。我一開始以爲是資源過期了,趕緊去看了一下,但是資源並沒有過期。我不知道評論的人是出於惡意還是別的原因,但我發現網上關於COCO數據集操作的教程的確挺少的,故我寫了此篇操作COCO數據集的博客,和大家分享知識。


環境要求

電腦系統:Ubuntu 16 (Linux都行, windows我自己沒試過)

開發環境:Anaconda python3.6

庫依賴:COCOAPI  鏈接:https://github.com/cocodataset/cocoapi(官方資源,需要自己下載,裏面有詳細的安裝講解)

數據集:COCO2017(COCO2014也行,函數的用法是一樣的)

            下載地址:http://cocodataset.org/(官方,需要翻牆)

            我的資源https://download.csdn.net/download/godwriter/10239162(百度雲)


具體操作

  本次分享的代碼是自己剛開始接觸COCO數據集寫的,代碼中寫了詳細的註釋便於大家理解。代碼可能有點粗糙,大佬勿噴,多謝諒解!

  由於我在代碼中加了詳細的註釋,故下面就是代碼的展示,我在這裏總結說一下API的使用思路。

  1.   第一步,讀取Json文件,這個文件是下載的數據中提供的,數據格式可以到COCO的官網上查看;或者通過閱讀API的源碼理解;或者就通過代碼打開Json文件,裏面是一個字典,返回字典的key值即可查看。
  2.   第二步,得到你想要的信息,Json文件中包括了圖片的描述信息,也有目標檢測的bounding box,還有人體骨骼點等。下面的代碼中有展示。
  3.  第三步,覺得操作Json不開心,下面代碼中提供了將Json文件轉換爲Csv文件的代碼。由於我自己實驗的原因,代碼只將圖片中包含三個或以下物體的圖片信息保存到了Csv文件中,故那份代碼需要根據你自己的需求改變。


代碼展示

一、 通過API得到展示數據集中的一張圖片




二、 通過API得到圖片的描述信息和其中的實體







三、 將Json文件中的信息導入到csv文件中






  至此,本博文結束,可能你說我在偷懶,直接貼代碼,沒辦法,博主也忙着弄實驗,只是看到別人評論資源是假的受不了。日後可以開一個Image Caption具體實驗流程的專欄,幫大家一步步完成一個ImageCaption項目。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章