目標檢測:批量刪除xml中過小的目標

目標檢測中,pascal格式的數據集用xml作爲標籤。如果在標註的時候,目標過小,則無法檢測出來,這裏我參考resnet101的stride=16,刪除總像素大小小於31x31=961的目標。其實打開圖片看可以發現,絕大部分這個大小的目標,在原圖中人根據經驗可以猜測出是一個目標,但是crop出來單獨看,你都看不出是什麼玩意。

 

代碼如下:

# -*- coding:utf-8 -*-
# nansbas
# 2019.1.21
import os
import xml.etree.ElementTree as ET
import numpy as np
np.set_printoptions(suppress=True, threshold=np.nan)
import matplotlib
from PIL import Image

#讀取xml文件,解析之後把每一個目標存爲obj_struct字典,保存在Objects列表裏面
def parse_obj(xml_path, filename):
  tree=ET.parse(xml_path+filename)
  objects=[]
  for obj in tree.findall('object'):
    obj_struct={}
    obj_struct['name']=obj.find('name').text
    bbox=obj.find('bndbox')
    obj_struct['bbox']=[int(bbox.find('xmin').text),
                        int(bbox.find('ymin').text),
                         int(bbox.find('xmax').text),
                        int(bbox.find('ymax').text)]
    objects.append(obj_struct)
  return objects

#讀取圖像大小
def read_image(image_path, filename):
  im=Image.open(image_path+filename)
  W=im.size[0]
  H=im.size[1]
  area=W*H
  im_info=[W,H,area]
  return im_info


#主函數
if __name__ == '__main__':
  image_path='C:/Users/nansbas/Desktop/JPEGImages/'
  xml_path='C:/Users/nansbas/Desktop/hebin/03/'
  filenamess=os.listdir(xml_path)
  xml_path2='C:/Users/nansbas/Desktop/hebin/04/'
  filenames=[]
  for name in filenamess:
    name=name.replace('.xml','')
    filenames.append(name)
  #recs是Objects列表的集合。
  #ims_info是讀取出來的圖片長寬和麪積信息
  #obs_shape裏面爲:w\h\area\w rate\h rate\ area rate
  #classnames爲類別名稱集合
  #num_objs裏面保存了類目標的數量
  #obj_avg爲求平均後的結果
  recs={}
  ims_info={}
  obs_shape={}
  classnames=[]
  num_objs={}
  obj_avg={}

  for name in filenames:
#    print(name)
    tree=ET.parse(xml_path+name+ '.xml')
    root=tree.getroot()
    objects=[]
    for obj in tree.findall('object'):
           obj_struct={}
           obj_struct['name']=obj.find('name').text
           bbox=obj.find('bndbox')
           obj_struct['bbox']=[int(bbox.find('xmin').text),
                               int(bbox.find('ymin').text),
                               int(bbox.find('xmax').text),
                               int(bbox.find('ymax').text)]
           ob_w = int(bbox.find('xmax').text) - int(bbox.find('xmin').text)
           ob_h = int(bbox.find('ymax').text) - int(bbox.find('ymin').text)
           ob_area = ob_w*ob_h
#           print(ob_area)
           if ob_area<=961:
             print("這個圖片目標過小:{},{}".format(name,object))
             root.remove(obj)
             print("已刪除")
    tree.write(xml_path2+ name+ '.xml')

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章