目標檢測中,pascal格式的數據集用xml作爲標籤。如果在標註的時候,目標過小,則無法檢測出來,這裏我參考resnet101的stride=16,刪除總像素大小小於31x31=961的目標。其實打開圖片看可以發現,絕大部分這個大小的目標,在原圖中人根據經驗可以猜測出是一個目標,但是crop出來單獨看,你都看不出是什麼玩意。
代碼如下:
# -*- coding:utf-8 -*-
# nansbas
# 2019.1.21
import os
import xml.etree.ElementTree as ET
import numpy as np
np.set_printoptions(suppress=True, threshold=np.nan)
import matplotlib
from PIL import Image
#讀取xml文件,解析之後把每一個目標存爲obj_struct字典,保存在Objects列表裏面
def parse_obj(xml_path, filename):
tree=ET.parse(xml_path+filename)
objects=[]
for obj in tree.findall('object'):
obj_struct={}
obj_struct['name']=obj.find('name').text
bbox=obj.find('bndbox')
obj_struct['bbox']=[int(bbox.find('xmin').text),
int(bbox.find('ymin').text),
int(bbox.find('xmax').text),
int(bbox.find('ymax').text)]
objects.append(obj_struct)
return objects
#讀取圖像大小
def read_image(image_path, filename):
im=Image.open(image_path+filename)
W=im.size[0]
H=im.size[1]
area=W*H
im_info=[W,H,area]
return im_info
#主函數
if __name__ == '__main__':
image_path='C:/Users/nansbas/Desktop/JPEGImages/'
xml_path='C:/Users/nansbas/Desktop/hebin/03/'
filenamess=os.listdir(xml_path)
xml_path2='C:/Users/nansbas/Desktop/hebin/04/'
filenames=[]
for name in filenamess:
name=name.replace('.xml','')
filenames.append(name)
#recs是Objects列表的集合。
#ims_info是讀取出來的圖片長寬和麪積信息
#obs_shape裏面爲:w\h\area\w rate\h rate\ area rate
#classnames爲類別名稱集合
#num_objs裏面保存了類目標的數量
#obj_avg爲求平均後的結果
recs={}
ims_info={}
obs_shape={}
classnames=[]
num_objs={}
obj_avg={}
for name in filenames:
# print(name)
tree=ET.parse(xml_path+name+ '.xml')
root=tree.getroot()
objects=[]
for obj in tree.findall('object'):
obj_struct={}
obj_struct['name']=obj.find('name').text
bbox=obj.find('bndbox')
obj_struct['bbox']=[int(bbox.find('xmin').text),
int(bbox.find('ymin').text),
int(bbox.find('xmax').text),
int(bbox.find('ymax').text)]
ob_w = int(bbox.find('xmax').text) - int(bbox.find('xmin').text)
ob_h = int(bbox.find('ymax').text) - int(bbox.find('ymin').text)
ob_area = ob_w*ob_h
# print(ob_area)
if ob_area<=961:
print("這個圖片目標過小:{},{}".format(name,object))
root.remove(obj)
print("已刪除")
tree.write(xml_path2+ name+ '.xml')