在做數據清洗的時候,會遇到一部分數據會用到,一部分數據需丟棄的情況,可以做一個字符串篩選器,完成自動化操作
'''
delete part jpg and xml
'''
# 同時刪除了以region結尾的jpg和xml文件
import os
def del_files(path):
for root , dirs, files in os.walk(path):
for name in files:
if name.endswith("region.xml"): # 指定要刪除的格式,這裏是xml 可以換成其他格式
os.remove(os.path.join(root, name))
print ("Delete File: " + os.path.join(root, name))
elif name.endswith("region.jpg"): # 指定要刪除的格式,這裏是jpg 可以換成其他格式
os.remove(os.path.join(root, name))
print("Delete File: " + os.path.join(root, name))
# test
if __name__ == "__main__":
path = 'data/dataset/xxx/naru_region_data/'
del_files(path)