python實現xml文件與對應圖片統一重命名

在訓練faster-rcnn做目標檢測的時候,將數據集中的xml文件與對應圖片統一重命名爲VOC2007的數據格式可以避免對源代碼的大量修改。
代碼如下:

import numpy as np
import glob
import os
import xml.etree.ElementTree as ET
import xml.dom.minidom


'''
第一步,將xml文件和圖片重新命名
'''

# 獲取文件夾中bmp圖片的數量
def getDirImageNum(path):
    bmpDirImagesNum = 0
    for bmpfile in os.listdir(path):
        if os.path.splitext(bmpfile)[1] == '.jpg':
            bmpDirImagesNum += 1
    return bmpDirImagesNum
 
# 獲取文件夾中xml文件的數量
def getDirXmlNum(path):
    xmlDirXmlNum = 0
    for xmlfile in os.listdir(path):
        if os.path.splitext(xmlfile)[1] == '.xml':
            xmlDirXmlNum += 1
    return xmlDirXmlNum

   


inputpath1="D:\\tansfer\\VOC\\VOC2007\\JPEGImages\\"
inputpath2='D:\\tansfer\\VOC\\VOC2007\\Annotations\\'

outpath1="D:\\tansfer\\VOC\\VOC2007\\J\\"
outpath2="D:\\tansfer\\VOC\\VOC2007\\a\\"

file_name = os.listdir(inputpath2)

error = []
for item in file_name:
    print(item)
    o_imap = inputpath1+item.split('.')[0]+".jpg"
    o_xmlp = inputpath2+item.split('.')[0]+".xml"
    i = getDirImageNum(outpath1)  # 表示bmp文件的命名是從當前輸出文件夾中的bmp文件數目開始的
    if os.path.exists(o_imap) and os.path.exists(o_xmlp):
        i = i+1
        new_name = '0' + format(str(i), '0>5s') + '.jpg'
        dst1 = os.path.join(os.path.abspath(outpath1), new_name) # 爲000001.jpg
        os.rename(o_imap, dst1)
        dst2 = os.path.join(os.path.abspath(outpath2), '0' + format(str(i), '0>5s') + '.xml')    # 爲000000.xml形式,想要的格式
        try:
            dom = xml.dom.minidom.parse(o_xmlp)
            root = dom.documentElement
            # 獲取標籤對path之間的值並賦予新值j
            # 文件夾賦值
            root.getElementsByTagName('folder')[0].firstChild.data = "VOC2007"

            # 獲取標籤對filename之間的值並賦予新值j
            root.getElementsByTagName('filename')[0].firstChild.data = new_name

            # 將修改後的xml文件保存,xml文件修改前後的路徑
            # 打開並寫入
            with open(o_xmlp, 'w') as fh:
                dom.writexml(fh)
            os.rename(o_xmlp, dst2)
            print ('converting %s to %s ...' % (o_xmlp, dst2))
        except:
            error.append(new_name)
            continue
# 如果有出錯的文件,error++
print(len(error))
 

參考資料:
Python實現BMP圖片與XML文件的統一重命名
【Python】批量修改圖片文件名和xml文件信息
python批量修改xml屬性

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章