Python获取数据集下指定后缀文件名list并保存为csv格式

需求:找出data目录下,不同子文件夹内的指定后缀为dcm的文件名,生成list,保存为csv格式

import fnmatch
import os
import pandas as pd
import numpy as np
import sys

InputStra = sys.argv[1] # 运行时,需要指定参数1为data路径 
InputStrb = sys.argv[2] # 参数2为 .dcm的后缀文件,也可以是别的后缀,如.jpg,*表示所有

def ReadSaveAddr2(Stra, Strb):
    df = pd.DataFrame(np.arange(0).reshape(0,1), columns=['Addr'])
    print(df)
    path = InputStra    
    for dirpath,dirnames,filenames in os.walk(path):
        #for filename in filenames:
        a_list = fnmatch.filter(os.listdir(dirpath), Strb)
        if len(a_list):
            dft = pd.DataFrame(np.arange(len(a_list)).reshape((len(a_list),1)),columns=['Addr'])
            dft.Addr = a_list
            # dft.Addr = dirpath + '\\' + dft.Addr#输出绝对路径
            frames = [df, dft]
            df = pd.concat(frames)
            print(df.shape)
    df.to_csv('list.csv', columns=['Addr'], index=False, header=False)
    print("Write list !")

# 在命令行中输入例如如下格式的命令
# python get_namelist.py /data/dataset/xxx/naru_data *.dcm 

ReadSaveAddr2(InputStra, InputStrb)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章