遍歷文件
這個函數可以用來列出給出路徑下所有的文件
def itgf(basicDir): #輸入文件路徑
list = os.listdir(basicDir)
fileList = [] #使用一個列表存儲當前路徑下所有的文件
for i in range(0, len(list)):
path = os.path.join(basicDir,list[i])
if(os.path.isfile(path)):
fileList.append(path)
elif(os.path.isdir(path)):
fileList.extend(itgf(path))
return fileList
獲取文件路徑對應的文件名:
name = os.path.basename(path)
關於os.path , 可以參考os.path
pandas庫在數據處理當中非常有用。
對於pandas中的dataFrame,如果要進行大規模的類似的操作,使用for循環進行操作會使得代碼塊看起來太過繁雜。
因此,使用map函數很有用:
例如,對整列的數據進行操作
#df是一個dataFrame,df['xxx']存儲了文件名(含有後綴)
df['xxx'].map(lambda x: ''.join(x.split('.')[:-1]))
這個函數可以獲取df[‘xxx’]存儲文件名對應不含後綴的文件名