Python 數據處理實踐(1)--遍歷文件和map()函數

遍歷文件

這個函數可以用來列出給出路徑下所有的文件

def itgf(basicDir): #輸入文件路徑   
    list = os.listdir(basicDir)  
    fileList = []   #使用一個列表存儲當前路徑下所有的文件          
    for i in range(0, len(list)):
        path = os.path.join(basicDir,list[i])
        if(os.path.isfile(path)):
                fileList.append(path)
        elif(os.path.isdir(path)): 
            fileList.extend(itgf(path))
    return fileList

獲取文件路徑對應的文件名:

name = os.path.basename(path)

關於os.path , 可以參考os.path

pandas庫在數據處理當中非常有用。

對於pandas中的dataFrame,如果要進行大規模的類似的操作,使用for循環進行操作會使得代碼塊看起來太過繁雜。

因此,使用map函數很有用:
例如,對整列的數據進行操作

#df是一個dataFrame,df['xxx']存儲了文件名(含有後綴)
df['xxx'].map(lambda x: ''.join(x.split('.')[:-1]))

這個函數可以獲取df[‘xxx’]存儲文件名對應不含後綴的文件名

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章