1.os模塊命令
os.curdir 返回('.') 指代當前目錄
os.pardir 返回('..') 指代上一級目錄
os.chdir(path) 用於改變當前工作目錄到指定的路徑
os.getcwd() 用於返回當前工作目錄
os.listdir(path) 返回指定路徑下的文件和文件夾列表
os.path.dirname(path) 去掉文件名,返回目錄(E:/Read_File)
os.path.dirname("E:/Read_File/read_yaml.py")
os.path.exists()是判斷某文件是否存在(當前目錄)
os.path.splitext() 將文件名和擴展名分開
eg:fname,fename=os.path.splitext('/home/ubuntu/python_coding/split_func/split_function.py')
fname:/home/ubuntu/python_coding/split_func/split_function
fename:.py
os.path.split() 返回文件的路徑和文件名
eg:dirname,filename=os.path.split('/home/ubuntu/python_coding/split_func/split_function.py')
dirname:/home/ubuntu/python_coding/split_func
filename:split_function.py
os.sep 不用去考慮 Windows 上,文件的路徑分割符號是 '\' ,在 Linux 上 是 ‘/’ ; 根據所處平臺,自動地採用相應的分割符號 os.linesep 給出當前平臺使用的行終止符。例如,Windows使用'\r\n',Linux使用'\n' 而Mac使用'\r'
os.path.isdir(path) 判斷某一路徑是否爲目錄
os.path.isfile(path) 判斷某一路徑是否爲文件
os.walk(top, topdown=True, onerror=None, followlinks=False)
其中: top是要遍歷的目錄。
topdown是代表要從上而下遍歷還是從下往上遍歷。
onerror可以用來設置當遍歷出現錯誤的處理函數(該函數接受一個OSError的實例作爲參數),設置爲空不作處理。
followlinks表示是否要跟隨目錄下的鏈接去繼續遍歷,要注意的是,os.walk不會記錄已經遍歷的目錄,所以跟隨鏈接遍歷的話有可能一直循環調用下去。
os.walk返回的是一個3個元素的元組 (root, dirs, files) ,分別表示遍歷的路徑名,該路徑下的目錄列表和該路徑下文件列表。注意目錄列表和文件列表不是具體路徑,需要具體路徑(從root開始的路徑)的話可以用 os.path.join(root,dir) .
2.os.walk()和os.listdir()區別:
os.listdir() 方法用於返回指定的文件夾包含的文件或文件夾的名字的列表。這個列表以字母順序。 它不包括 '.' 和'..' 即使它在文件夾中。
os.walk() 方法用於通過在目錄樹中輸出在目錄中的文件名,向上或者向下。
情況1:在一個目錄下面只有文件,沒有文件夾,這個時候可以使用os.listdir
在我們的桌面上有一個file目錄(文件夾),裏面有三個文件
file(dir)
--|test1.txt
--|test2.txt
--|test3.txt
用下面的程序獲得文件的絕對路徑:
import os
path = r'C:\Users\Administrator\Desktop\file'
for filename in os.listdir(path):
print(os.path.join(path,filename))
使用os.listdir讀取到一個目錄下面所有的文件名,然後使用os.path.join把目錄的路徑和文件名結合起來,就得到了文件的絕路路徑,結果如下:
C:\Users\Administrator\Desktop\file\test1.txt
C:\Users\Administrator\Desktop\file\test2.txt
C:\Users\Administrator\Desktop\file\test3.txt
情況2:遞歸的情況,一個目錄下面既有目錄(目錄下面還可能有目錄和文件)也有文件,如何讀取裏面所有文件,使用os.walk:
我們在桌面上面建立一個file目錄,裏面的組織結構如下:
file(dir):
--|file1(dir):
--|file1_test1.txt
--|file1_test2.txt
--|file2(dir)
--|file2_test1.txt
--|file_test1.txt
--|file_test2.txt
運行一下代碼:
import os
path = r'C:\Users\Administrator\Desktop\file'
for dirpath,dirnames,filenames in os.walk(path):
print(dirpath,dirnames,filenames)
輸出結果如下:
C:\Users\Administrator\Desktop\file ['file1', 'file2'] ['file_test1.txt', 'file_test2 .txt']
C:\Users\Administrator\Desktop\file\file1 [] ['file1_test1.txt', 'file1_test2.txt']
C:\Users\Administrator\Desktop\file\file2 [] ['file2_test1.txt']
os.walk輸入一個路徑名稱,以yield的方式(其實是一個生成器)返回一個三元組 dirpath, dirnames, filenames, dirpath爲目錄的路徑,爲一個字符串。比如上面的 C:\Users\Administrator\Desktop\file和C:\Users\Administrator\Desktop\file\file1等。
dirnames列出了目錄路徑下面所有存在的目錄的名稱。比如在 C:\Users\Administrator\Desktop\file下面有兩個目錄:file1和file2,那麼它就列出了這個目錄路徑下的目錄名稱。
filenames列出了目錄路徑下面所有文件的名稱。同樣在 C:\Users\Administrator\Desktop\file下面有兩個文件file_test1.txt和file_test2 .txt,那麼程序將會列出這兩個文件名。
如何獲得一個路徑下面所有的文件路徑:
import os
path = r'C:\Users\Administrator\Desktop\file'
for dirpath,dirnames,filenames in os.walk(path):
for filename in filenames:
print(os.path.join(dirpath,filename))
得到的結果如下:
C:\Users\Administrator\Desktop\file\file_test1.txt
C:\Users\Administrator\Desktop\file\file_test2 .txt
C:\Users\Administrator\Desktop\file\file1\file1_test1.txt
C:\Users\Administrator\Desktop\file\file1\file1_test2.txt
C:\Users\Administrator\Desktop\file\file2\file2_test1.txt