一、基礎知識
os. walk()目錄遍歷器,用於通過在目錄樹中游走,輸出在目錄中向上或者向下的文件名。
walk()方法語法格式如下:
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
1、top -- 是你所要遍歷的目錄的地址, 返回的是一個三元組(root,dirs,files)。
root 所指的是當前正在遍歷的這個文件夾的本身的地址
dirs 是一個 list ,內容是該文件夾中所有的目錄的名字(不包括子目錄)
files 同樣是 list , 內容是該文件夾中所有的文件(不包括子目錄)
2、topdown --可選,爲 True,則優先遍歷 top 目錄,否則優先遍歷 top 的子目錄(默認爲開啓)。如果 topdown 參數爲 True,walk 會遍歷top文件夾,與top 文件夾中每一個子目錄。
3、onerror -- 可選,需要一個 callable 對象,當 walk 需要異常時,會調用。
4、followlinks -- 可選,如果爲 True,則會遍歷目錄下的快捷方式(linux 下是軟連接 symbolic link )實際所指的目錄(默認關閉),如果爲 False,則優先遍歷 top 的子目錄。
二、牛刀小試
1、打印目錄E:\Scrapy爬蟲框架視頻\下的所有文件夾及文件。
import os
for root, dirs, files in os.walk('E:\\Scrapy爬蟲框架視頻\\'):
for dir in dirs:
print(os.path.join(root, dir))
for file in files:
print(os.path.join(root,file))
2、獲取後綴名爲.mp4的所有文件