通過python腳本,可以方便地查找、並刪除滿足指定條件的文件/文件夾。
相關接口介紹
獲取命令行參數
爲了方便使用,需要把查找的目錄與過濾條件通過參數的方式傳遞給腳本,這時就需要用到sys.argv
和getopt.getopt()
函數。
- sys.argv存放了命令行參數的列表,其中argv[0]爲腳本名稱;
- getopt.getopt:解析Linux樣式的命令行參數;
getopt.getopt(args, shortopts, longopts=[])
- args:要解析的參數列表,一般爲sys.argv[1:];
- shortopts:短選項,爲單個字符(去掉
-
後的選項名),若後面緊跟冒號,表示參數選項(後面需要跟參數,可以直接跟參數或空格後跟參數),否則爲開關選項;如hf:
(XX.py -h -f files
); - longopts:長選項列表,去掉
--
後的選項名;若後面緊跟等號,表示參數選項;如['path=']
(XX.py --path=c:\temp
); - 函數返回兩個元素:第一個是(option,value)元組的列表;第二個是args剩餘的參會列表(沒有被解析的);
函數一旦遇到非選項參數(選項沒有在shortopts或longopts中)時,即停止解析;把剩餘的作爲返回值的第二個元素。若要在混合使用選項參數與非選項參數,可使用getopt.gnu_getopt
替代。
若同一個選項參數有多個,則會返回多個元組。
文件搜索
os模塊的walk與scandir可方便遍歷文件:
- os.walk:遍歷指定目錄的文件,返回三個元素(root:當前遍歷的文件夾,dirs:子文件夾列表,files:子文件列表);
- os.scandir:返回文件對象迭代器,可以通過其屬性進行判斷與操作(如stat,is_file);
若要進行文件名模式匹配,則需要使用glob.glob(pathname, *, recursive=False)
:
- pathname:要搜索的文件;使用*匹配零或多個字符,使用?匹配任意一個字符;
- recursive:是否遞歸;爲true時,使用
**
匹配匹配任意層目錄(tmp\**\*.txt
;則搜索tmp目錄及其所有子目錄下的txt文件);
文件刪除
Python中有多個函數刪除文件與文件夾:
- 刪除文件:os.remove,只讀文件無法刪除,需要先用
os.chmod(f, stat.S_IWRITE)
去掉只讀屬性; - 刪除空文件夾:os.rmdir;
- 遞歸刪除空文件夾:os.removedirs,必須保證不包含子文件;
若要遞歸刪除非空文件夾,需要使用shutil模塊(包含文件複製、移動、刪除等操作)。shutil.rmtree(path, ignore_errors=False, onerror=None)
若要刪除包含只讀文件文件夾,可以提供onerror(unction, path, excinfo)
回調函數,在刪除失敗時,去掉只讀屬性。
示例
以下是一個刪除文件/文件夾的完成程序,一次可以傳遞多個過濾條件,如:rmDirs -p c:\test -f *.log -f debug
import os,sys,getopt
import stat,glob,shutil
def readonlyHandle(func, fPath, execInfo):
os.chmod(fPath, stat.S_IWRITE) # read-only file
func(fPath) # the function call this
def rmDirRecurse(fPath, fFilter):
fRoot = os.path.join(fPath, '**', fFilter)
print('To find:', fRoot)
files = glob.glob(fRoot, recursive=True)
if not files:
print('No file found')
return
for f in files:
if os.path.isdir(f):
print('to del-dir:', f)
shutil.rmtree(f, onerror=readonlyHandle)
else:
print('to del-file', f)
os.chmod(f, stat.S_IWRITE) # ensure we can del readonly-file
os.remove(f)
if __name__ == '__main__':
try:
opts, args = getopt.getopt(sys.argv[1:], 'hp:f:', ['path=', 'filter='])
except getopt.GetoptError:
print('rmDirs -p <Path to find> -f <filter>')
sys.exit(2)
fPath = None
fFilter = []
for op, v in opts:
if op in ('-p', '--path'):
fPath = v
if op in ('-f', 'filter'):
fFilter.append(v) # multi filter
if not fPath or not fFilter:
print('rmDirs -p <Path to find> -f <filter>')
sys.exit(2)
for f in fFilter:
rmDirRecurse(fPath, f)