昨天在上廁所的時候突發奇想,當你把usb插進去的時候,能不能自動執行usb上的程序。查了一下,發現只有windows上可以,具體的大家也可以搜索(搜索關鍵詞usb autorun)到。但是,如果我想,比如,當一個usb插入時,在後臺自動把usb裏的重要文件神不知鬼不覺地拷貝到本地或者上傳到某個服務器,就需要特殊的軟件輔助。
於是我心想,能不能用python寫一個程序,讓它在後臺運行。每當有u盤插入的時候,就自動拷貝其中重要文件。
如何判斷U盤的插入與否?
首先我們打開電腦終端,進入/Volumes目錄,這時候插入U盤,可以發現它被掛載在了這個目錄之下,也就是說,我們只要在固定時間掃描這個目錄,當這個目錄有新文件夾出現的時候,很可能有U盤被插入了。
我的設計是這樣的,用time.sleep(3)函數,讓程序保持運行狀態,並且每隔三秒查看一下/Volumes/目錄,如果多出來文件夾,就將其拷貝到另外的文件夾。
# encoding=utf-8
from time import sleep
import os, shutil
usb_path = "/Volumes/"
content = os.listdir(usb_path) # os.listdir(路徑)返回路徑下所有文件以及文件夾的名稱
while True:
new_content = os.listdir(usb_path) #每隔三秒掃描一次/Volumes/
if new_content != content: # 如果發現異常,即多出一個文件夾,則退出
break;
sleep(3)
x = [item for item in new_content if item not in content]
# 找到那個新文件夾,返回包括新文件夾string類型名稱的列表,這個表達方法很pythonic
shutil.copytree(os.path.join(usb_path, x[0]), '/Users/home/usb_copy')
# shutil.copytree 把目錄下所有東西一股腦複製進/Users/home/usb_copy,
# 放進了自己的home目錄下
就像標題所示,我們真的只用了10行(其實是11行,湊個整:)完成了這個“病毒”。我們可以發現usb中的目錄,在插入半分鐘後全部躺在了home目錄下了。
如何選擇性的複製文件?
剛剛我們寫了一個很簡易的腳本測試了一下這個想法的可行性,但是還是有問題。剛纔之所以能把U盤中所有文件很快複製進去,是因爲U盤中只有兩三個文件,大小不超過15M。如果目標U盤中有很多電影,音樂,這些我們並不需要的文件,我們的程序就應該能跳過它們,僅僅選擇一些重要的比如.docx比如.ppt文件,或者僅僅複製最近修改過的那些文件,或者排除所有大小大於5M的文件。我們可以用python做到嗎?當然!
os.walk 遞歸文件夾中所有文件
Python os.walk() 的使用方法可以諮詢我來獲取
還是舉個例子吧。
我在某目錄下創建了testwalk文件夾,裏面有file123.txt三個文件,folder123三個文件夾,其中folder1中有文件file4.txt以及folder4
➜ testwalk touch file1.txt file2.txt file3.txt
➜ testwalk mkdir folder1 folder2 folder3
➜ testwalk cd folder1
➜ folder1 touch file4.txt && mkdir folder4
➜ folder1 cd ..
# 上面創建了這些文件以及文件夾,你也可以在圖形界面上創建
# tree 是個很好玩的命令,可以直觀地顯示文件路徑
➜ testwalk tree ./
testwalk/
├── file1.txt
├── file2.txt
├── file3.txt
├── folder1
│ ├── file4.txt
│ └── folder4
├── folder2
└── folder3
4 directories, 4 files
現在我們來測試一下
import os
for root, dirs, files in os.walk("./testwalk/"):
for name in files:
print(os.path.join(root, name))
for name in dirs:
print(os.path.join(root, name))
-----------------------------------------------------------------------------
運行結果:
./testwalk/folder1/file4.txt
./testwalk/folder1/folder4
./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1
root存放的是當前位置,它會把./testwalk/下所有的文件夾作爲根目錄,往下搜索
for root, dirs, files in os.walk("./testwalk/", topdown=False):
print(root)
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1/folder4
./testwalk/folder1
./testwalk/
單獨查看 dirs
for root, dirs, files in os.walk("./testwalk/"):
for name in dirs:
print(os.path.join(root, name))
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1
./testwalk/folder1/folder4
單獨查看 files
for root, dirs, files in os.walk("./testwalk/", topdown=False):
for name in files:
print(os.path.join(root, name))
./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder1/file4.txt
好了,我們現在需要遞歸usb文件夾,找到所有的file,查看大小,如果小於,比如3M,就拷貝進home,大於就捨去。
在這裏還是要推薦下我自己建的Python開發學習羣:725479218,羣裏都是學Python開發的,如果你正在學習Python ,小編歡迎你加入,大家都是軟件開發黨,不定期分享乾貨(只有Python軟件開發相關的),包括我自己整理的一份2018最新的Python進階資料和高級開發教程,歡迎進階中和進想深入Python的小夥伴
shutil模塊
import shutil
>>> help(shutil)
>>> dir(shutil)
['Error', 'ExecError', 'SpecialFileError', 'WindowsError',
'_ARCHIVE_FORMATS', '_BZ2_SUPPORTED', '_ZLIB_SUPPORTED', '__all__',
'__builtins__', '__doc__', '__file__', '__name__', '__package__',
'_basename', '_call_external_zip', '_destinsrc', '_get_gid', '_get_uid',
'_make_tarball', '_make_zipfile', '_samefile', 'abspath',
'collections', 'copy', 'copy2', 'copyfile', 'copyfileobj',
'copymode', 'copystat', 'copytree', 'errno', 'fnmatch',
'get_archive_formats', 'getgrnam', 'getpwnam', 'ignore_patterns',
'make_archive', 'move', 'os', 'register_archive_format', 'rmtree',
'stat', 'sys', 'unregister_archive_format']
好吧,看不懂,還是得看官方文檔。
現在我們拿剛纔的文件夾舉例子,如果想把file1.txt拷貝到folder2:
>>> shutil.copy2('./file1.txt', './folder2')
------------------------------------------------我是分割線-----------
➜ folder2 ls
file1.txt
還有許多使用工具在shutil裏面這裏就不詳述了。
os.path.getsize()判斷大小
os.path.getsize(文件名)返回的是一個單位爲byte的數值,如果用來查看文件大小,我們則需要手動寫一個函數,將其換算成容易閱讀的形式。
movie = /Users/home/somemovie.rmvb
def convert_bytes(num):
# this function will convert bytes to MB.... GB... etc
for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
if num < 1024.0:
return "%3.1f %s" % (num, x)
num /= 1024.0
def getDocSize(path):
try:
size = os.path.getsize(path)
return size
except Exception as err:
print(err)
print(convert_bytes(getDocSize(movie)))
結果:
1.3 GB
[Finished in 0.1s]
這裏我們只要選擇文件大小小於3M的即可,3M = 3 * 1024kB = 3 * 1024*1024byte
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
for name in files:
file = os.path.join(root, name)
if os.path.getsize(file) < 3*1024*1024:
shutil.copy2(file, target_folder)
結合shutil.copy2就可以把選定大小的文件複製進我們的目標文件夾了
如何指定文件類型
這裏就需要正則表達式來幫助我們了。
正則表達式內容很多,《python核心編程》中用了整整一章來講,所以我們也不深入了。下面是官方文檔,感興趣的可以看一下。
7.2. re - Regular expression operations - Python 2.7.14 documentation
如下,我們讓指定文件後綴以及指定文件大小可以複製進我們的目標文件:
別忘了導入 re
import re
...
regex_filename = re.compile('(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)')
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
for name in files:
file = os.path.join(root, name)
if regex_filename.match(file) and os.path.getsize(file) < 1024*1024:
shutil.copy2(file, target_folder)
用更加複雜的正則表達式可以更好地指定文件類型
根據修改時間篩選文件
>>> from os.path import *
>>> help(getmtime)
getmtime(filename)
Return the last modification time of a file, reported by os.stat().
>>> help(getctime)
getctime(filename)
Return the metadata change time of a file, reported by os.stat().
這時候我在目錄下創建了一個文件叫做newfile
>>> getctime("newfile")
1522746383.716875
# 我們可以看到返回的time是從某個時間到現在的秒數,如需閱讀,我們需要time.ctime來轉換
>>> import time
>>> time.ctime(1522746383.716875)
'Tue Apr 3 17:06:23 2018' # 這就是剛纔創建的時間啦
>>> help(time.ctime)ctime(...) # 查看文檔
ctime(seconds) -> string
Convert a time in seconds since the Epoch to a string in local time.
This is equivalent to asctime(localtime(seconds)). When the time tuple is
not present, current time as returned by localtime() is used.
總之,對每一個文件進行修改時間的篩選可以只複製那些近期,或者特定時期修改或者添加過的文件,這個功能在特定情況下很有用。
總結
其實,標題這麼起只是爲了吸引大家注意,這就是一個小程序,也談不上病毒。我更想通過這個例子,展示python對於文件處理的強大能力,引發大家的學習熱情。以上實現都是基於macos,linux應該一樣,windows稍加修改也可以成功。