十行代碼--用python寫一個USB病毒 (知乎 DeepWeaver)

昨天在上廁所的時候突發奇想,當你把usb插進去的時候,能不能自動執行usb上的程序。查了一下,發現只有windows上可以,具體的大家也可以搜索(搜索關鍵詞usb autorun)到。但是,如果我想,比如,當一個usb插入時,在後臺自動把usb裏的重要文件神不知鬼不覺地拷貝到本地或者上傳到某個服務器,就需要特殊的軟件輔助。

於是我心想,能不能用python寫一個程序,讓它在後臺運行。每當有u盤插入的時候,就自動拷貝其中重要文件。

如何判斷U盤的插入與否?

首先我們打開電腦終端,進入/Volumes目錄,這時候插入U盤,可以發現它被掛載在了這個目錄之下,也就是說,我們只要在固定時間掃描這個目錄,當這個目錄有新文件夾出現的時候,很可能有U盤被插入了。

我的設計是這樣的,用time.sleep(3)函數,讓程序保持運行狀態,並且每隔三秒查看一下/Volumes/目錄,如果多出來文件夾,就將其拷貝到另外的文件夾。

# encoding=utf-8
from time import sleep
import os, shutil
usb_path = "/Volumes/"
content = os.listdir(usb_path) # os.listdir(路徑)返回路徑下所有文件以及文件夾的名稱
while True:
    new_content = os.listdir(usb_path) #每隔三秒掃描一次/Volumes/
    if new_content != content: # 如果發現異常,即多出一個文件夾,則退出
        break;
    sleep(3)
x = [item for item in new_content if item not in content]
# 找到那個新文件夾,返回包括新文件夾string類型名稱的列表,這個表達方法很pythonic
shutil.copytree(os.path.join(usb_path, x[0]), '/Users/home/usb_copy')
# shutil.copytree 把目錄下所有東西一股腦複製進/Users/home/usb_copy, 
# 放進了自己的home目錄下

就像標題所示,我們真的只用了10行(其實是11行,湊個整:)完成了這個“病毒”。我們可以發現usb中的目錄,在插入半分鐘後全部躺在了home目錄下了。

如何選擇性的複製文件?

剛剛我們寫了一個很簡易的腳本測試了一下這個想法的可行性,但是還是有問題。剛纔之所以能把U盤中所有文件很快複製進去,是因爲U盤中只有兩三個文件,大小不超過15M。如果目標U盤中有很多電影,音樂,這些我們並不需要的文件,我們的程序就應該能跳過它們,僅僅選擇一些重要的比如.docx比如.ppt文件,或者僅僅複製最近修改過的那些文件,或者排除所有大小大於5M的文件。我們可以用python做到嗎?當然!

os.walk 遞歸文件夾中所有文件

Python os.walk() 的使用方法可以諮詢我來獲取

還是舉個例子吧。

我在某目錄下創建了testwalk文件夾,裏面有file123.txt三個文件,folder123三個文件夾,其中folder1中有文件file4.txt以及folder4

➜  testwalk touch file1.txt file2.txt file3.txt
➜  testwalk mkdir folder1 folder2 folder3
➜  testwalk cd folder1
➜  folder1 touch file4.txt && mkdir folder4
➜  folder1 cd ..
# 上面創建了這些文件以及文件夾,你也可以在圖形界面上創建
# tree 是個很好玩的命令,可以直觀地顯示文件路徑
➜  testwalk tree ./
testwalk/
├── file1.txt
├── file2.txt
├── file3.txt
├── folder1
│   ├── file4.txt
│   └── folder4
├── folder2
└── folder3

4 directories, 4 files

現在我們來測試一下

import os
for root, dirs, files in os.walk("./testwalk/"):
    for name in files:
        print(os.path.join(root, name))
    for name in dirs:
        print(os.path.join(root, name))
-----------------------------------------------------------------------------
運行結果:
./testwalk/folder1/file4.txt
./testwalk/folder1/folder4
./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1

root存放的是當前位置,它會把./testwalk/下所有的文件夾作爲根目錄,往下搜索

for root, dirs, files in os.walk("./testwalk/", topdown=False):
    print(root)
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1/folder4
./testwalk/folder1
./testwalk/

單獨查看 dirs

for root, dirs, files in os.walk("./testwalk/"):
    for name in dirs:
        print(os.path.join(root, name))

./testwalk/folder2
./testwalk/folder3
./testwalk/folder1
./testwalk/folder1/folder4

單獨查看 files

for root, dirs, files in os.walk("./testwalk/", topdown=False):
    for name in files:
        print(os.path.join(root, name))

./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder1/file4.txt

好了,我們現在需要遞歸usb文件夾,找到所有的file,查看大小,如果小於,比如3M,就拷貝進home,大於就捨去。


  在這裏還是要推薦下我自己建的Python開發學習羣:725479218,羣裏都是學Python開發的,如果你正在學習Python ,小編歡迎你加入,大家都是軟件開發黨,不定期分享乾貨(只有Python軟件開發相關的),包括我自己整理的一份2018最新的Python進階資料和高級開發教程,歡迎進階中和進想深入Python的小夥伴


shutil模塊

import shutil
>>> help(shutil)
>>> dir(shutil)
['Error', 'ExecError', 'SpecialFileError', 'WindowsError', 
'_ARCHIVE_FORMATS', '_BZ2_SUPPORTED', '_ZLIB_SUPPORTED', '__all__',
 '__builtins__', '__doc__', '__file__', '__name__', '__package__',
 '_basename', '_call_external_zip', '_destinsrc', '_get_gid', '_get_uid',
 '_make_tarball', '_make_zipfile', '_samefile', 'abspath', 
'collections', 'copy', 'copy2', 'copyfile', 'copyfileobj',
 'copymode', 'copystat', 'copytree', 'errno', 'fnmatch', 
'get_archive_formats', 'getgrnam', 'getpwnam', 'ignore_patterns', 
'make_archive', 'move', 'os', 'register_archive_format', 'rmtree', 
'stat', 'sys', 'unregister_archive_format']

好吧,看不懂,還是得看官方文檔

現在我們拿剛纔的文件夾舉例子,如果想把file1.txt拷貝到folder2:

>>> shutil.copy2('./file1.txt', './folder2')
------------------------------------------------我是分割線-----------
➜  folder2 ls
file1.txt

還有許多使用工具在shutil裏面這裏就不詳述了。

os.path.getsize()判斷大小
os.path.getsize(文件名)返回的是一個單位爲byte的數值,如果用來查看文件大小,我們則需要手動寫一個函數,將其換算成容易閱讀的形式。

movie = /Users/home/somemovie.rmvb
def convert_bytes(num):
#   this function will convert bytes to MB.... GB... etc
    for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
        if num < 1024.0:
            return "%3.1f %s" % (num, x)
        num /= 1024.0

def getDocSize(path):
    try:
        size = os.path.getsize(path)
        return size
    except Exception as err:
        print(err)
print(convert_bytes(getDocSize(movie)))

結果:
1.3 GB
[Finished in 0.1s]

這裏我們只要選擇文件大小小於3M的即可,3M = 3 * 1024kB = 3 * 1024*1024byte

for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if os.path.getsize(file) < 3*1024*1024:
            shutil.copy2(file, target_folder)

結合shutil.copy2就可以把選定大小的文件複製進我們的目標文件夾了

如何指定文件類型

這裏就需要正則表達式來幫助我們了。

正則表達式內容很多,《python核心編程》中用了整整一章來講,所以我們也不深入了。下面是官方文檔,感興趣的可以看一下。

7.2. re - Regular expression operations - Python 2.7.14 documentation

如下,我們讓指定文件後綴以及指定文件大小可以複製進我們的目標文件:

別忘了導入 re

import re
...
regex_filename = re.compile('(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)')
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if regex_filename.match(file) and os.path.getsize(file) < 1024*1024:
            shutil.copy2(file, target_folder)

用更加複雜的正則表達式可以更好地指定文件類型

根據修改時間篩選文件

>>> from os.path import *
>>> help(getmtime)
getmtime(filename)
    Return the last modification time of a file, reported by os.stat().

>>> help(getctime)
getctime(filename)
    Return the metadata change time of a file, reported by os.stat().

這時候我在目錄下創建了一個文件叫做newfile

>>> getctime("newfile")
1522746383.716875
# 我們可以看到返回的time是從某個時間到現在的秒數,如需閱讀,我們需要time.ctime來轉換
>>> import time
>>> time.ctime(1522746383.716875)
'Tue Apr  3 17:06:23 2018' # 這就是剛纔創建的時間啦
>>> help(time.ctime)ctime(...) # 查看文檔
    ctime(seconds) -> string

    Convert a time in seconds since the Epoch to a string in local time.
    This is equivalent to asctime(localtime(seconds)). When the time tuple is
    not present, current time as returned by localtime() is used.

總之,對每一個文件進行修改時間的篩選可以只複製那些近期,或者特定時期修改或者添加過的文件,這個功能在特定情況下很有用。

總結

其實,標題這麼起只是爲了吸引大家注意,這就是一個小程序,也談不上病毒。我更想通過這個例子,展示python對於文件處理的強大能力,引發大家的學習熱情。以上實現都是基於macos,linux應該一樣,windows稍加修改也可以成功。

發佈了131 篇原創文章 · 獲贊 123 · 訪問量 31萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章