總結:IO即各個部分之間輸入和輸出,有同步和異步之分
內容:IO
1 IO--讀取文件
使用Python內置的open()
函數,傳入文件名和標示符:
>>> f = open('/Users/michael/test.txt', 'r')
標示符'r'表示讀,這樣,我們就成功地打開了一個文件
如果文件打開成功,接下來,調用read()
方法可以一次讀取文件的全部內容,Python把內容讀到內存,用一個str
對象表示:
>>> f.read()
'Hello, world!'
最後一步是調用close()
方法關閉文件。文件使用完畢後必須關閉,因爲文件對象會佔用操作系統的資源,並且操作系統同一時間能打開的文件數量也是有限的:
>>> f.close()
由於文件讀寫時都有可能產生IOError
,一旦出錯,後面的f.close()
就不會調用。所以,Python引入了with
語句來自動幫我們調用close()
方法:
with open('/path/to/file', 'r') as f:
print(f.read())
和前面的try
... finally
是一樣的,但是代碼更佳簡潔,並且不必調用f.close()
方法
如果文件很小,read()
一次性讀取最方便;如果不能確定文件大小,反覆調用read(size)
比較保險;如果是配置文件,調用readlines()
最方便
2打開二進制
要讀取二進制文件,比如圖片、視頻等等,用'rb'
模式打開文件即可:
>>> f = open('/Users/michael/test.jpg', 'rb')
>>> f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六進制表示的字節
3StringIO
StringIO顧名思義就是在內存中讀寫str
創建一個StringIO,然後,像文件一樣寫入即可:
>>> from io import StringIO
>>> f = StringIO()
>>> f.write('hello')
5
>>> f.write(' ')
1
>>> f.write('world!')
6
>>> print(f.getvalue())
hello world!
getvalue()
方法用於獲得寫入後的str
讀取:
>>> from io import StringIO
>>> f = StringIO('Hello!\nHi!\nGoodbye!')
>>> while True:
... s = f.readline()
... if s == '':
... break
... print(s.strip())
...
Hello!
Hi!
Goodbye!
4BytesIO
如果要操作二進制數據,就需要使用BytesIO。
BytesIO實現了在內存中讀寫bytes,我們創建一個BytesIO,然後寫入一些bytes:
>>> from io import BytesIO
>>> f = BytesIO()
>>> f.write('中文'.encode('utf-8'))
6
>>> print(f.getvalue())
b'\xe4\xb8\xad\xe6\x96\x87'
請注意,寫入的不是str,而是經過UTF-8編碼的bytes。
和StringIO類似,可以用一個bytes初始化BytesIO,然後,像讀文件一樣讀取:
>>> from io import StringIO
>>> f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
>>> f.read()
b'\xe4\xb8\xad\xe6\x96\x87'
5環境變量
在操作系統中定義的環境變量,全部保存在os.environ
這個變量中,可以直接查看:
>>> os.environ
environ({'VERSIONER_PYTHON_PREFER_32_BIT': 'no', 'TERM_PROGRAM_VERSION': '326', 'LOGNAME': 'michael', 'USER': 'michael', 'PATH': '/usr/bin:/bin:/usr/sbin:/sbin:/usr/local/bin:/opt/X11/bin:/usr/local/mysql/bin', ...})
要獲取某個環境變量的值,可以調用os.environ.get('key')
:
>>> os.environ.get('PATH')
'/usr/bin:/bin:/usr/sbin:/sbin:/usr/local/bin:/opt/X11/bin:/usr/local/mysql/bin'
>>> os.environ.get('x', 'default')
'default'
6 操作文件和目錄
操作文件和目錄的函數一部分放在os
模塊中,一部分放在os.path
模塊中,這一點要注意一下。查看、創建和刪除目錄可以這麼調用:
# 查看當前目錄的絕對路徑:
>>> os.path.abspath('.')
'/Users/michael'
# 在某個目錄下創建一個新目錄,首先把新目錄的完整路徑表示出來:
>>> os.path.join('/Users/michael', 'testdir')
'/Users/michael/testdir'
# 然後創建一個目錄:
>>> os.mkdir('/Users/michael/testdir')
# 刪掉一個目錄:
>>> os.rmdir('/Users/michael/testdir')
把兩個路徑合成一個時,不要直接拼字符串,而要通過os.path.join()
函數,這樣可以正確處理不同操作系統的路徑分隔符。在Linux/Unix/Mac下,os.path.join()
返回這樣的字符串:
part-1/part-2
而Windows下會返回這樣的字符串:
part-1\part-2
同樣的道理,要拆分路徑時,也不要直接去拆字符串,而要通過os.path.split()
函數,這樣可以把一個路徑拆分爲兩部分,後一部分總是最後級別的目錄或文件名:
>>> os.path.split('/Users/michael/testdir/file.txt')
('/Users/michael/testdir', 'file.txt')
os.path.splitext()
可以直接讓你得到文件擴展名,很多時候非常方便:
>>> os.path.splitext('/path/to/file.txt')
('/path/to/file', '.txt')
這些合併、拆分路徑的函數並不要求目錄和文件要真實存在,它們只對字符串進行操作。
文件操作使用下面的函數。假定當前目錄下有一個test.txt
文件:
# 對文件重命名:
>>> os.rename('test.txt', 'test.py')
# 刪掉文件:
>>> os.remove('test.py')
但是複製文件的函數居然在os
模塊中不存在!原因是複製文件並非由操作系統提供的系統調用。理論上講,我們通過上一節的讀寫文件可以完成文件複製,只不過要多寫很多代碼。
幸運的是shutil
模塊提供了copyfile()
的函數,你還可以在shutil
模塊中找到很多實用函數,它們可以看做是os
模塊的補充。
列出當前目錄下的所有目錄,只需要一行代碼:
>>> [x for x in os.listdir('.') if os.path.isdir(x)]
['.lein', '.local', '.m2', '.npm', '.ssh', '.Trash', '.vim', 'Applications', 'Desktop', ...]
要列出所有的.py
文件,也只需一行代碼:
>>> [x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py']
['apis.py', 'config.py', 'models.py', 'pymonitor.py', 'test_db.py', 'urls.py', 'wsgiapp.py']