Python3 File(文件) 方法
open() 方法
Python open() 方法用於打開一個文件,並返回文件對象,在對文件進行處理過程都需要使用到這個函數,如果該文件無法被打開,會拋出 OSError。
注意:使用 open() 方法一定要保證關閉文件對象,即調用 close() 方法。
open() 函數常用形式是接收兩個參數:文件名(file)和模式(mode)。
open(file, mode='r')
完整的語法格式爲:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
參數說明:
- file: 必需,文件路徑(相對或者絕對路徑)。
- mode: 可選,文件打開模式
- buffering: 設置緩衝
- encoding: 一般使用utf8
- errors: 報錯級別
- newline: 區分換行符
- closefd: 傳入的file參數類型
- opener:
mode 參數有:
模式 |
描述 |
t |
文本模式 (默認)。 |
x |
寫模式,新建一個文件,如果該文件已存在則會報錯。 |
b |
二進制模式。 |
+ |
打開一個文件進行更新(可讀可寫)。 |
U |
通用換行模式(Python 3 不支持)。 |
r |
以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。 |
rb |
以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。這是默認模式。一般用於非文本文件如圖片等。 |
r+ |
打開一個文件用於讀寫。文件指針將會放在文件的開頭。 |
rb+ |
以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。一般用於非文本文件如圖片等。 |
w |
打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。 |
wb |
以二進制格式打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。 |
w+ |
打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。 |
wb+ |
以二進制格式打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。 |
a |
打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。 |
ab |
以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。 |
a+ |
打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。 |
ab+ |
以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。 |
默認爲文本模式,如果要以二進制模式打開,加上 b 。
file 對象
file 對象使用 open 函數來創建,下表列出了 file 對象常用的函數:
序號 |
方法及描述 |
1 |
關閉文件。關閉後文件不能再進行讀寫操作。 |
2 |
刷新文件內部緩衝,直接把內部緩衝區的數據立刻寫入文件, 而不是被動的等待輸出緩衝區寫入。 |
3 |
返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。 |
4 |
如果文件連接到一個終端設備返回 True,否則返回 False。 |
5 |
Python 3 中的 File 對象不支持 next() 方法。 返回文件下一行。 |
6 |
從文件讀取指定的字節數,如果未給定或爲負則讀取所有。 |
7 |
讀取整行,包括 "\n" 字符。 |
8 |
讀取所有行並返回列表,若給定sizeint>0,返回總和大約爲sizeint字節的行, 實際讀取值可能比 sizeint 較大, 因爲需要填充緩衝區。 |
9 |
移動文件讀取指針到指定位置 |
10 |
返回文件當前位置。 |
11 |
從文件的首行首字符開始截斷,截斷文件爲 size 個字符,無 size 表示從當前位置截斷;截斷之後後面的所有字符被刪除,其中 Widnows 系統下的換行代表2個字符大小。 |
12 |
將字符串寫入文件,返回的是寫入的字符長度。 |
13 |
向文件寫入一個序列字符串列表,如果需要換行則要自己加入每行的換行符。 |
解決讀寫文件編碼亂碼問題:
from bs4 import BeautifulSoup
import requests
url = "http://www.baidu.com/"
r = requests.get(url)
r.encoding = r.apparent_encoding
demo = r.text
demo =demo.encode() #文件編碼
with open('test.html', 'wb') as f:
f.write(demo)
f.close()
with open('weather.html','rb') as f:
dfile = f.read()
f.close()
demo=demo.decode() #文件解碼
dfile=dfile.decode()
print("demo")
print(demo)
print("dfile")
print(dfile)