Python3 文件操作
講師:張學亮 百度:學亮編程手記 網易雲課堂:@張學亮
open() 方法
Python open() 方法用於打開一個文件,並返回文件對象,在對文件進行處理過程都需要使用到這個函數,如果該文件無法被打開,會拋出 OSError。
**注意:**使用 open() 方法一定要保證關閉文件對象,即調用 close() 方法。
open() 函數常用形式是接收兩個參數:文件名(file)和模式(mode)。
open(file, mode='r')
完整的語法格式爲:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
參數說明:
- file: 必需,文件路徑(相對或者絕對路徑)。
- mode: 可選,文件打開模式
- buffering: 設置緩衝
- encoding: 一般使用utf8
- errors: 報錯級別
- newline: 區分換行符
- closefd: 傳入的file參數類型
- opener
mode 參數有:
模式 | 描述 |
---|---|
t | 文本模式 (默認)。 |
x | 寫模式,新建一個文件,如果該文件已存在則會報錯。 |
b | 二進制模式。 |
+ | 打開一個文件進行更新(可讀可寫)。 |
U | 通用換行模式(Python 3 不支持)。 |
r | 以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。 |
rb | 以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。這是默認模式。一般用於非文本文件如圖片等。 |
r+ | 打開一個文件用於讀寫。文件指針將會放在文件的開頭。 |
rb+ | 以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。一般用於非文本文件如圖片等。 |
w | 打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。 |
wb | 以二進制格式打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。 |
w+ | 打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。 |
wb+ | 以二進制格式打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。 |
a | 打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。 |
ab | 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。 |
a+ | 打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。 |
ab+ | 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。 |
默認爲文本模式,如果要以二進制模式打開,加上 b 。
file 對象
file 對象使用 open 函數來創建,下表列出了 file 對象常用的函數:
序號 | 方法及描述 |
---|---|
1 | file.close()關閉文件。關閉後文件不能再進行讀寫操作。 |
2 | file.flush()刷新文件內部緩衝,直接把內部緩衝區的數據立刻寫入文件, 而不是被動的等待輸出緩衝區寫入。 |
3 | file.fileno()返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。 |
4 | file.isatty()如果文件連接到一個終端設備返回 True,否則返回 False。 |
5 | file.next()**Python 3 中的 File 對象不支持 next() 方法。**返回文件下一行。 |
6 | [file.read(size])從文件讀取指定的字節數,如果未給定或爲負則讀取所有。 |
7 | [file.readline(size])讀取整行,包括 “\n” 字符。 |
8 | [file.readlines(sizeint])讀取所有行並返回列表,若給定sizeint>0,返回總和大約爲sizeint字節的行, 實際讀取值可能比 sizeint 較大, 因爲需要填充緩衝區。 |
9 | [file.seek(offset, whence])移動文件讀取指針到指定位置 |
10 | file.tell()返回文件當前位置。 |
11 | [file.truncate(size])從文件的首行首字符開始截斷,截斷文件爲 size 個字符,無 size 表示從當前位置截斷;截斷之後後面的所有字符被刪除,其中 Widnows 系統下的換行代表2個字符大小。 |
12 | file.write(str)將字符串寫入文件,返回的是寫入的字符長度。 |
13 | file.writelines(sequence)向文件寫入一個序列字符串列表,如果需要換行則要自己加入每行的換行符。 |
一、文件操作
使用python來讀寫文件使用open()函數來打開一個文件,獲取到文件句柄,然後通過文件句柄就可以進行各種操作了。根據打開方式不同能夠執行的操作也有差異。
打開文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默認使用的是r(只讀)模式
二、只讀操作(r, rb)
file = open("文件名", mode="r", encoding="utf-8")
content = file.read()
print(content)
file.close()
要注意encoding表示編碼集
rb讀取出來的數據是bytes類型,在rb模式下,不能選擇encoding字符集
file = open("文件名", mode="rb")
content = file.read()
print(content)
file.close()
rb的作用是在讀取非文本文件的時候,比如讀取音視頻等信息的時候就要用到rb
讀取文件的方法:
1.read()將文件中的內容全部讀取出來;佔內存。如果文件過大,容易導致內存崩潰
2.read(n)讀取n個字符;注意,如果再次讀取就會在當前位置繼續去讀而不是從頭讀,如果是rb模式則讀取出來的是n個字節
3.readline()一次讀取一行數據,每次讀取出來的數據結尾都會有一個\n,所以要使用strip()方法來去掉\n或者空格
4.readlines()將每一行形成一個元素,放到一個列表中;將所有內容都讀取出來,所以也是佔內存大
5.循環讀取,這是最建議使用的方式,每次讀取一行內容。
注意:讀取完的文件句柄一定要關閉 f.close()
三、寫模式(w, wb)
寫的時候,如果沒有文件,則會創建文件,如果文件存在,則將原來文件中原內容刪除,再寫入新內容
file = open("文件名", mode="w", encoding="utf-8")
file.write("寫內容")
file.flush()
file.close()
wb模式下可以不指定打開文件的編碼,但是在寫文件的時候必須將字符串轉化成utf8的bytes數據
file = open("文件名", mode="wb")
file.write("寫內容".encode("utf-8"))
file.flush()
file.close()
四、追加(a, ab)
在追加模式下,我們寫入的內容會追加在文件結尾
五、讀寫模式(r+, r+b)
對於讀寫模式,必須是先讀,因爲默認光標是在開頭的,準備讀取的;當讀完了之後再進行寫入,使用頻率最高的模式就是r+
file = open("文件名", mode="r+", encoding="utf-8")
content = file.read()
file.write("寫內容")
print(content)
file.flush()
file.close()
六、寫讀(w+, w+b)
先將所有的內容清空,然後寫入,最後讀取,但是讀取的內容是空的,不常用。
file = open("文件名", mode="w+", encoding="utf-8")
file.write("寫內容")
content = file.read()
print(content)
file.flush()
file.close()
七、追加讀(a+)
a+模式下,不論先讀還是後讀,都讀取不到數據;
八、其他相關操作
1.seek(n)
光標移動到n位置,注意,移動的單位是byte,所以如果是utf-8的中文部分要是3的倍數。
通常我們使用seek都是移動到開頭或者結尾
移動到開頭:seek(0)
移動到結尾:seek(0,2)
seek的第二個參數表示的是從哪個位置進行偏移,默認是0表示從開頭,1表示當前位置,2表示結尾
file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0) # 光標移動到開頭
content = file.read() # 讀取內容,此時光標移動到結尾
print(content)
file.seek(0) # 再次將光標移動到開頭
file.seek(0,2) # 將光標移動到結尾
content2 = file.read() # 讀取內容,什麼都沒有
print(content2)
file.seek(0) # 移動到開頭
file.write("新寫內容") # 寫入信息,此時光標在9,中文3*3
file.flush()
file.close()
2.tell()
可以獲取到當前光標在什麼位置
file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0) # 光標移動到開頭
content = file.read() # 讀取內容,此時光標移動到結尾
print(content)
file.seek(0) # 再次將光標移動到開頭
file.seek(0,2) # 將光標移動到結尾
content2 = file.read() # 讀取內容,什麼都沒有
print(content2)
file.seek(0)
file.write("寫內容")
print(file.tell()) # 光標位置
file.flush()
file.close()
3.truncate()截斷文件
如果想做截斷的時候,要先移動光標,挪動到想要截斷的位置再進行截斷;
truncate(n),如果給出了n,則從開頭進行截斷,如果不給n,則從當前位置截斷,後面的內容將會被刪除;
注意:在r+模式下,如果讀取了內容,不論讀取內容多少,光標顯示的是多少,再寫入或者操作文件的時候都是在結尾進行的操作。
九、修改文件以及另一種打開文件的方式
文件修改只能將文件中的內容讀取到內存中,將信息修改完畢後再將源文件刪除,將新文件的名字改成老文件的名字
import os
with open("文件名", mode="r", encoding="utf-8") as file1,\
open("文件名_new", mode="w", encoding="UTF-8") as file2:
for line in f1:
new_line = line.replace("大白梨", "冰糖葫蘆")
file2.write(new_line)
os.remove("文件名") # 刪除源⽂文件
os.rename("文件名_new", "文件名") # 重命名新⽂文件
代碼演示: