Python3 文件操作

Python3 文件操作

講師:張學亮 百度:學亮編程手記 網易雲課堂:@張學亮

open() 方法

Python open() 方法用於打開一個文件,並返回文件對象,在對文件進行處理過程都需要使用到這個函數,如果該文件無法被打開,會拋出 OSError。

**注意:**使用 open() 方法一定要保證關閉文件對象,即調用 close() 方法。

open() 函數常用形式是接收兩個參數:文件名(file)和模式(mode)。

open(file, mode='r')

完整的語法格式爲:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

參數說明:

  • file: 必需,文件路徑(相對或者絕對路徑)。
  • mode: 可選,文件打開模式
  • buffering: 設置緩衝
  • encoding: 一般使用utf8
  • errors: 報錯級別
  • newline: 區分換行符
  • closefd: 傳入的file參數類型
  • opener

mode 參數有:

模式 描述
t 文本模式 (默認)。
x 寫模式,新建一個文件,如果該文件已存在則會報錯。
b 二進制模式。
+ 打開一個文件進行更新(可讀可寫)。
U 通用換行模式(Python 3 不支持)。
r 以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。
rb 以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。這是默認模式。一般用於非文本文件如圖片等。
r+ 打開一個文件用於讀寫。文件指針將會放在文件的開頭。
rb+ 以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。一般用於非文本文件如圖片等。
w 打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
wb 以二進制格式打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。
w+ 打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
wb+ 以二進制格式打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。一般用於非文本文件如圖片等。
a 打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。
ab 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。
a+ 打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。
ab+ 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。

默認爲文本模式,如果要以二進制模式打開,加上 b

file 對象

file 對象使用 open 函數來創建,下表列出了 file 對象常用的函數:

序號 方法及描述
1 file.close()關閉文件。關閉後文件不能再進行讀寫操作。
2 file.flush()刷新文件內部緩衝,直接把內部緩衝區的數據立刻寫入文件, 而不是被動的等待輸出緩衝區寫入。
3 file.fileno()返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。
4 file.isatty()如果文件連接到一個終端設備返回 True,否則返回 False。
5 file.next()**Python 3 中的 File 對象不支持 next() 方法。**返回文件下一行。
6 [file.read(size])從文件讀取指定的字節數,如果未給定或爲負則讀取所有。
7 [file.readline(size])讀取整行,包括 “\n” 字符。
8 [file.readlines(sizeint])讀取所有行並返回列表,若給定sizeint>0,返回總和大約爲sizeint字節的行, 實際讀取值可能比 sizeint 較大, 因爲需要填充緩衝區。
9 [file.seek(offset, whence])移動文件讀取指針到指定位置
10 file.tell()返回文件當前位置。
11 [file.truncate(size])從文件的首行首字符開始截斷,截斷文件爲 size 個字符,無 size 表示從當前位置截斷;截斷之後後面的所有字符被刪除,其中 Widnows 系統下的換行代表2個字符大小。
12 file.write(str)將字符串寫入文件,返回的是寫入的字符長度。
13 file.writelines(sequence)向文件寫入一個序列字符串列表,如果需要換行則要自己加入每行的換行符。

一、文件操作

使用python來讀寫文件使用open()函數來打開一個文件,獲取到文件句柄,然後通過文件句柄就可以進行各種操作了。根據打開方式不同能夠執行的操作也有差異。

打開文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默認使用的是r(只讀)模式

二、只讀操作(r, rb)

file = open("文件名", mode="r", encoding="utf-8")
content = file.read()
print(content)
file.close()

要注意encoding表示編碼集

rb讀取出來的數據是bytes類型,在rb模式下,不能選擇encoding字符集

file = open("文件名", mode="rb")
content = file.read()
print(content)
file.close()

rb的作用是在讀取非文本文件的時候,比如讀取音視頻等信息的時候就要用到rb

讀取文件的方法:

1.read()將文件中的內容全部讀取出來;佔內存。如果文件過大,容易導致內存崩潰

2.read(n)讀取n個字符;注意,如果再次讀取就會在當前位置繼續去讀而不是從頭讀,如果是rb模式則讀取出來的是n個字節

3.readline()一次讀取一行數據,每次讀取出來的數據結尾都會有一個\n,所以要使用strip()方法來去掉\n或者空格

4.readlines()將每一行形成一個元素,放到一個列表中;將所有內容都讀取出來,所以也是佔內存大

5.循環讀取,這是最建議使用的方式,每次讀取一行內容。

注意:讀取完的文件句柄一定要關閉 f.close()

三、寫模式(w, wb)

寫的時候,如果沒有文件,則會創建文件,如果文件存在,則將原來文件中原內容刪除,再寫入新內容

file = open("文件名", mode="w", encoding="utf-8")
file.write("寫內容")
file.flush()
file.close()

wb模式下可以不指定打開文件的編碼,但是在寫文件的時候必須將字符串轉化成utf8的bytes數據

file = open("文件名", mode="wb")
file.write("寫內容".encode("utf-8"))
file.flush()
file.close()

四、追加(a, ab)

在追加模式下,我們寫入的內容會追加在文件結尾

五、讀寫模式(r+, r+b)

對於讀寫模式,必須是先讀,因爲默認光標是在開頭的,準備讀取的;當讀完了之後再進行寫入,使用頻率最高的模式就是r+

file = open("文件名", mode="r+", encoding="utf-8")
content = file.read()
file.write("寫內容")
print(content)
file.flush()
file.close()

六、寫讀(w+, w+b)

先將所有的內容清空,然後寫入,最後讀取,但是讀取的內容是空的,不常用。

file = open("文件名", mode="w+", encoding="utf-8")
file.write("寫內容")
content = file.read()
print(content)
file.flush()
file.close()

七、追加讀(a+)

a+模式下,不論先讀還是後讀,都讀取不到數據;

八、其他相關操作

1.seek(n)

光標移動到n位置,注意,移動的單位是byte,所以如果是utf-8的中文部分要是3的倍數。

通常我們使用seek都是移動到開頭或者結尾

移動到開頭:seek(0)

移動到結尾:seek(0,2)

seek的第二個參數表示的是從哪個位置進行偏移,默認是0表示從開頭,1表示當前位置,2表示結尾

file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0)        # 光標移動到開頭
content = file.read()       # 讀取內容,此時光標移動到結尾
print(content)
file.seek(0)        # 再次將光標移動到開頭
file.seek(0,2)       # 將光標移動到結尾
content2 = file.read()    # 讀取內容,什麼都沒有
print(content2)

file.seek(0)      # 移動到開頭
file.write("新寫內容")   # 寫入信息,此時光標在9,中文3*3
file.flush()
file.close()

2.tell()

可以獲取到當前光標在什麼位置

file = open("文件名", mode="r+", encoding="utf-8")
file.seek(0)      # 光標移動到開頭
content = file.read()    # 讀取內容,此時光標移動到結尾
print(content)
file.seek(0)       # 再次將光標移動到開頭
file.seek(0,2)      # 將光標移動到結尾
content2 = file.read()    # 讀取內容,什麼都沒有
print(content2)
file.seek(0)
file.write("寫內容")
print(file.tell())      # 光標位置
file.flush()
file.close()

3.truncate()截斷文件

如果想做截斷的時候,要先移動光標,挪動到想要截斷的位置再進行截斷;

truncate(n),如果給出了n,則從開頭進行截斷,如果不給n,則從當前位置截斷,後面的內容將會被刪除;

注意:在r+模式下,如果讀取了內容,不論讀取內容多少,光標顯示的是多少,再寫入或者操作文件的時候都是在結尾進行的操作。

九、修改文件以及另一種打開文件的方式

文件修改只能將文件中的內容讀取到內存中,將信息修改完畢後再將源文件刪除,將新文件的名字改成老文件的名字

import  os
with open("文件名", mode="r", encoding="utf-8") as file1,\
open("文件名_new", mode="w", encoding="UTF-8") as file2:
    for line in f1:
        new_line = line.replace("大白梨", "冰糖葫蘆")
        file2.write(new_line)
os.remove("文件名") # 刪除源⽂文件
os.rename("文件名_new", "文件名") # 重命名新⽂文件    

代碼演示:

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章