我與python約個會:29.企業級開發進階1:文件輸入輸出流[IO操作]

農曆五月初一
宜聲明變量"a",提交代碼;忌打DOTA,提交BUG
適宜方位:坐西朝東
多飲水、鮮奶,女神親近指數較高

進入正題

本節內容如下:

  • 什麼是IO
  • 文件內容操作
    • 操作文本文件
    • 操作二進制文件
  • 內存IO
    • 初步認識io模塊
  • 目錄和文件的操作
    • 初步認識os模塊
    • 文件的創建、重命名、刪除
    • 目錄的創建、重命名、刪除
  • 序列化操作

1. 什麼是IO

IO:Input/Output~輸入/輸出的意思
任何編程語言,核心都是對數據的處理,對數據的處理一般情況下就是指代數據的輸入和輸出
常規情況下,我們在程序運行的過程中,將數據頻繁的輸入或者輸出到計算機的內存中,讓程序正常的運行;
由於程序中的數據並不是能持久保存的,所以在一些情況下,我們將數據輸入或者輸出到計算機中的文件中來進行永久保存;
所以各種編程語言中,都提供了豐富並且完善的輸入輸出流的API接口控制數據的輸入和輸出(讀/寫)~

運行中的程序,可以將數據臨時保存在內存中【向內存中輸出數據】,也可以將內存中的數據讀取出來在程序中使用【向程序中輸入數據】

num = 12 # 將一個數據12,賦值給變量numnum和對象12被輸出保存到計算機內存中了
print (num) # 將內存中num對應的數據12讀取到程序中進行答應,num和對應的對象數據12被輸入到程序中了

內存中的數據讀取

同樣,運行中的程序,可以將數據永久保存到文件中【向文件中輸出數據】,也可以從文件中讀取數據到程序中使用【讀取文件數據輸入到程序中】


從文件中讀寫數據

2. python中的輸入/輸出

python中提供了標準的輸入/輸出的語法結構,在之前的章節中已經進行過介紹,我們這裏簡單回顧一下即可
標準輸入:input()函數操作用於接收用戶數據,保存數據的過程就可以將數據寫入到內存中
標準輸出:print()函數用於將指定的數據輸出到控制檯進行展示

msg = input("請輸入個人介紹:")
print("個人介紹:" + msg)

3. python中對文件內容的操作

文件內容也是一種數據,對數據的操作一般情況下可歸結爲增刪改查四種方式
對文件內容的操作,可以歸結爲讀取、覆蓋、追加的操作。

python中對文件內容的操作主要是通過open()函數進行處理的,open()函數的簡單語法結構如下:

open(file, mode="r", buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

# file:是要操作的文件,這裏是完整的問文件路徑+文件名稱,如:d:/test.txt

# mode:是操作默認,默認是r,表示可讀的
####  常規選項如下:
#### r     #### 表示文件以可讀的方式打開,打開的文件只能讀取文件數據,不能修改
#### w     #### 表示文件以可寫的方式打開,可以操作文件中的數據,不能做其他操作
#### x     #### 表示文件以執行的方式打開,主要用於進行文件創建等操作
#### a     #### 表示文件內容以追加的方式打開,向文件寫入數據不會覆蓋原來的數據
#### b     #### 表示文件以二進制的方式進行處理,可以操作二進制數據
#### t     #### 表示文件以文本的方式進行處理,也是默認的方式
#### +     #### 表示文件以讀寫的方式進行處理,是rw結合起來的用法
#### U     #### 表示使用通用的內容換行的方式進行處理

# buffering:表示讀寫內容的緩衝區,如果設置爲0表示關閉緩衝區,通常情況下我們會使用io.DEFAULT_BUFFER_SIZE這個默認值,在不同的操作系統中是4096/8192字節的長度

# encoding:打開文件的編碼,這個選項只能用於操作文本文件的情況下,這個選項的默認值跟文件所在的操作系統有關

# errors:這個選項主要用於在encoding選項進行編碼和解碼出現錯誤時的操作,值是一個字符串,python已經封裝了字符串對應的處理功能;常規的選項如下:
#### strict    #### 使用嚴格模式進行處理,如果出現錯誤就拋出ValueError異常信息
#### ignore    #### 忽略出現的錯誤,這裏需要注意,忽略編碼錯誤會導致數據丟失的!
#### replace   #### 如果出現編碼錯誤,使用特殊符號替換錯誤的編碼,如符號?

# newline:選項用於控制mode爲U時自動換行的處理,可以是如下選項中的一種
#### "None""""\n""\r""\r\n"
3.1. 操作文本文件
  • 讀取文本文件中的數據,可以使用read()函數讀取所有數據或者read(size)讀取指定長度的數據或者readlines()讀取整行數據
# 以只讀的方式打開系統中d:/test.txt文本文件,讀取其中的數據
f = open("d:/test.txt", "r")

# 讀取數據到程序中
content = f.read()

# 使用讀取到的數據
print(content)

# 操作結果,記得關閉文件哦
f.close()

# 執行結果:d:/test.txt中的數據被完整的讀取出來了
~hello python!
~輸入輸出流測試數據!

上述代碼在執行時,如果操作的文件不存在就會出現如下錯誤,請按照之前的錯誤調試章節的內容分析一下錯誤

Traceback (most recent call last):
  File "D:/resp_work/PY_WORK/備課/模塊化開發/demo06/demo01文件操作.py", line 3, in <module>
    f = open("d:/testtxt", "r")
FileNotFoundError: [Errno 2] No such file or directory: 'd:/test.txt'

另外,在讀取文件數據時,一定要注意文件的編碼格式,通常情況下都是使用當前操作系統默認的編碼,也就是在函數處理時忽略encoding選項;如同下面的情況就會出現問題:

我當前系統的默認編碼是gbk編碼,在d:盤下創建了一個test2.txt文件,文件編碼修改成了utf-8編碼,此時執行如下代碼:

f = open("d:/test2.txt", "r")
content = f.read()
print(content)
f.close()

我們可以看到和前面的代碼沒有任何區別,但是執行出現如下問題:

Traceback (most recent call last):
  File "D:/resp_work/PY_WORK/備課/模塊化開發/demo06/demo01文件操作.py", line 26, in <module>
    content = f.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 8: illegal multibyte sequence

這是一個什麼樣的問題呢:報錯提示UnicodeDecodeError也就是編碼錯誤,我們修改程序代碼

f = open("d:/test2.txt", "r", encoding="utf-8")
content = f.read()
print(content)
f.close()

重新執行程序,數據正常讀取了

這是新的文件內容
  • 向文本文件中寫入數據,一般情況下,可以通過write()函數或者writelines()函數向文件中寫入數據
# 以可寫的方式打開d:/test.txt文件
# 這裏請注意,open()函數的mode是w模式,如果目標文件不存在就會自動創建這個文件
f = open("d:/test.txt", "w")

# 通過write()函數向文件中寫入數據
f.write("這是Python從程序中寫入到文件的數據")

# 操作完成,一定記得關閉文件哦
f.close()

python程序寫入文件的數據
  • 向文本文件中追加寫入數據,上面的代碼執行的結果,會將文件中原來的數據覆蓋掉
# 以追加內容的方式打開文件
f = open("d:/test.txt", "a")

# 向文件中追加內容
f.write("這是新的內容")

# 操作完成,記得關閉文件哦
f.close()

我們打開文件可以看到,原來的數據還在,新的數據被追加到了後面


追加寫入數據
3.2. 操作二進制文件
  • 以二進制的方式打開文件讀取文件中的數據【文本文件也可以按照二進制文件的方式讀取】
# 按照二進制的方式讀取文件,mode可以設置爲rb兩個選項配合
f = open("d:/test.txt", "rb")

# 讀取文件數據
content = f.read()

# 使用文件中的數據
print(content)

# 操作完畢,記得關閉文件哦
f.close()

# 執行結果如下:
~b'\xd5\xe2\xca\xc7Python\xb3\xcc\xd0\xf2\xd0\xb4\xc8\xeb\xce\xc4\xbc\xfe\xb5\xc4\xca\xfd\xbe\xdd\xd5\xe2\xca\xc7\xd0\xc2\xb5\xc4\xc4\xda\xc8\xdd'
  • 以二進制的方式,向文件中寫入數據
# 定義要寫入文件中的內容
s = "這是python按照二進制寫入的數據"

# 按照二進制的方式打開文件追加內容,mode可以設置爲ab兩個選項配合
f = open("d:/test.txt", "ab")

# 向文件中寫入數據
f.write(bytes(s, encoding="utf-8"))

# 使用文件中的數據
print(content)

# 操作完畢,記得關閉文件哦
f.close()

bytes(str, encoding="")這是一個將字符串轉換成字節數組的函數,寫入完成後查看文件內容如下:


紅色部分是寫入的二進制數據

4. python中對內存IO

python程序對數據的輸入輸出,不一定都是針對文件的,也可以是針對內存的處理
常規情況下,python提供了StringIOBytesIO兩個內置類來進行內存中數據的處理
注意:需要引入python中的io模塊

  • StringIO:在內存中讀寫字符串的內置類
  • BytesIO:在內存中讀寫二進制數據的內置類
4.1 內存中讀寫字符串
  • 內存中讀寫字符串
    常規情況下就是創建一個StringIO對象,然後按照正常的文件讀寫的方式進行內容的讀寫即可
# 引入需要的模塊
from io import StringIO

# 創建StringIO對象
s = StringIO()

# 向內存中寫入數據
s.write("保存在內存中的數據:用戶名")
s.write("內容默認是追加的")

# 從內存中讀取數據
content = s.getvalue()
print(content)

# 操作完成,適當的時刻關閉對象
s.close()
  • 內存中操作二進制數據:和StringIO基本一致
# 引入需要的模塊
from io import BytesIO

# 定義要寫入的數據,使用bytes()函數轉換成二進制數據
s = "這是要寫入的數據"
sc = bytes(s, encoding="utf-8")

# 創建BytesIO對象
b = BytesIO()

# 向內存中寫入數據
b.write(sc)

# 從內存中讀取數據
content = b.getvalue()
print(content)

# 操作完成,適當的時刻關閉對象
s.close()

# 執行結果
~b'\xe8\xbf\x99\xe6\x98\xaf\xe8\xa6\x81\xe4\xbf\x9d\xe5\xad\x98\xe7\x9a\x84\xe6\x95\xb0\xe6\x8d\xae'

5. python中對目錄/路徑/文件夾的操作

本節內容所有的操作,其實都是和計算機交互的操作~操作計算機的內存、文件等等,python程序本身是做不了這些事情的,只是python在底層進行了和操作系統交互的功能封裝,將操作系統可以執行的諸如創建文件、文件內容操作、內存操作等等封裝成了函數

簡單瞭解os模塊,os模塊主要是針對操作系統的API的封裝

# 引入os模塊
import os

# 查看操作系統類型
# nt表示windows操作系統;posix表示Unix/Linux或者MacOS系統
os.name
~ 執行結果:nt

# 查看操作系統中的環境變量
os.environ
~執行結果:environ({'ALLUSERSPROFILE': 'C:\\ProgramData', 'APPDATA': 'C:\\Users\\mouwe\\AppData\\Roaming',.................'CLASSPATH': 'D:\\resp_application\\Java\\jdk1.8.0_121\\lib;.;',})
5.1. 操作文件目錄
# 查看當前操作系統的絕對路徑
os.path.abspath(".")
~ 執行結果:D:\resp_work\PY_WORK\demo
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 創建指定單級目錄
# 語法結構:os.mkdir(path, mode=, dir_fd=None)
# 描述:mkdir()函數用於使用指定的mode選項來創建一個文件夾目錄
# 參數path:用於創建文件夾的路徑
# 參數mode:用於設置的權限數字,默認777(所有權限:讀寫執行[rwx])
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 在d盤中創建一個目錄,目錄名稱爲test
os.mkdir("d:/test") 

# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 創建指定多級目錄
# 語法結構:os.mkdirs(path, mode=, exist_ok=False)
# 描述:makedirs()函數用於使用指定的mode選項來創建一系列文件夾目錄
# 參數path:用於創建文件夾的路徑
# 參數mode:用於設置的權限數字,默認777(所有權限:讀寫執行[rwx])
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 在d盤中創建test文件夾,文件夾中包含test2文件夾,test2中包含test3文件夾
os.mkdirs("d:/test/test2/test3")

# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 重命名
# 語法結構:os.rename(old, new)
# 描述:rename()函數用於使用新名稱重命名文件夾或者文件
# 參數old:要重命名的文件
# 參數new:文件的新名稱
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
os.rename("d:/test", "d:/new")

# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 刪除文件或者目錄
# 語法結構:os.rmdir(path)
# 描述:rmdir()函數用於刪除指定路徑的文件夾或者文件
# 參數path:要刪除的文件夾或者文件的路徑
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
os.rm("d:/test")

# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 刪除多級文件夾
# 語法結構:os.removedirs(path)
# 描述:removedirs(path)
# 參數path:要刪除的多級文件夾路徑
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
os.removedirs("d:/test/test2/test3")

# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# 同樣在進行文件夾或者文件刪除的時候,首先要進行數據驗證
# 也就是首先判斷是文件夾/文件,纔去執行刪除操作
# * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
# os.path.exists(path)函數用於判斷指定的路徑是否存在,存在返回True
res = os.path.exists("d:/test")

# os.path.isdir(path)函數用於判斷指定的路徑是否文件夾,是則返回True
res = os.path.isdir("d:/test")

# os.path.isfile(path)函數用於判斷指定的路徑是否文件,是則返回True
res = os.path.isfile("d:/test")

對於文件和文件夾的初步操作,暫時先分析到這裏,再後面的章節中學習過多線程等操作之後再深入分析

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章