python 對 文件、文件夾的操作

python 讀寫、創建 文件

python中對文件、文件夾(文件操作函數)的操作需要涉及到os模塊和shutil模塊。

得到當前工作目錄,即當前Python腳本工作的目錄路徑: os.getcwd()

返回指定目錄下的所有文件和目錄名:os.listdir()

函數用來刪除一個文件:os.remove()

刪除多個目錄:os.removedirs(r“c:\python”)

檢驗給出的路徑是否是一個文件:os.path.isfile()

檢驗給出的路徑是否是一個目錄:os.path.isdir()

判斷是否是絕對路徑:os.path.isabs()

檢驗給出的路徑是否真地存:os.path.exists()

返回一個路徑的目錄名和文件名:os.path.split()     eg os.path.split('/home/swaroop/byte/code/poem.txt') 結果:('/home/swaroop/byte/code', 'poem.txt') 

分離擴展名:os.path.splitext()

獲取路徑名:os.path.dirname()

獲取文件名:os.path.basename()

運行shell命令: os.system()

讀取和設置環境變量:os.getenv() 與os.putenv()

給出當前平臺使用的行終止符:os.linesep    Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

指示你正在使用的平臺:os.name       對於Windows,它是'nt',而對於Linux/Unix用戶,它是'posix'

重命名:os.rename(old, new)

創建多級目錄:os.makedirs(r“c:\python\test”)

創建單個目錄:os.mkdir(“test”)

獲取文件屬性:os.stat(file)

修改文件權限與時間戳:os.chmod(file)

終止當前進程:os.exit()

獲取文件大小:os.path.getsize(filename)


文件操作:
os.mknod("test.txt")        創建空文件
fp = open("test.txt",w)     直接打開一個文件,如果文件不存在則創建文件

關於open 模式:

w     以寫方式打開,
a     以追加模式打開 (從 EOF 開始, 必要時創建新文件)
r+     以讀寫模式打開
w+     以讀寫模式打開 (參見 w )
a+     以讀寫模式打開 (參見 a )
rb     以二進制讀模式打開
wb     以二進制寫模式打開 (參見 w )
ab     以二進制追加模式打開 (參見 a )
rb+    以二進制讀寫模式打開 (參見 r+ )
wb+    以二進制讀寫模式打開 (參見 w+ )
ab+    以二進制讀寫模式打開 (參見 a+ )

 

fp.read([size])                     #size爲讀取的長度,以byte爲單位

fp.readline([size])                 #讀一行,如果定義了size,有可能返回的只是一行的一部分

fp.readlines([size])                #把文件每一行作爲一個list的一個成員,並返回這個list。其實它的內部是通過循環調用readline()來實現的。如果提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。

fp.write(str)                      #把str寫到文件中,write()並不會在str後加上一個換行符

fp.writelines(seq)            #把seq的內容全部寫到文件中(多行一次性寫入)。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。

fp.close()                        #關閉文件。python會在一個文件不用後自動關閉文件,不過這一功能沒有保證,最好還是養成自己關閉的習慣。  如果一個文件在關閉後還對其進行操作會產生ValueError

fp.flush()                                      #把緩衝區的內容寫入硬盤

fp.fileno()                                      #返回一個長整型的”文件標籤“

fp.isatty()                                      #文件是否是一個終端設備文件(unix系統中的)

fp.tell()                                         #返回文件操作標記的當前位置,以文件的開頭爲原點

fp.next()                                       #返回下一行,並將文件操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是調用next()函數來實現遍歷的。

fp.seek(offset[,whence])              #將文件打操作標記移到offset的位置。這個offset一般是相對於文件的開頭來計算的,一般爲正數。但如果提供了whence參數就不一定了,whence可以爲0表示從頭開始計算,1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。需要注意,如果文件以a或a+的模式打開,每次進行寫操作時,文件操作標記會自動返回到文件末尾。

fp.truncate([size])                       #把文件裁成規定的大小,默認的是裁到當前文件操作標記的位置。如果size比文件的大小還要大,依據系統的不同可能是不改變文件,也可能是用0把文件補到相應的大小,也可能是以一些隨機的內容加上去。

 

目錄操作:
os.mkdir("file")                   創建目錄
複製文件:
shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")            oldfile只能是文件夾,newfile可以是文件,也可以是目標目錄
複製文件夾:
shutil.copytree("olddir","newdir")        olddir和newdir都只能是目錄,且newdir必須不存在
重命名文件(目錄)
os.rename("oldname","newname")       文件或目錄都是使用這條命令
移動文件(目錄)
shutil.move("oldpos","newpos")   
刪除文件
os.remove("file")
刪除目錄
os.rmdir("dir")只能刪除空目錄
shutil.rmtree("dir")    空目錄、有內容的目錄都可以刪
轉換目錄
os.chdir("path")   換路徑

 

Python讀寫文件
1.open
使用open打開文件後一定要記得調用文件對象的close()方法。比如可以用try/finally語句來確保最後能關閉文件。

file_object = open('thefile.txt')
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )

注:不能把open語句放在try塊裏,因爲當打開文件出現異常時,文件對象file_object無法執行close()方法。

2.讀文件
讀文本文件
input = open('data', 'r')
#第二個參數默認爲r
input = open('data')

 

讀二進制文件
input = open('data', 'rb')
 

讀取所有內容
file_object = open('thefile.txt')
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )
 

讀固定字節
file_object = open('abinfile', 'rb')
try:
    while True:
         chunk = file_object.read(100)
        if not chunk:
            break
         do_something_with(chunk)
finally:
     file_object.close( )
 

讀每行
list_of_all_the_lines = file_object.readlines( )

如果文件是文本文件,還可以直接遍歷文件對象獲取每行:

for line in file_object:
     process line
 

3.寫文件
寫文本文件
output = open('data', 'w')
 

寫二進制文件
output = open('data', 'wb')
 

追加寫文件
output = open('data', 'w+')
 

寫數據
file_object = open('thefile.txt', 'w')
file_object.write(all_the_text)
file_object.close( )
 

寫入多行
file_object.writelines(list_of_text_strings)

注意,調用writelines寫入多行在性能上會比使用write一次性寫入要高。

在處理日誌文件的時候,常常會遇到這樣的情況:日誌文件巨大,不可能一次性把整個文件讀入到內存中進行處理,例如需要在一臺物理內存爲 2GB 的機器上處理一個 2GB 的日誌文件,我們可能希望每次只處理其中 200MB 的內容。
在 Python 中,內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼爲例:

file = open('test.log', 'r')sizehint = 209715200   # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0:       position = file.tell()       lines = file.readlines(sizehint)

每次調用 readlines(sizehint) 函數,會返回大約 200MB 的數據,而且所返回的必然都是完整的行數據,大多數情況下,返回的數據的字節數會稍微比 sizehint 指定的值大一點(除最後一次調用 readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

file在python是一個特殊的類型,它用於在python程序中對外部的文件進行操作。在python中一切都是對象,file也不例外,file有file的方法和屬性。下面先來看如何創建一個file對象:


file(name[, mode[, buffering]]) 
file()函數用於創建一個file對象,它有一個別名叫open(),可能更形象一些,它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。
mode是打開的模式,可選的值爲r w a U,分別代表讀(默認) 寫 添加支持各種換行符的模式。用w或a模式打開文件的話,如果文件不存在,那麼就自動創建。此外,用w模式打開一個已經存在的文件時,原有文件的內容會被清空,因爲一開始文件的操作的標記是在文件的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由於歷史的原因,換行符在不同的系統中有不同模式,比如在 unix中是一個\n,而在windows中是‘\r\n’,用U模式打開文件,就是支持所有的換行模式,也就說‘\r’ '\n' '\r\n'都可表示換行,會有一個tuple用來存貯這個文件中用到過的換行符。不過,雖說換行有多種模式,讀到python中統一用\n代替。在模式字符的後面,還可以加上+ b t這兩種標識,分別表示可以對文件同時進行讀寫操作和用二進制模式、文本模式(默認)打開文件。
buffering如果爲0表示不進行緩衝;如果爲1表示進行“行緩衝“;如果是一個大於1的數表示緩衝區的大小,應該是以字節爲單位的。

file對象有自己的屬性和方法。先來看看file的屬性。


closed #標記文件是否已經關閉,由close()改寫 
encoding #文件編碼 
mode #打開模式 
name #文件名 
newlines #文件中用到的換行模式,是一個tuple 
softspace #boolean型,一般爲0,據說用於print

file的讀寫方法:


F.read([size]) #size爲讀取的長度,以byte爲單位 
F.readline([size]) 
#讀一行,如果定義了size,有可能返回的只是一行的一部分 
F.readlines([size]) 
#把文件每一行作爲一個list的一個成員,並返回這個list。其實它的內部是通過循環調用readline()來實現的。如果提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。 
F.write(str) 
#把str寫到文件中,write()並不會在str後加上一個換行符 
F.writelines(seq) 
#把seq的內容全部寫到文件中。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。 
file的其他方法:


F.close() 
#關閉文件。python會在一個文件不用後自動關閉文件,不過這一功能沒有保證,最好還是養成自己關閉的習慣。如果一個文件在關閉後還對其進行操作會產生ValueError 
F.flush() 
#把緩衝區的內容寫入硬盤 
F.fileno() 
#返回一個長整型的”文件標籤“ 
F.isatty() 
#文件是否是一個終端設備文件(unix系統中的) 
F.tell() 
#返回文件操作標記的當前位置,以文件的開頭爲原點 
F.next() 
#返回下一行,並將文件操作標記位移到下一行。把一個file用於for ... in file這樣的語句時,就是調用next()函數來實現遍歷的。 
F.seek(offset[,whence]) 
#將文件打操作標記移到offset的位置。這個offset一般是相對於文件的開頭來計算的,一般爲正數。但如果提供了whence參數就不一定了,whence可以爲0表示從頭開始計算,1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。需要注意,如果文件以a或a+的模式打開,每次進行寫操作時,文件操作標記會自動返回到文件末尾。 
F.truncate([size]) 
#把文件裁成規定的大小,默認的是裁到當前文件操作標記的位置。如果size比文件的大小還要大,依據系統的不同可能是不改變文件,也可能是用0把文件補到相應的大小,也可能是以一些隨機的內容加上去。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章