python中f.read()與f.readline區別

衆所周知在python中讀取文件常用的三種方法:read(),readline(),readlines(),今天看項目是又忘記他們的區別了。以前看書的時候覺得這東西很簡單,一眼掃過,待到用時卻也只知道有這麼幾個方法,不懂得它的原理與用法。也許吧,沒有永遠的記憶,況且根本沒有用心去記它。話不多說,來一起看看詳細的介紹:

假設a.txt

一、read([size])方法

read([size])方法從文件當前位置起讀取size個字節,若無參數size,則表示讀取至文件結束爲止,它範圍爲字符串對象

f = open("a.txt")
lines = f.read()
print lines
print(type(lines))
f.close()

輸出結果:

Hello
Welcome
What is the fuck...
<type 'str'> #字符串類型

二、readline()方法

從字面意思可以看出,該方法每次讀出一行內容,所以,讀取時佔用內存小,比較適合大文件,該方法返回一個字符串對象。

1

2

3

4

5

6

7

= open("a.txt")

line = f.readline()

print(type(line))

while line:

 print line,

 line = f.readline()

f.close()

輸出結果:

<type 'str'>
Hello
Welcome
What is the fuck...

三、readlines()方法讀取整個文件所有行,保存在一個列表(list)變量中,每行作爲一個元素,但讀取大文件會比較佔內存

f = open("a.txt")
lines = f.readlines()
print(type(lines))
for line in lines:
 print line,
f.close()

輸出結果:

1 <type 'list'>
2 Hello
3 Welcome
4 What is the fuck...

四、linecache模塊

當然,有特殊需求還可以用linecache模塊,比如你要輸出某個文件的第n行:

1

2

3

# 輸出第2行

text = linecache.getline(‘a.txt',2)

print text,


python 讀寫文件類型主要有txt, csv,excel, sas,spss 和mysql,

在這裏主要介紹用的最多的txt和csv文件

 

讀寫

方式主要分爲三種:

1.python 自帶的函數

read,readline ,readlines,write

2.pandas模塊中的read_csv,to_csv

3.csv模塊中的reader,writer

下面以txt爲例進行介紹,csv文件的讀寫基本與txt一致,把文件名換了即可

 

txt原內容

learn python
learn pandas numpy 

 

一、python 內置函數
1.先介紹open函數
open(name[, mode[, buffering]])
name : '文件名稱'。
mode : 打開模式,默認爲只讀(r),可以選擇爲寫(w)
    常用的:
    r  只讀 默認格式
    rb 二進制打開文件用於只讀
    r+ 打開文件用於讀寫
    w  只寫
    wb 二進制打開文件用於只寫
    w+ 打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。
        如果該文件不存在,創建新文件
    
buffering : 如果 buffering 的值被設爲 0,就不會有寄存。如果 buffering 的值取 1,訪問文件時會寄存

注意:

很多時候會出現以下兩種情況

採用with.. as 多是爲了保證程序的健壯性,防止出現IO異常,導致文件打不加

推薦使用with.. as 格式

file = open('.//data//lesson1//1.txt')
file.close()
with open('.//data//lesson1//1.txt', 'r') as file:
    print(file.read())
 
 

2.read
#讀取txt文本
#方法1: read()  read()是直接讀取txt中所有內容,返回字符串
file = open('.//data//lesson1//1.txt')
lines = file.read()
print(lines)
print(type(lines))
file.close() #記得把文件關閉
 輸出爲:

learn python
learn pandas numpy 
<class 'str'>
3.readline
# 方法2: readline 一行一行讀取文件,返回的是字符串,僅當沒有足夠內存可以一次讀取整個文件時,才應該使用.readline()
file = open('.//data//lesson1//1.txt')
 
#1.手動一行一行讀
line1 = file.readline()
print(line1)
line2 = file.readline()
print(line2)  
 
file.close()
 輸出爲:

learn python
 
learn pandas numpy 
#方法2: readline 方法用於從文件讀取整行,包括 "\n" 字符
file = open('.//data//lesson1//1.txt')
 
#2.連續讀
line = file.readline()
while line:
    print(line)
    line = file.readline()
    
file.close()
輸出爲:

learn python
 
learn pandas numpy
#注意:readline(num) 表示讀取該行中前num個字母,包含空格
file = open('.//data//lesson1//1.txt')
line = file.readline(10)
print(line)
file.close()
 輸出爲:

learn pyth
4.readlines
#方法3 readlines   讀取整個文件所有行,保存在一個列表(list)變量中,每次讀取一行
file = open('.//data//lesson1//1.txt')
lines = file.readlines()  
print(lines) #輸出所有內容
 
result = []
for line in lines:
    print(line)  #一行一行輸出所有內容
    result.append(line)
file.close()
輸出爲:

['learn python\n', 'learn pandas numpy ']
learn python
 
learn pandas numpy
5.write 寫文件
#在2.txt中寫入 result的結果,2.txt不存在可以自己創建
open('.//data//lesson1//2.txt','w').write('%s' % '\n'.join(result))
二、pandas模塊中的read_csv(),to_csv()
#read_csv   輸出爲DataFrame, DataFrame後面會具體講解
 
import pandas as pd
file_csv = pd.read_csv('.//data//lesson1.txt')
print(type(file_csv))
輸出爲:

<class 'pandas.core.frame.DataFrame'>
#to_csv 寫文件
 
import pandas as pd
file_csv = pd.to_csv('.//data//lesson1.txt',result) #result是寫入的內容
三、csv模塊中的reader,writer
#csv中的reader 讀文件
import csv
file = './/data//lesson1//1.txt'
data = []
with open(file,'r') as f:
    result = csv.reader(f)
    for line in result:
        data.append(line)
print(data)
輸出:

[['learn python'], ['learn pandas numpy ']]
#csv中的writer 寫文件,沒有該文件程序會自己創建
with open('.//data//lesson1//3.txt','w') as f:
    writer = csv.writer(f)
    writer.writerows(data)
 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章