pandas對csv文件的基本操作

文章目錄


python自帶的csv庫也可以對csv文件進行操作,但是操作起來不是很方便,我們試着用pandas庫來試試

讀取

pandas庫裏讀取csv文件後可以直接返回dataframe對象,不需要我們再轉

data = pd.read_csv(file,encoding="utf-8")
print(type(data))

#output
<class 'pandas.core.frame.DataFrame'>

我們可以看到輸出的類型是個dataframe對象

我們也可以加上參數固定的讀取某列的數據

data = pd.read_csv(file,usecols=[1,3])

這個列表的參數就是我們要讀取的列序號

遍歷

pandas可以直接按照列的標題去遍歷,假如說我現在有兩列數據,標題分別是name,age,那麼我們讀取之後就可以這樣操作

for one in data.loc[:'name']
	print(one)

這裏簡單提一下loc函數,loc函數是按標籤遍歷,這裏就是name,還有一個和他很像的函數iloc,iloc函數爲Selection by Position,即按位置選擇數據,即第n行,第n列數據,只接受整型參數,例如data.iloc[:, 0]

修改

這裏我們假如要將指定的人(“jack”)的年齡加1,廢話不多說,直接看代碼

for one in data.loc[:,"name"]:
	
	data.loc[data['name']=="tack",'age']=age+1
data.to_csv(file)

這裏強調一下,修改完後一定要記得把數據更新到csv文件中,不然原文件裏的數據是不會改變的。
這樣看起來是要比python自帶的csv庫操作起來要簡單的多

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章