pandas對csv文件的基本操作

原創

2020-06-26 01:52

python自帶的csv庫也可以對csv文件進行操作，但是操作起來不是很方便，我們試着用pandas庫來試試

pandas庫裏讀取csv文件後可以直接返回dataframe對象，不需要我們再轉

data = pd.read_csv(file,encoding="utf-8")
print(type(data))

#output
<class 'pandas.core.frame.DataFrame'>

我們可以看到輸出的類型是個dataframe對象

我們也可以加上參數固定的讀取某列的數據

data = pd.read_csv(file,usecols=[1,3])

這個列表的參數就是我們要讀取的列序號

pandas可以直接按照列的標題去遍歷，假如說我現在有兩列數據，標題分別是name，age，那麼我們讀取之後就可以這樣操作

for one in data.loc[:'name']
	print(one)

這裏簡單提一下loc函數，loc函數是按標籤遍歷，這裏就是name，還有一個和他很像的函數iloc，iloc函數爲Selection by Position，即按位置選擇數據，即第n行，第n列數據，只接受整型參數，例如data.iloc[:, 0]

這裏我們假如要將指定的人(“jack”)的年齡加1，廢話不多說，直接看代碼

for one in data.loc[:,"name"]:
	
	data.loc[data['name']=="tack",'age']=age+1
data.to_csv(file)

這裏強調一下，修改完後一定要記得把數據更新到csv文件中，不然原文件裏的數據是不會改變的。
這樣看起來是要比python自帶的csv庫操作起來要簡單的多

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.