python自帶的csv庫也可以對csv文件進行操作,但是操作起來不是很方便,我們試着用pandas庫來試試
讀取
pandas庫裏讀取csv文件後可以直接返回dataframe對象,不需要我們再轉
data = pd.read_csv(file,encoding="utf-8")
print(type(data))
#output
<class 'pandas.core.frame.DataFrame'>
我們可以看到輸出的類型是個dataframe對象
我們也可以加上參數固定的讀取某列的數據
data = pd.read_csv(file,usecols=[1,3])
這個列表的參數就是我們要讀取的列序號
遍歷
pandas可以直接按照列的標題去遍歷,假如說我現在有兩列數據,標題分別是name,age,那麼我們讀取之後就可以這樣操作
for one in data.loc[:'name']
print(one)
這裏簡單提一下loc函數,loc函數是按標籤遍歷,這裏就是name,還有一個和他很像的函數iloc,iloc函數爲Selection by Position,即按位置選擇數據,即第n行,第n列數據,只接受整型參數,例如data.iloc[:, 0]
修改
這裏我們假如要將指定的人(“jack”)的年齡加1,廢話不多說,直接看代碼
for one in data.loc[:,"name"]:
data.loc[data['name']=="tack",'age']=age+1
data.to_csv(file)
這裏強調一下,修改完後一定要記得把數據更新到csv文件中,不然原文件裏的數據是不會改變的。
這樣看起來是要比python自帶的csv庫操作起來要簡單的多