數據清洗之文件操作
讀取:csv文件
- 實用read_csv方法讀寫,結果爲dataframe格式
- 讀寫csv文件,文件名稱用英文
- 參數較多,可以自行控制,很多使用默認參數
- 讀csv,常用編碼utf-8,gbk,gbk2312,gb18030
- 實用to_csv快速保存
import numpy as np
import pandas as pd
#便於更改文件路徑
import os
#假如默認的路徑下有一ex.csv文件
fd_data = pd.read_csv('ex.csv’)
fd_data.head() #默認得到前5行
fd_data.info() #查看字段類型
#display.max_columns和display.max_rows是爲了解決列數或行數過多顯示不全的問題
pd.set_option('display.max_columns',5)
pd.set_option('display.max_rows',5)
#指定讀取的行數 ,nrows是爲了自定義讀取的行數,比如需要看一個大文檔的前多少行
fd_data = pd.read_csv('ex.csv',nrows=5)
#將處理好的fd_data保存爲csv文件。默認就是utf-8,index=false表示不把行索引保留到csv文件中去。
fd_data.to_csv('f.csv',encoding='utf-8',index = False)