學習筆記(05):Python數據清洗實戰-csv文件讀寫

數據清洗之文件操作

讀取:csv文件

  • 實用read_csv方法讀寫,結果爲dataframe格式
  • 讀寫csv文件,文件名稱用英文
  • 參數較多,可以自行控制,很多使用默認參數
  • 讀csv,常用編碼utf-8,gbk,gbk2312,gb18030
  • 實用to_csv快速保存

import numpy as np

import pandas as pd

#便於更改文件路徑

import os

#假如默認的路徑下有一ex.csv文件

fd_data = pd.read_csv('ex.csv’)

fd_data.head() #默認得到前5行

 

fd_data.info() #查看字段類型

 

#display.max_columns和display.max_rows是爲了解決列數或行數過多顯示不全的問題

pd.set_option('display.max_columns',5) 

pd.set_option('display.max_rows',5)

#指定讀取的行數 ,nrows是爲了自定義讀取的行數,比如需要看一個大文檔的前多少行

fd_data = pd.read_csv('ex.csv',nrows=5)

 

#將處理好的fd_data保存爲csv文件。默認就是utf-8,index=false表示不把行索引保留到csv文件中去。

fd_data.to_csv('f.csv',encoding='utf-8',index = False) 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章