機器學習---數據科學包---數據導入導出

數據I/O

  • 索引及列名
  • 缺失值處理
  • 逐塊讀取數據
  • 保存數據到磁盤
  • 二進制數據
  • 其他格式簡介

索引及列名/缺失值處理

在這裏插入圖片描述

逐塊讀取數據

在這裏插入圖片描述

保存數據到磁盤

在這裏插入圖片描述

二進制數據

pickle包

其他格式

  • HDF5: HDF是個用C語言實現的庫,可以高效地讀取磁盤上的二進制存儲的科學數據
  • Excel文件:pd.excel/pd.ExcelFile/pd.ExcelWriter
  • JSON:通過json模塊來轉換爲字典,再轉換爲DataFrame
  • SQL:通過pd.io.sql從數據庫讀取數據
  • NoSQL(MongoDB):需要結合相應的數據庫模塊,如pymongo,再通過遊標把數據讀出來,轉換爲DataFrame
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章