機器學習——pandas庫介紹

想快速讀取常規大小的數據文件時,通過創建讀緩存區和其他的機制可能會造成額外的開銷。此時建議採用Pandas庫來處理

 

Pandas是一款開源的、基於BSD協議的Python庫,能夠提供高性能、易用的數據結構和數據分析工具。

特點:

  • 能夠從csv文件、文本文件、MS Excel、SQL數據庫,甚至是用於科學用途的HDF5格式
  • csv文件加載能夠自動識別列頭,支持列的直接尋址
  • 數據結構自動轉換爲Numpy的多維數組
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章