數據挖掘-pandas的helloworld

背景

數據挖掘中python是一件利器,而pandas則是這個利器的刀劍,可想而知它的重要性,本節做一下它的helloworld。

本節重點:

  • 數據接入
  • 數據命令行簡易打印
  • 簡易畫圖展示

數據接入

安裝就帶過了,不多贅述。
這裏我使用的jupyter notebook

import pandas as pd
import sklearn
import datetime
import pandas_datareader.data as web
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime(2015, 8, 22)
df = web.DataReader('XOM', 'yahoo', start, end)
# 這裏經常會有pd.read_csv(file_path)來獲取數據

如果本地有數據,可以通過read_csv的方法進行加載。

簡易展示

在這裏插入圖片描述
在這裏插入圖片描述
使用head和tail可以看一下部分數據的概況(至少得確認下數據是可以用)

畫圖展示

import matplotlib.pyplot as plt
df['High'].plot()
plt.legend()
plt.show()

在這裏插入圖片描述
這裏用到了數據幀(df)的plot方法,其實完全不必要,可以直接使用plt自己的方法,如下:
在這裏插入圖片描述
說白了,df的plot方法,最終使用的plt的plot方法,把數據通過numpy數組的形式送進去

評價

本文主要是helloworld,之後將繼續走讀,重點參考:https://www.yiibai.com/pandas

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章