背景
數據挖掘中python是一件利器,而pandas則是這個利器的刀劍,可想而知它的重要性,本節做一下它的helloworld。
本節重點:
- 數據接入
- 數據命令行簡易打印
- 簡易畫圖展示
數據接入
安裝就帶過了,不多贅述。
這裏我使用的jupyter notebook
import pandas as pd
import sklearn
import datetime
import pandas_datareader.data as web
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime(2015, 8, 22)
df = web.DataReader('XOM', 'yahoo', start, end)
# 這裏經常會有pd.read_csv(file_path)來獲取數據
如果本地有數據,可以通過read_csv的方法進行加載。
簡易展示
使用head和tail可以看一下部分數據的概況(至少得確認下數據是可以用)
畫圖展示
import matplotlib.pyplot as plt
df['High'].plot()
plt.legend()
plt.show()
這裏用到了數據幀(df)的plot方法,其實完全不必要,可以直接使用plt自己的方法,如下:
說白了,df的plot方法,最終使用的plt的plot方法,把數據通過numpy數組的形式送進去
評價
本文主要是helloworld,之後將繼續走讀,重點參考:https://www.yiibai.com/pandas