我們全程使用Jupyter進行程序的編寫
第一步
引入numpy和pandas庫
import numpy as np
import pandas as pd
第二步
開始使用
對象創建
- (1)通過一列表的值創造一個序列,讓pandas創造一個默認整型指數
s = pd.Series([1,3,5,np.nan,6,7])
s
- (2)基於NumPy數組創建一個帶有日期指數和標籤列的DataFrame
dates = pd.date_range('20200620',periods=6)
dates
- (3)通過對象字典創建一個轉化爲類似序列的DataFrame
df2 = pd.DataFrame(
{'A':1.,
'B':pd.Timestamp('20200620'),
'C':pd.Series(1,index=list(range(4)),dtype='float32'),
'D':np.array([3]*4,dtype='int32'),
'E': pd.Categorical(["test", "train", "test", "train"]),
'F': 'foo'})
df2
- (4)DataFrame的列有不同的dtypes
df2.dtypes
- (5)IPython支持 tab 鍵自動補全列名與公共屬性。下面是部分可自動補全的屬性:
df2.<TAB>