這裏是南京財經大學的Mooc課程的個人學習筆記,課程網址是:https://www.icourse163.org/course/NJUE-1458311167,課程是免費的,老師講的很好很認真,歡迎學習。
數據集
data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
'name': ['黎明', '趙怡春', '張富平', '白麗', '牛玉德', '姚華', '李南'],
'gender': [True, False, True, False, True, False, True],
'age': [16, 20, 18, 18, 17, 18, 16],
'height': [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
}
date = ['10-01-2004 年', '11-27-2000 年', '01-29-2002 年',
'08-27-2002 年', '03-14-2003 年', '12-17-2002 年',
'04-12-2004 年']
對date數據進行轉換
for i in range(len(date)):
date[i] = datetime.strptime(date[i], '%m-%d-%Y 年')
使用時間數據作爲索引
df = pd.DataFrame(data, index=date)
print(df)
選擇指定日期的數據
print(df.loc[datetime(2002, 1, 29)])
#or
print(df.loc['20020129'])
print(df.loc['2002'])
print(df.loc['2002':'2003'])
以年分組並統計
print(df['name'].groupby(by=df.index.year).agg(['count']))