這裏是南京財經大學的Mooc課程的個人學習筆記,課程網址是:https://www.icourse163.org/course/NJUE-1458311167,課程是免費的,老師講的很好很認真,歡迎學習。
數據集
from datetime import datetime
import pandas as pd
data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
'name': ['黎明', '趙怡春', '張富平', '白麗', '牛玉德', '姚華', '李南'],
'gender': [True, False, True, False, True, False, True],
'age': [16, 20, 18, 18, 17, 18, 16],
'height': [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
}
date = ['10-01-2004 年', '11-27-2000 年', '01-29-2002 年',
'08-27-2002 年', '03-14-2003 年', '12-17-2002 年',
'04-12-2004 年']
for i in range(len(date)):
date[i] = datetime.strptime(date[i], '%m-%d-%Y 年')
df = pd.DataFrame(data, index=date)
按照月份、年份計算平均身高
# 按照月份計算平均身高
df = df['height'].resample('M').agg(['mean'])
# 選擇平均值非空的行
target = df['mean'].notnull()
# 輸出
print(df[target])
# 按照年份計算平均身高
df = df['height'].resample('Y').agg(['mean'])
# 選擇平均值非空的行
target = df['mean'].notnull()
# 輸出
print(df[target])