这里是南京财经大学的Mooc课程的个人学习笔记,课程网址是:https://www.icourse163.org/course/NJUE-1458311167,课程是免费的,老师讲的很好很认真,欢迎学习。
数据集
data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
'name': ['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'],
'gender': [True, False, True, False, True, False, True],
'age': [16, 20, 18, 18, 17, 18, 16],
'height': [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
}
date = ['10-01-2004 年', '11-27-2000 年', '01-29-2002 年',
'08-27-2002 年', '03-14-2003 年', '12-17-2002 年',
'04-12-2004 年']
对date数据进行转换
for i in range(len(date)):
date[i] = datetime.strptime(date[i], '%m-%d-%Y 年')
使用时间数据作为索引
df = pd.DataFrame(data, index=date)
print(df)
选择指定日期的数据
print(df.loc[datetime(2002, 1, 29)])
#or
print(df.loc['20020129'])
print(df.loc['2002'])
print(df.loc['2002':'2003'])
以年分组并统计
print(df['name'].groupby(by=df.index.year).agg(['count']))