Python时间数据分析1

这里是南京财经大学的Mooc课程的个人学习笔记,课程网址是:https://www.icourse163.org/course/NJUE-1458311167,课程是免费的,老师讲的很好很认真,欢迎学习。


数据集

data = {'ID': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
        'name': ['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'],
        'gender': [True, False, True, False, True, False, True],
        'age': [16, 20, 18, 18, 17, 18, 16],
        'height': [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
        }
date = ['10-01-2004 年', '11-27-2000 年', '01-29-2002 年',
        '08-27-2002 年', '03-14-2003 年', '12-17-2002 年',
        '04-12-2004 年']

对date数据进行转换

for i in range(len(date)):
    date[i] = datetime.strptime(date[i], '%m-%d-%Y 年')

使用时间数据作为索引

df = pd.DataFrame(data, index=date)
print(df)

在这里插入图片描述


选择指定日期的数据

print(df.loc[datetime(2002, 1, 29)])
#or
print(df.loc['20020129'])

在这里插入图片描述

print(df.loc['2002'])

在这里插入图片描述

print(df.loc['2002':'2003'])

在这里插入图片描述


以年分组并统计

print(df['name'].groupby(by=df.index.year).agg(['count']))

在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章