大家好,我是天空之城,今天给大家带来,pandas模块的介绍
软件安装:
python 3
anaconda
jupyter notebook
1.掌握外部数据的读取;
2.如何快速地认知数据的概览信息;
3. 数据子集的筛选与清洗
4.数据的汇总处理
5.数据的合并与连接
import pandas as pd
data01=pd.read_csv(r'文件的绝对路径',shiprows=2,sep=',',skipfooter=3,converters={‘id’:str},encoding='utf-8')
data01
文件原始数据类型是utf-8,这里要指定为utf-8
如果不是utf-8那么就用记事本打开后另存为utf-8类型
按住shift按住tab两三次可以看到函数(帮助)的参数
6&000原始数据里面有&符号,那么通过thousands=‘&’,可以拿掉这个符号
原始数据里面是逗号,会自动拿掉
数据表的合并与连接