dataFrame
一个简单的dataFrame如下:
列索引
DataFrame的列索引可以直接获取数据:
两种方式:
行索引
loc
可以获取多行数据,但是无法使用切片操作获取数据。
单行数据获取
使用切片操作会出现错误。
iloc
多行数据获取
二维索引
单行数据
多行数据
一点思考
这里的true,我们可以得到这种 复制操作是一种赋值操作,被赋值变量所指向的地址一致。
dataFrame的删除和添加
列和行的删除同样存在区别。
列添加
列的删除
行添加和删除
行添加和删除同上区别。
行的删除用到是 drop函数
但是我们发现drop函数之后,test所指向的dataFrame并没有改变,说明这个函数的新开了一块内存存储数据。
dataFrame 操作
print(test[0:2]) #取前两行数据
print(len(test )) #求出一共多少行
print(test.columns.size) #求出一共多少列
print(test.columns) #列索引名称
print(test.index) #行索引名称
print(data[data>2] ) #表示选取数据集中大于0的数据
print(data[data.x>5]) #表示选取数据集中x这一列大于5的所有的行
a1=test.copy()
print(a1[a1['y'].isin(['6','10'])]) #表显示满足条件:列y中的值包含'6','10'的所有行。
print(test.mean()) #默认对每一列的数据求平均值;若加上参数a.mean(1)则对每一行求平均值;
print(test['x'].value_counts()) #统计某一列x中各个值出现的次数:
print(test.describe()) #对每一列数据进行统计,包括计数,均值,std,各个分位数等。