pandas——dataFrame

dataFrame

一个简单的dataFrame如下:
在这里插入图片描述

列索引

DataFrame的列索引可以直接获取数据:
两种方式:
在这里插入图片描述
在这里插入图片描述

行索引

loc

可以获取多行数据,但是无法使用切片操作获取数据。
单行数据获取
在这里插入图片描述

在这里插入图片描述
使用切片操作会出现错误。
在这里插入图片描述

iloc

多行数据获取
在这里插入图片描述

二维索引

单行数据

在这里插入图片描述

多行数据

在这里插入图片描述

一点思考

在这里插入图片描述
这里的true,我们可以得到这种 复制操作是一种赋值操作,被赋值变量所指向的地址一致。

dataFrame的删除和添加

列和行的删除同样存在区别。

列添加

在这里插入图片描述

列的删除

在这里插入图片描述

行添加和删除

行添加和删除同上区别。

在这里插入图片描述
行的删除用到是 drop函数
在这里插入图片描述
但是我们发现drop函数之后,test所指向的dataFrame并没有改变,说明这个函数的新开了一块内存存储数据。
在这里插入图片描述

dataFrame 操作

print(test[0:2])       #取前两行数据


print(len(test ))              #求出一共多少行
print(test.columns.size)      #求出一共多少列


print(test.columns)        #列索引名称
print(test.index)       #行索引名称


print(data[data>2] )      #表示选取数据集中大于0的数据
print(data[data.x>5])       #表示选取数据集中x这一列大于5的所有的行


a1=test.copy()
print(a1[a1['y'].isin(['6','10'])])    #表显示满足条件:列y中的值包含'6','10'的所有行。

print(test.mean())           #默认对每一列的数据求平均值;若加上参数a.mean(1)则对每一行求平均值;
print(test['x'].value_counts())    #统计某一列x中各个值出现的次数:

print(test.describe()) #对每一列数据进行统计,包括计数,均值,std,各个分位数等。

在这里插入图片描述

发布了97 篇原创文章 · 获赞 5 · 访问量 9325
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章