Python 数据处理的 Some tips --- 索引


《利用Python进行数据分析》笔记


我个人觉得有些东西是需要用到的时候查一下就行的,比如矩阵求逆,矩阵转置,但是一些更加常用的东西还是要扫一遍书的,记录下来一些印象深刻的点,以后查着方便。

蛋疼,其实就是简单学一下索引,不然取数据都不会

写下的东西并不官方,也不敢说会帮助什么人,觉得还是自己的一些笔记而已

  • yield:
    生成时才调用,有点C++里面动态绑定的意味

Numpy:

Numpy的数组切片是原始数组的视图,数据不会复制,改变会体现在原有的数据上
如果想要复制的话,要用.copy


数组的文件输入输出

np.save() #将 ndarray 存储为二进制文件,扩展名为 .npy
np.load() #加载 .npy 文件到程序中,返回值为 ndarray

Pandas:

index对象是不可修改的

Series :
个人感觉就相当于一个有序的dict
使用的时候分别调用 .index 和 .value 会返回两个列表

  • Series本身和索引都有name属性
  • Series运算会自动对齐

DataFrame
可以看作,每一列是一个Series,每一行也是一个Series
所有的取出切片操作,也是在原数据的视图上操作

  • 直接 obj[index] 是取一列

  • 用行索引取一行
    .ix['index']

    • 所以取单个元素 a(2,3)
      可以用 a[3][2] 或者 a.ix[2][3] 或者 a.ix[2,3]
  • 删除一列 del

  • 根据index取行或者列 .xs() 常用的参数(key, axis)
    http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html

  • 坑啊,看书原来icolirow 是 deprecated….
    统一用iloc[x, y],都是返回一个Series或者直接定位到具体数值


先到这吧…

发布了105 篇原创文章 · 获赞 159 · 访问量 15万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章