《利用Python进行数据分析》笔记
我个人觉得有些东西是需要用到的时候查一下就行的,比如矩阵求逆,矩阵转置,但是一些更加常用的东西还是要扫一遍书的,记录下来一些印象深刻的点,以后查着方便。
蛋疼,其实就是简单学一下索引,不然取数据都不会
写下的东西并不官方,也不敢说会帮助什么人,觉得还是自己的一些笔记而已
- yield:
生成时才调用,有点C++里面动态绑定的意味
Numpy:
Numpy的数组切片是原始数组的视图,数据不会复制,改变会体现在原有的数据上
如果想要复制的话,要用.copy
数组的文件输入输出
np.save() #将 ndarray 存储为二进制文件,扩展名为 .npy
np.load() #加载 .npy 文件到程序中,返回值为 ndarray
Pandas:
index对象是不可修改的
Series :
个人感觉就相当于一个有序的dict
使用的时候分别调用 .index 和 .value 会返回两个列表
- Series本身和索引都有name属性
- Series运算会自动对齐
DataFrame
可以看作,每一列是一个Series,每一行也是一个Series
所有的取出切片操作,也是在原数据的视图上操作
直接
obj[index]
是取一列用行索引取一行
.ix['index']
- 所以取单个元素 a(2,3)
可以用a[3][2]
或者a.ix[2][3]
或者 a.ix[2,3]删除一列
del
根据index取行或者列
.xs()
常用的参数(key, axis)
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html坑啊,看书原来
icol
,irow
是 deprecated….
统一用iloc[x, y]
,都是返回一个Series或者直接定位到具体数值
先到这吧…