《利用Python進行數據分析》筆記
我個人覺得有些東西是需要用到的時候查一下就行的,比如矩陣求逆,矩陣轉置,但是一些更加常用的東西還是要掃一遍書的,記錄下來一些印象深刻的點,以後查着方便。
蛋疼,其實就是簡單學一下索引,不然取數據都不會
寫下的東西並不官方,也不敢說會幫助什麼人,覺得還是自己的一些筆記而已
- yield:
生成時才調用,有點C++裏面動態綁定的意味
Numpy:
Numpy的數組切片是原始數組的視圖,數據不會複製,改變會體現在原有的數據上
如果想要複製的話,要用.copy
數組的文件輸入輸出
np.save() #將 ndarray 存儲爲二進制文件,擴展名爲 .npy
np.load() #加載 .npy 文件到程序中,返回值爲 ndarray
Pandas:
index對象是不可修改的
Series :
個人感覺就相當於一個有序的dict
使用的時候分別調用 .index 和 .value 會返回兩個列表
- Series本身和索引都有name屬性
- Series運算會自動對齊
DataFrame
可以看作,每一列是一個Series,每一行也是一個Series
所有的取出切片操作,也是在原數據的視圖上操作
直接
obj[index]
是取一列用行索引取一行
.ix['index']
- 所以取單個元素 a(2,3)
可以用a[3][2]
或者a.ix[2][3]
或者 a.ix[2,3]刪除一列
del
根據index取行或者列
.xs()
常用的參數(key, axis)
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html坑啊,看書原來
icol
,irow
是 deprecated….
統一用iloc[x, y]
,都是返回一個Series或者直接定位到具體數值
先到這吧…