Python 數據處理的 Some tips --- 索引


《利用Python進行數據分析》筆記


我個人覺得有些東西是需要用到的時候查一下就行的,比如矩陣求逆,矩陣轉置,但是一些更加常用的東西還是要掃一遍書的,記錄下來一些印象深刻的點,以後查着方便。

蛋疼,其實就是簡單學一下索引,不然取數據都不會

寫下的東西並不官方,也不敢說會幫助什麼人,覺得還是自己的一些筆記而已

  • yield:
    生成時才調用,有點C++裏面動態綁定的意味

Numpy:

Numpy的數組切片是原始數組的視圖,數據不會複製,改變會體現在原有的數據上
如果想要複製的話,要用.copy


數組的文件輸入輸出

np.save() #將 ndarray 存儲爲二進制文件,擴展名爲 .npy
np.load() #加載 .npy 文件到程序中,返回值爲 ndarray

Pandas:

index對象是不可修改的

Series :
個人感覺就相當於一個有序的dict
使用的時候分別調用 .index 和 .value 會返回兩個列表

  • Series本身和索引都有name屬性
  • Series運算會自動對齊

DataFrame
可以看作,每一列是一個Series,每一行也是一個Series
所有的取出切片操作,也是在原數據的視圖上操作

  • 直接 obj[index] 是取一列

  • 用行索引取一行
    .ix['index']

    • 所以取單個元素 a(2,3)
      可以用 a[3][2] 或者 a.ix[2][3] 或者 a.ix[2,3]
  • 刪除一列 del

  • 根據index取行或者列 .xs() 常用的參數(key, axis)
    http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html

  • 坑啊,看書原來icolirow 是 deprecated….
    統一用iloc[x, y],都是返回一個Series或者直接定位到具體數值


先到這吧…

發佈了105 篇原創文章 · 獲贊 159 · 訪問量 15萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章