數據轉換-清除重複數據
Data frame的 duplicated方 法返回一個布爾型 Series, 表示各行是否是重複行:
還有一個與此相關的drop duplicates方法,它用於返回一個移除了重複行的DataFrame
這兩個方法默認會判斷 全部列,你也可以指定部分列進行重複項判斷。 假設你還有一列值,且只希望根據k1列過濾重複 項:
duplicated和 drop_duplicates 默認保留的是第一個出現的值組合。傳入keep。
利用函數和映射進行轉換,也可以直接傳入一個能直接完成此功能的函數。