Pandas高階篇三(數據轉化、清除重複數據)

數據轉換-清除重複數據

Data frame的 duplicated方 法返回一個布爾型 Series, 表示各行是否是重複行:
還有一個與此相關的drop duplicates方法,它用於返回一個移除了重複行的DataFrame
這兩個方法默認會判斷 全部列,你也可以指定部分列進行重複項判斷。 假設你還有一列值,且只希望根據k1列過濾重複 項:
duplicated和 drop_duplicates 默認保留的是第一個出現的值組合。傳入keep。
利用函數和映射進行轉換,也可以直接傳入一個能直接完成此功能的函數。

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章