pandas重複行處理

1、檢測重複行

import pandas as pd
dframe = pd.DataFrame({'color':['white', 'white', 'red','red', 'white'],'value':[2,1,3,3,2]})
#檢測重複行
dframe.duplicated()

2、刪除重複行

#刪除重複行,該函數返回的是刪除重複行後的DataFrame對象
dframe.drop_duplicates()

3、根據某個字段去重

#根據某個字段去重
dframe.drop_duplicates('color')


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章