python EXCEL 重複篩查,重複留最舊數據 生成新EXCEL

#drop_duplicates去除DataFrame重複項參數詳解
import pandas as pd

frame = pd.DataFrame(pd.read_excel("F:/test/篩選不重複數據表.xlsx", "Sheet1"))
print(frame)
frame.drop_duplicates(subset=['編號'],keep='first',inplace=True)

#drop_duplicates用法:subset=['A','B'] 需要去重複的列  lread_csv
#keep 遇到重複的時保留第一個還是保留最後一個 'first’表示保留第一次出現的重複行,是默認值。
#keep另外兩個取值爲"last"和False,分別表示保留最後一次出現的重複行和去除所有重複行。
#inplace 去除重複項,還是保留重複項的副本 =True表示直接在原來的DataFrame上刪除重複項,而默認值False表示生成一個副本
#data.to_excel('路徑+名字.xlsx') 或者 data.to_csv(路徑+名字.csv', encoding='utf8')
frame.to_excel("F:/test/篩選不重複數據表-(已去重).xlsx")
print(frame)
print("去重成功!")

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章