【python】pandas匹配拼接兩個excel列

在excel處理大量數據匹配過程中,雖然可以使用vlookup,但是數據量超過10萬進行批量匹配的時候,效率非常差,因此使用python。經查,發現python通過pandas庫的merge可以實現類似於SQL中join的功能,具體參考下文:

 

https://pandas.pydata.org/pandas-docs/stable/getting_started/comparison/comparison_with_sql.html#compare-with-sql-join

 

import pandas as pd
import numpy as np

# %%
with pd.ExcelFile('xx.xlsx') as xls:
    df1 = pd.read_excel(xls,'Sheet1')
    df2 = pd.read_excel(xls,'Sheet2')

outer=pd.merge(df1,df2,on='key')

outer.to_excel('outer_function.xlsx',index=False,encoding='utf-8')

最終實現Sheet1和Sheet2基於相同key字段的匹配,拼接。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章