Pandas之兩個結構相同的DataFrame 互相補充|合併重疊數據 combine 和 combine_first

原創

2020-02-22 23:00

# Combine,後一個對象補齊前一個對象
# Series
s1 = Series([2,np.nan,4,np.nan], index=['A','B','C','D'])
s1
Out[29]: 
A    2.0
B    NaN
C    4.0
D    NaN
dtype: float64

s2 = Series([1,2,3,4], index=['A','B','C','D'])
s2
Out[31]: 
A    1
B    2
C    3
D    4
dtype: int64

# s1中沒有的值被s2補齊了
s1.combine_first(s2)
Out[32]: 
A    2.0
B    2.0
C    4.0
D    4.0
dtype: float64

# DataFrame,和Series類似
df1 = DataFrame({'X':[1,np.nan,3,np.nan], 'Y':[5,np.nan,7,np.nan], 'Z':[9,np.nan,11,np.nan]})
df1
Out[36]: 
     X    Y     Z
0  1.0  5.0   9.0
1  NaN  NaN   NaN
2  3.0  7.0  11.0
3  NaN  NaN   NaN

df2 = DataFrame({'Z':[np.nan,10,np.nan,12], 'A':[1,2,3,4]})
df2
Out[38]: 
   A     Z
0  1   NaN
1  2  10.0
2  3   NaN
3  4  12.0

df1.combine_first(df2)
Out[39]: 
     A    X    Y     Z
0  1.0  1.0  5.0   9.0
1  2.0  NaN  NaN  10.0
2  3.0  3.0  7.0  11.0
3  4.0  NaN  NaN  12.0

import pandas as pd
from numpy import NaN


data1 = [{'a': '1', 'b': NaN}, {'a': NaN, 'b': '2'}]

data2 = [{'a': '2', 'b': '3'}, {'a': '4', 'b': NaN}]

df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 用df2的數據填補df1的缺失值
df3 = df1.combine_first(df2)

print(df1)
print("######")
print(df2)
print("######")
print(df3)


     a    b
0    1   NaN
1   NaN   2


######
   a    b
0  2    3
1  4   NaN

######
   a  b
0  1  3
1  4  2

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Pandas之兩個結構相同的DataFrame 互相補充|合併重疊數據 combine 和 combine_first

工作中用到的腳本合集

微服務實踐Aspire項目發佈到遠程k8s集羣

通過f-string編寫簡潔高效的Python格式化輸出代碼

[轉帖]20個常用的Linux工具命令

[轉帖]PostgreSQL從小白到高手教程 - 第46講：poc-tpch測試

24-5-18 X

elasticsearch分組並獲得分組裏面的結果 group_concat

秒殺活動——理論設計

Docker容器動態添加端口

博客優化：博客文章圖片Django使用ckeditor上傳到七牛雲

教你在Nginx上使用CertBot把自己網站設置成HTTPS

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結