约定：

import pandas as pd

Merge-数据库风格的合并

数据的合并（merge）和连接（join）是我们在数据分析和挖掘中不可或缺的，是通过一个或一个以上的键连接的。pandas的合并（merge）的的绝大功能和数据库操作类似的。具有如下参数：

pd.merge(left, right, how=’inner’, on=None, left_on=None, right_on=None, left_index=False,right_index=False, sort=False, suffixes=(‘_x’, ‘_y’), copy=True, indicator=False, validate=None)

各个参数的含义：

left、right：左右连接对象

how：连接方式，共有’inner’,’left’,right’,’outer’

on：根据连接的键

left_on、right_on：在连接的键名不同的情况下使用，left_on传入左对象的键，right_on传入右对象的键

left_index、right_index：设置索引是否作为连接的键，通常 left_on=??和right_index=True, right_on=??和left_index=True，或者left_index=True和right_index=True

sort：对连接后的结果是否排序，当数据巨大的时候为了追求效率可以设置为False

suffixes：对于不作为键的同名列，在其列名后添加的后缀

copy：将左右对象的内容复制过来，默认为True

接下来是各个用法的例子：

先创建连接的左右对象

df1=pd.DataFrame({'名字':list('ABCDE'),'性别':['男','女','男','男','女'],'职称':['副教授','讲师','助教','教授','助教']},index=range(1001,1006))
df1.columns.name='学院老师'
df1.index.name='编号'
df1

代码结果：

学院老师	名字	性别	职称
编号
1001	A	男	副教授
1002	B	女	讲师
1003	C	男	助教
1004	D	男	教授
1005	E	女	助教

df2=pd.DataFrame({'名字':list('ABDAX'),'课程':['C++','计算机导论','汇编','数据结构','马克思原理'],'职称':['副教授','讲师','教授','副教授','讲师']},index=[1001,1002,1004,1001,3001])
df2.columns.name='课程'
df2.index.name='编号'
df2

代码结果：

课程	名字	职称	课程
编号
1001	A	副教授	C++
1002	B	讲师	计算机导论
1004	D	教授	汇编
1001	A	副教授	数据结构
3001	X	讲师	马克思原理

1 默认连接方式

默认下是根据左右对象中出现同名的列作为连接的键，且连接方式是on=’inner’

pd.merge(df1,df2)

代码结果：

	名字	性别	职称	课程
0	A	男	副教授	C++
1	A	男	副教授	数据结构
2	B	女	讲师	计算机导论
3	D	男	教授	汇编

2 指定列名合并

pd.merge(df1,df2,on='名字')

代码结果：

	名字	性别	职称_x	职称_y	课程
0	A	男	副教授	副教授	C++
1	A	男	副教授	副教授	数据结构
2	B	女	讲师	讲师	计算机导论
3	D	男	教授	教授	汇编

3 其他连接方式:left/right/outer

关于连接方式不懂的可参考该博客：https://blog.csdn.net/plg17/article/details/78758593

pd.merge(df1,df2,how='left')

代码结果：

	名字	性别	职称	课程
0	A	男	副教授	C++
1	A	男	副教授	数据结构
2	B	女	讲师	计算机导论
3	C	男	助教	NaN
4	D	男	教授	汇编
5	E	女	助教	NaN

pd.merge(df1,df2,how='right')

代码结果：

	名字	性别	职称	课程
0	A	男	副教授	C++
1	A	男	副教授	数据结构
2	B	女	讲师	计算机导论
3	D	男	教授	汇编
4	X	NaN	讲师	马克思原理

pd.merge(df1,df2,how='outer')

代码结果：

	名字	性别	职称	课程
0	A	男	副教授	C++
1	A	男	副教授	数据结构
2	B	女	讲师	计算机导论
3	C	男	助教	NaN
4	D	男	教授	汇编
5	E	女	助教	NaN
6	X	NaN	讲师	马克思原理

4 根据多个键进行连接

pd.merge(df1,df2,on=['职称','名字'])

代码结果：

	名字	性别	职称	课程
0	A	男	副教授	C++
1	A	男	副教授	数据结构
2	B	女	讲师	计算机导论
3	D	男	教授	汇编

5 对重复的列名处理

细心的你可能在上面的 2 观察到了，不作为连接键的相同列名更改了。那是因为当不指定连接的键的时候是将‘名字’、‘职称’作为连接的键。

pd.merge(df1,df2,on='名字',suffixes=('_1','_2'))

代码结果：

	名字	性别	职称_1	职称_2	课程
0	A	男	副教授	副教授	C++
1	A	男	副教授	副教授	数据结构
2	B	女	讲师	讲师	计算机导论
3	D	男	教授	教授	汇编

6 将索引作为连接的键

当我们连接时，无论是左右对象的索引都会被丢弃的。当们需要将索引作为连接键时可以如下方式：

pd.merge(df1,df2,left_on='性别',right_index=True)

代码结果：

	名字_x	性别	职称_x	名字_y	职称_y	课程
编号

pd.merge(df1,df2,on=['名字','职称'],left_index=True,right_index=True)

代码结果：

	名字	性别	职称	课程
编号
1001	A	男	副教授	C++
1001	A	男	副教授	数据结构
1002	B	女	讲师	计算机导论
1004	D	男	教授	汇编

谢谢大家的浏览，
希望我的努力能帮助到您，
共勉！

Pandas详解十七之Merge合并-数据库风格的合并

Merge-数据库风格的合并

各个参数的含义：

接下来是各个用法的例子：

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

基于Ubuntu-22.04安装K8s-v1.28.2实验（二）使用kube-vip实现集群VIP访问

企业大模型如何成为自己数据的“百科全书”？

本地SSL证书过期输入命令在IIS自动生成

.NET周刊【5月第2期 2024-05-12】

基于Ubuntu-22.04安装K8s-v1.28.2实验（一）部署K8s

基于Ubuntu-22.04安装K8s-v1.28.2实验（三）数据卷挂载NFS（网络文件系统）

創建樸素貝葉斯分類器、交叉驗證

Pandas詳解二之DataFrame對象

Pandas詳解七之DatetimeIndex、PeriodIndex和TimedeltaIndex時間序列

Pandas詳解一之Series對象

Pandas詳解十之Dropna濾除缺失數據

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結