對於pandas中的Dataframe,如果需要按照列A進行分組,將同一組的列B求和,可以通過下述操作完成:
df = df.groupby(by=['column_A'])['column_B'].sum()
生成的數據類型是Series,如果進一步需要將其轉換爲dataframe,可以調用Series中的to_frame()方法.
df = df.to_frame()
# index column_A
# column_B ->column_B values
可以取出上述dataframe中的index,生成新的一列,並刪除原dataframe中的index.
df['column_A'] =df.index
df =df.reset_index(drop= True)