pandas之多行按類合併爲一行

原創

fff2zrx

2020-06-28 17:48

前言

前面講到explode操作是把某一列中的嵌套列表拆分爲多行
那有時候我們會有着相反的需求，即按照某一列，把相同值對應的多行合併成一行

原理

主要用到groupby函數+apply函數

讀取數據

data=pd.read_csv('data.csv',header=None)
data.columns=['car_id','time','lon','lat']

2. 多列合併爲一列

def merge_cols(Series):
    # 獲取非空項
    Series=Series[Series.notna()]
    # 獲取當行所有數據
    value=Series.value
    # 將每一行的數據變爲一個一層嵌套的列表
    result=[value[0],value[1],value[2]]
    return result
data['tra_info']=data.iloc[:,1:].apply(merge_cols,axis=1)

也可以使用匿名函數寫

data['tra_info']=data.iloc[:,1:].apply(lambda x: [x.values[0],x.values[1],x.values[2]],axis=1)

3. 多行合併爲一行

new_data=data.groupby(['car_id'],as_index=False)["tra_info"].apply(list)

也可以使用匿名函數寫

new_data=data.groupby(['car_id'],as_index=False)["tra_info"].apply(lambda x :list(x))

完整代碼：

import pandas as pd
def merge_cols(Series):
    # 獲取非空項
    Series=Series[Series.notna()]
    # 獲取當行所有數據
    value=Series.values
    # 將每一行的數據變爲一個一層嵌套的列表
    result=[value[0],value[1],value[2]]
    return result
data=pd.read_csv('data.csv',header=None)
data.columns=['car_id','time','lon','lat']
print(data)
# data['tra_info']=data.iloc[:,1:].apply(merge_cols,axis=1)
data['tra_info']=data.iloc[:,1:].apply(lambda x: [x.values[0],x.values[1],x.values[2]],axis=1)
data=data.drop(['time','lon','lat'],axis=1)
print(data)
# new_data=data.groupby(['car_id'],as_index=False)["tra_info"].apply(list)
new_data=data.groupby(['car_id'],as_index=False)["tra_info"].apply(lambda x :list(x))
print(new_data)
new_data.to_csv('tra_data.csv',index=False)

參考鏈接：
如何根據多列的值將多行與python pandas 合併成一行

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pandas之多行按類合併爲一行

前言

原理

C#開源的兩款功能強大的錄屏神器

認知提升的方法

螞蟻面試：Springcloud核心組件的底層原理，你知道多少？

Spark學習筆記（二）：RDD編程基礎

如何加載訓練完畢後的模型文件繼續訓練模型

做完線性迴歸後應該知道的知識

Python3正則匹配

pandas學習（三）：數據拼接、數據合併和數據聚合

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結