大家好,我是皮皮。
一、前言
前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示:
上一篇文章中我們已經看到了3個方法,這一篇文章我們一起來看看另外一個方法。
二、實現過程
這裏【吳超建】斗膽給了一個指導,如下所示,並給出瞭如下代碼:
from pathlib import Path
import pandas as pd
# 讀取文件(跳過第一行,不設置表頭)併合並
df = pd.concat([pd.read_csv(file, sep=" ", skiprows=1, header=None) for file in Path(r'./data/').glob('*.txt')])
# 去掉第一列時間的下劃線
df[0] = df[0].str.replace('_', ' ')
# 保存至csv
df.to_csv('txt_concat.csv')
這個方法也能順利地解決了粉絲的問題。
當然了,還有其他的方法,下一篇文章我們一起來看看。
如果你也有類似這種數據分析的小問題,歡迎隨時來交流羣學習交流哦,有問必答!
三、總結
大家好,我是皮皮。這篇文章主要盤點了一個Pandas數據合併的問題,文中針對該問題,給出了具體的解析和代碼實現,幫助粉絲順利解決了問題。
最後感謝粉絲【FiNε_】提出的問題,感謝【隔壁😼山楂】、【黑科技·鼓包】給出的思路,感謝【莫生氣】、【馮誠】等人蔘與學習交流。
【提問補充】溫馨提示,大家在羣裏提問的時候。可以注意下面幾點:如果涉及到大文件數據,可以數據脫敏後,發點demo數據來(小文件的意思),然後貼點代碼(可以複製的那種),記得發報錯截圖(截全)。代碼不多的話,直接發代碼文字即可,代碼超過50行這樣的話,發個.py文件就行。