【Python數據科學手冊】Pandas——七、合併數據集：Concat和Append操作

原創

2020-04-19 00:27

文章目錄

七、合併數據集：Concat和Append操作

七、合併數據集：Concat和Append操作

寫一個構造Dataframe的函數

1.知識回顧： NumPy數組的合併

np.concatenate 函數，axis 參數可以設置合併的座標軸方向

2.通過pd.concat實現簡易合併

Pandas 有一個 pd.concat() 函數與 np.concatenate 語法類似，但是配置參數更多，功能也更強大
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True)
簡單地合併一維的 Series 或 DataFrame 對象

合併高維數據，相同列方向才能垂直合併，相同行索引才能水平合併

否則橫縱交叉

1）索引重複

pd.concat 在合併時會保留索引，即使索引是重複的

雖然 DataFrame 允許這麼做，但如果結果並不是我們想要的，可以通過以下方法解決：

捕捉索引重複的錯誤：設置 verify_integrity 參數
verify_integrity=False是默認的，將它改成True後，索引出現重複就會報錯
忽略索引，重新設置：設置 ignore_index 參數
增加多級索引：keys 參數

2）類似join合併

當存在要合併的Dataframe存在重合的列，可以設置join參數取並集或交集

同樣適用於行

join_axes 參數直接指定保留的行名或列名

3）append()方法

df1.append(df2)，效果與pd.concat([df1, df2]) 一樣

Pandas 的 append() 不直接更新原有對象的值

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【Python數據科學手冊】Pandas——二、Pandas對象簡介

文章目錄二、Pandas對象簡介1.Pandas的Series對象1).Serise是通用的NumPy數組2). Series是特殊的字典3). 創建Series對象2.Pandas的DataFrame對象1). DataFram

2020-07-08 10:40:51

【Python數據科學手冊】Pandas——目錄

目錄一、安裝並使用Pandas 二、Pandas對象簡介三、數據取值與選擇四、Pandas數值運算方法五、處理缺失值六、層級索引七、合併數據集：Concat與Append操作八、合併數據集：合併與連接九、累計與分組

2020-07-08 10:40:49

【Python數據科學手冊】Pandas——四、Pandas數值運算方法

文章目錄四、Pandas數值運算方法1.通用函數：保留索引2.通用函數：索引對齊1）. Series索引對齊2）. DataFrame索引對齊3.通用函數： DataFrame與Series的運算四、Pandas數值運算方

2020-07-08 10:40:46

【Python數據科學手冊】Pandas——三、數據取值與選擇

文章目錄三、數值取值與選擇1.Series數據選擇方法1). 將Series看作字典2). 將Series看作一維數組3). 索引器： loc、 iloc和ix2.DataFrame數據選擇方法1). 將DataFrame看作字典

2020-07-08 10:40:46

【Python數據科學手冊】Pandas——十一、向量化字符串操作str

十一、向量化字符串操作 1.Pandas字符串操作簡介 Pandas 爲包含字符串的 Series 和 Index 對象提供 str 屬性，既可以高效滿足向量化字符串操作的需求，又可以正確地處理缺失值。 2.Pandas字符串方

2020-07-08 10:40:46

【Python數據科學手冊】Pandas——十二、處理時間序列

十二、處理時間序列 1.Python的日期與時間工具 1）Python原生的日期使勁按工具：datetime和dateutil datetime(year, month, day[, hour[, minute[, second[

2020-07-08 10:40:44

【Python數據科學手冊】Pandas——十、數據透視表 df. pivot_table

2020-05-12 08:54:32

【Python數據科學手冊】Pandas——九、累計與分組groupby

2020-04-28 17:14:09

【Python數據科學手冊】Pandas——八、合併數據集：合併（merge）與連接（join）

2020-04-23 04:45:27

【Python數據科學手冊】Pandas——五、處理缺失值

2020-04-14 04:14:08

Pandas數據處理之合併數據集merge()

2020-02-24 19:41:07

Pandas數據處理之合併數據集

2020-02-24 19:41:07

Pandas數據處理之層級索引

2020-02-24 19:41:07

Pandas數據處理之數據透視表

2020-02-24 19:41:07

【Python數據科學手冊】Pandas——二、Pandas對象簡介

文章目錄二、Pandas對象簡介1.Pandas的Series對象1).Serise是通用的NumPy數組2). Series是特殊的字典3). 創建Series對象2.Pandas的DataFrame對象1). DataFram

2020-07-08 10:40:51

24小時熱門文章

最新文章

最新評論文章