Pandas：多維透視表 - 如何重複項目標籤同時不顯示columns字段名稱

原創

2020-05-31 20:26

來源：How do I flatten a python/pandas pivot table and manipulate the column names?鏈接這裏。

問題：把一般情況下得到的透視表，變成想要的格式：

"""一般情況下，透視表如下："""
df = pd.pivot_table(DataFrame,
                    values=['BUCKET'],
                    index=['ID'],
                    columns=['TYPE'],
                    aggfunc=len)  
print(df)
# 運行結果如下：
      BUCKET
TYPE  B1     B2       B3      B4
ID
1     236    data1    data2   data3   
2     323    data4    data5   data3
3     442    data6    data2   data4
4     543    data8    data2   data3
5     676    data1    data8   data4

""" 
問題是，我想要如下所示的格式：

ID    B1     B2       B3      B4
1     236    data1    data2   data3   
2     323    data4    data5   data3
3     442    data6    data2   data4
4     543    data8    data2   data3
5     676    data1    data8   data4
"""

第一種解決方法：

先去除透視表的行名稱，最後重置透視表的index。

第1/3步： pandas.DataFrame.droplevel把“BUCKET”刪除：

df.columns = df.columns.droplevel(0) 
print(df)
# 結果如下
TYPE  B1     B2       B3      B4
ID
1     236    data1    data2   data3   
2     323    data4    data5   data3
3     442    data6    data2   data4
4     543    data8    data2   data3
5     676    data1    data8   data4

第2/3步：使用 pandas.DataFrame.rename_axis去除columns列的名稱

df_1 = df.rename_axis([None], axis=1)    # columns有N個，就用N個None
print(df_1)  # 本初的“TYPE”被重置爲空；但是 ID 和 B1,B2,B3,B4不在一行
# 結果如下
     B1     B2     B3     B4
ID                          
1   236  data1  data2  data3
2   323  data4  data5  data3
3   442  data6  data2  data4
4   543  data8  data2  data3
5   676  data1  data8  data4

第3/3步：pandas.DataFrame.reset_index重置index

df_2 = df.rename_axis(None, axis=1).reset_index() 
print(df_2)
# 結果如下
   ID   B1     B2     B3     B4
0   1  236  data1  data2  data3
1   2  323  data4  data5  data3
2   3  442  data6  data2  data4
3   4  543  data8  data2  data3
4   5  676  data1  data8  data4
#注：如果改爲df_2 = df.rename_axis(None, axis=1).reset_index(drop=True) ，則由pandas默認值取代原來的index，即'ID’被刪除。

第二種解決方法：直接保存爲csv格式，然後讀取。

df.columns = df.columns.droplevel(0)
df.to_csv('文件路徑+文件名.csv'， encoding='utf-8-sig', index=False)

打開儲存的文件可以看到：

ID	B1	B2	B3	B4
1	236	data1	data2	data3
2	323	data4	data5	data3
3	442	data6	data2	data4
4	543	data8	data2	data3
5	676	data1	data8	data4

pandas讀取 ‘文件路徑+文件名.csv’ 後，結果是

df_new = pd.read_csv('文件路徑+文件名.csv')
print(df_new)
   ID   B1     B2     B3     B4
0   1  236  data1  data2  data3
1   2  323  data4  data5  data3
2   3  442  data6  data2  data4
3   4  543  data8  data2  data3
4   5  676  data1  data8  data4

附註：在df_new的基礎上，用pandas.DataFrame.set_index把ID作爲index列，不能得到：

ID    B1     B2       B3      B4
1     236    data1    data2   data3   
2     323    data4    data5   data3
3     442    data6    data2   data4
4     543    data8    data2   data3
5     676    data1    data8   data4

得到的而是：

df_new.set_index('ID', inplace=True)
print(df_new)
# 結果如下
     B1     B2     B3     B4
ID                          
1   236  data1  data2  data3
2   323  data4  data5  data3
3   442  data6  data2  data4
4   543  data8  data2  data3
5   676  data1  data8  data4

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Pandas：多維透視表 - 如何重複項目標籤同時不顯示columns字段名稱

問題：把一般情況下得到的透視表，變成想要的格式：

第一種解決方法：

第二種解決方法：直接保存爲csv格式，然後讀取。

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

python筆記：multiprocessing 函數apply和apply_async有什麼區別？

ML筆記：分類算法之SVM

ML：常見判斷類模型好壞指標 - 混淆矩陣 & ROC曲線 & AUC & 其他

python筆記：df.plot()常見的座標軸的操作，及正常顯示負號

ML：非監督學習之聚類之 1 KMeans聚類（sklearn.cluster.KMeans)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Pandas：多維透視表 - 如何重複項目標籤 同時 不顯示columns字段名稱

問題：把一般情況下得到的透視表，變成想要的格式：

第一種解決方法：

第二種解決方法：直接保存爲csv格式，然後讀取。

Pandas：多維透視表 - 如何重複項目標籤同時不顯示columns字段名稱