import pandas as pd
from pandas import DataFrame
import numpy as np
MultiIndex
MultiIndex表示多級索引,它是從Index繼承過來的,其中多級標籤用元組對象來表示。
一、創建MultiIndex對象
- 創建方式一:元組列表
m_index1=pd.Index([("A","x1"),("A","x2"),("B","y1"),("B","y2"),("B","y3")],name=["class1","class2"])
m_index1
代碼結果:
MultiIndex(levels=[['A', 'B'], ['x1', 'x2', 'y1', 'y2', 'y3']],
labels=[[0, 0, 1, 1, 1], [0, 1, 2, 3, 4]],
names=['class1', 'class2'])
df1=DataFrame(np.random.randint(1,10,(5,3)),index=m_index1)
df1
代碼結果:
0 | 1 | 2 | ||
---|---|---|---|---|
class1 | class2 | |||
A | x1 | 7 | 4 | 8 |
x2 | 4 | 5 | 2 | |
B | y1 | 6 | 9 | 7 |
y2 | 2 | 1 | 6 | |
y3 | 6 | 8 | 6 |
- 創建方式二:特定結構
例如**from_arrays()
class1=["A","A","B","B"]
class2=["x1","x2","y1","y2"]
m_index2=pd.MultiIndex.from_arrays([class1,class2],names=["class1","class2"])
m_index2
代碼結果:
MultiIndex(levels=[['A', 'B'], ['x1', 'x2', 'y1', 'y2']],
labels=[[0, 0, 1, 1], [0, 1, 2, 3]],
names=['class1', 'class2'])
df2=DataFrame(np.random.randint(1,10,(4,3)),index=m_index2)
df2
代碼結果:
0 | 1 | 2 | ||
---|---|---|---|---|
class1 | class2 | |||
A | x1 | 2 | 4 | 5 |
x2 | 3 | 5 | 9 | |
B | y1 | 7 | 1 | 2 |
y2 | 3 | 1 | 8 |
- c創建方式三:笛卡爾積
from_product()從多個集合的笛卡爾積創建MultiIndex對象。
m_index3=pd.MultiIndex.from_product([["A","B"],['x1','y1']],names=["class1","class2"])
m_index3
代碼結果:
MultiIndex(levels=[['A', 'B'], ['x1', 'y1']],
labels=[[0, 0, 1, 1], [0, 1, 0, 1]],
names=['class1', 'class2'])
df3=DataFrame(np.random.randint(1,10,(2,4)),columns=m_index3)
df3
代碼結果:
class1 | A | B | ||
---|---|---|---|---|
class2 | x1 | y1 | x1 | y1 |
0 | 2 | 9 | 1 | 8 |
1 | 5 | 2 | 5 | 2 |
二、MultiIndex對象屬性
df1
代碼結果:
0 | 1 | 2 | ||
---|---|---|---|---|
class1 | class2 | |||
A | x1 | 7 | 4 | 8 |
x2 | 4 | 5 | 2 | |
B | y1 | 6 | 9 | 7 |
y2 | 2 | 1 | 6 | |
y3 | 6 | 8 | 6 |
m_index4=df1.index
print(in1[0])
代碼結果:
('A', 'x1')
- 調用.get_loc()和.get_indexer()獲取標籤的下標:
print(m_index4.get_loc(("A","x2")))
print(m_index4.get_indexer([("A","x2"),("B","y1"),"nothing"]))
代碼結果:
1
[ 1 2 -1]
- MultiIndex對象使用多個Index對象保存索引中每一級的標籤:
print(m_index4.levels[0])
print(m_index4.levels[1])
代碼結果:
Index(['A', 'B'], dtype='object', name='class1')
Index(['x1', 'x2', 'y1', 'y2', 'y3'], dtype='object', name='class2')
- MultiIndex對象還有屬性labels保存標籤的下標:
print(m_index4.labels[0])
print(m_index4.labels[1])
代碼結果:
FrozenNDArray([0, 0, 1, 1, 1], dtype='int8')
FrozenNDArray([0, 1, 2, 3, 4], dtype='int8')
謝謝大家的瀏覽,
希望我的努力能幫助到您,
共勉!