對DataFrame中的數據進行shuffle

方法一

使用sklearn的方法shuffle()
shuffle過程爲:

from sklearn.utils import shuffle
df = shuffle(df)

方法二

使用pandas的隨機抽樣方法df.sample()
shuffle過程爲:

df = df.sample(frac=1.0)

此時不僅會將數據按行打亂,同時數據的行索引也會被打亂。若想要打亂後的數據索引重新從0開始排列,使用下列方法:

df = df.sample(frac=1.0).reset_index(drop=True)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章