对DataFrame中的数据进行shuffle

方法一

使用sklearn的方法shuffle()
shuffle过程为:

from sklearn.utils import shuffle
df = shuffle(df)

方法二

使用pandas的随机抽样方法df.sample()
shuffle过程为:

df = df.sample(frac=1.0)

此时不仅会将数据按行打乱,同时数据的行索引也会被打乱。若想要打乱后的数据索引重新从0开始排列,使用下列方法:

df = df.sample(frac=1.0).reset_index(drop=True)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章