pandas實現對dataframe抽樣

隨機抽樣

import pandas as pd
#對dataframe隨機抽取2000個樣本
pd.sample(df, n=2000)

分層抽樣

利用sklean中的函數靈活進行抽樣

from sklearn.model_selection import train_test_split
#y是在X中的某一個屬性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章