【skit-learn】train_test_split分割數據集

當我們獲取到數據集的時候,會覺得寫一個單獨寫一個分割數據集的函數很費事,要考慮到隨機性和訓練集測試集的比例大小。skit-learn提供了一種分割訓練集測試集的函數

X_train,X_test,y_train,y_test = train_test_split(features, labels, test_size=0.2, shuffle=False, random_state=42) 

test_size=0.2表示測試集佔比。
shuffle=false表示在拆分訓練集測試集前是否對數據進行混洗。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章