當我們獲取到數據集的時候,會覺得寫一個單獨寫一個分割數據集的函數很費事,要考慮到隨機性和訓練集測試集的比例大小。skit-learn提供了一種分割訓練集測試集的函數
X_train,X_test,y_train,y_test = train_test_split(features, labels, test_size=0.2, shuffle=False, random_state=42)
test_size=0.2表示測試集佔比。
shuffle=false表示在拆分訓練集測試集前是否對數據進行混洗。