轉載請註明出處:https://leytton.blog.csdn.net/article/details/101344233
如果本文對您有所幫助,請點個贊讓我知道哦 😃
1、課程介紹
歡迎來到Kaggle Learning《機器學習中級》微課程!
如果你有一些機器學習的基礎,並且你想學習如何快速提高模型的質量,那麼你就來對地方了!在這個微型課程中,你將學習如何:
- 處理現實數據集中常見的數據類型(
缺失的值、分類變量
), - 設計
pipelines
來提高機器學習代碼的質量, - 使用先進的技術進行模型驗證(
交叉驗證
), - 建立最先進的模型,廣泛用於贏得Kaggle比賽(
XGBoost
),和 - 避免常見和重要的數據科學錯誤(
泄漏
)。
在此過程中,你將通過使用各個新主題的真實數據完成實際操作來鞏固你的知識。實際操作數據來自於賽題 Housing Prices Competition for Kaggle Learn Users, 你將使用79個不同的統計變量(如屋頂類型、臥室數量和浴室數量)來預測房價。通過提交預測結果,觀察你在排行榜上的名次上升!
2、先決條件
如果你以前構建過機器學習模型,並且熟悉模型驗證、欠擬合和過擬合以及隨機森林等主題,那麼你已經爲這門微型課程做好了準備。
如果你對機器學習完全陌生,請學習我們的微課程《機器學習入門》,它涵蓋了機器學習的基礎知識。
3、去吧,皮卡丘
繼續第一個練習,學習如何向Kaggle競賽提交預測結果,並確定在開始之前可能需要檢查的內容。
原文:
https://www.kaggle.com/alexisbcook/introduction