以下是我的學習筆記,以及總結,如有錯誤之處請不吝賜教。
本文主要介紹sklearn工具庫相關使用,以及部分內容解釋,最後有相關案例代碼。
首先看一張圖,這張圖是構建機器學習系統的一般流程:
還記得之前的一篇文章中有一張sklearn機器學習模型選擇流程的一張圖與此類似:沒看過的請看過來
最常用sklearn部分:
使用sklearn庫我們最常用到的是三個部分,分別是:
- scikit-learn Tutorials:主要是最基本的sklearn應用流程,以及示例
- User Guide:導航頁和算法指南,主要是引導你選擇何種算法
- API Reference,這個就是最重要的api頁面,我們要調用任何api都可以在這裏查到。它主要對應機器學習的幾個流程:
- 數據預處理(preprocessing and normalizaiton)
- 特徵抽取(feature extraction)
- 特徵選擇(feature selection)
- 各種模型算法
- 模型調優與超參數選擇(model selection)
- 模型融合與增強(ensemble methods)
- 模型評估(metrics)
最基本用法:
- fit(擬合)
- transform(變換)
- fit_transform(擬合變換)
- predict(預測)
- predict_prob(預測概率)
如果你英文不是很好,這裏還有貼心的中文api文檔:scikit-learn 0.18 中文文檔
最後,還是案例代碼:歡迎關注我的github
To be continue.....