Pycaret是Python中的一個開源可自動化機器學習工作流程的低代碼機學習庫。它是一種端到端的機器學習和模型管理工具。要了解有關Pycaret的更多信息,可以查看官方網站或GitHub。
1、與最新版本的Scikit-Learn完全兼容
Pycaret 2.x需要Scikit-Learn 0.23.2,如果您想在同一Python環境中使用Scikit-Learn和Pycaret的最新版本是不可能的,但是 Pycaret 3.0將與Scikit-Learn的最新版本完全兼容。
2、面向對象的API
PyCaret很棒,但缺乏面向對象的思想。通過加入類和對象,PyCaret改變了從1.0開始的工作方式,
# Functional API (Existing)
# load dataset
from pycaret.datasets import get_data
data = get_data('juice')
# init setup
from pycaret.classification import *
s = setup(data, target = 'Purchase', session_id = 123)
# compare models
best = compare_models()
這很方便,但如果現在你想在同一個notebook上運行不同參數的多個實驗,你可能就會遇到參數被覆蓋的問題,並且因爲是變量的形式,這些參數被覆蓋了你也很難發現他們。現在有了新的面向對象的API,參數保存在對象中,不會產生多餘的變量,簡化了操作。
# load dataset
from pycaret.datasets import get_data
data = get_data('juice')
# init setup 1
from pycaret.classification import ClassificationExperiment
exp1 = ClassificationExperiment()
exp1.setup(data, target = 'Purchase', session_id = 123)
# compare models init 1
best = exp1.compare_models()
# init setup 2
exp2 = ClassificationExperiment()
exp2.setup(data, target = 'Purchase', normalize = True, session_id = 123)
# compare models init 2
best2 = exp2.compare_models()
你還可以使用get_leaderboard函數爲每個實驗生成結果列表,然後進行比較。
完整文章:
https://avoid.overfit.cn/post/5a08306734164b128837e4aca4291554