Pycaret 3.0的RC版本已經發布了,什麼重大的改進呢?

Pycaret是Python中的一個開源可自動化機器學習工作流程的低代碼機學習庫。它是一種端到端的機器學習和模型管理工具。要了解有關Pycaret的更多信息,可以查看官方網站或GitHub。

1、與最新版本的Scikit-Learn完全兼容

Pycaret 2.x需要Scikit-Learn 0.23.2,如果您想在同一Python環境中使用Scikit-Learn和Pycaret的最新版本是不可能的,但是 Pycaret 3.0將與Scikit-Learn的最新版本完全兼容。

2、面向對象的API

PyCaret很棒,但缺乏面向對象的思想。通過加入類和對象,PyCaret改變了從1.0開始的工作方式,

  1. # Functional API (Existing)
  2. # load dataset
  3. from pycaret.datasets import get_data
  4. data = get_data('juice')
  5. # init setup
  6. from pycaret.classification import *
  7. s = setup(data, target = 'Purchase', session_id = 123)
  8. # compare models
  9. best = compare_models()

這很方便,但如果現在你想在同一個notebook上運行不同參數的多個實驗,你可能就會遇到參數被覆蓋的問題,並且因爲是變量的形式,這些參數被覆蓋了你也很難發現他們。現在有了新的面向對象的API,參數保存在對象中,不會產生多餘的變量,簡化了操作。

  1. # load dataset
  2. from pycaret.datasets import get_data
  3. data = get_data('juice')
  4. # init setup 1
  5. from pycaret.classification import ClassificationExperiment
  6. exp1 = ClassificationExperiment()
  7. exp1.setup(data, target = 'Purchase', session_id = 123)
  8. # compare models init 1
  9. best = exp1.compare_models()
  10. # init setup 2
  11. exp2 = ClassificationExperiment()
  12. exp2.setup(data, target = 'Purchase', normalize = True, session_id = 123)
  13. # compare models init 2
  14. best2 = exp2.compare_models()

你還可以使用get_leaderboard函數爲每個實驗生成結果列表,然後進行比較。

完整文章:

 

https://avoid.overfit.cn/post/5a08306734164b128837e4aca4291554

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章