本文最初发表在 Towards Data Science 博客,经原作者 Moez Ali 授权,InfoQ 中文站翻译并分享。
PyCaret 是一个用 Python 编写的开源、低代码的机器学习库,可以将机器学习工作流实现自动化。它是一个端到端的机器学习和模型管理工具,可以加快机器学习实验周期,并提高工作效率。目前,PyCaret 2.0已经发布。
与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,仅用很少的单词就可以替换数百行代码。这使得实验的速度和效率呈指数级增长。
为什么要用 PyCaret?
PyCaret 2.0的主要功能包括:数据准备、模型训练、超参数调整、分析&可解释性、模型选择、实验日志等。
安装 PyCaret 2.0
安装 PyCaret 非常简单,只需几分钟即可。我们强烈建议使用虚拟环境,以避免与其他库的潜在冲突。请参阅下面的示例代码来创建一个 conda 环境并在该 conda 环境中安装 PyCaret:
# create a conda environment
conda create --name yourenvname python=3.6
# activate environment
conda activate yourenvname
# install pycaret
pip install pycaret==2.0
# create notebook kernel linked with the conda environment python -m ipykernel install --user --name yourenvname --display-name "display-name"
如果你使用的是 Azure Notebook 或 Google Colab,请运行以下代码来安装 PyCaret:
!pip install pycaret==2.0
使用 pip 安装 PyCaret 时,所有硬依赖项都会自动安装。
原文链接:【https://www.infoq.cn/article/vRsq7bi8p1a4OxT56yXV】。未经作者许可,禁止转载。