详细内容或原文请订阅后点击阅览
我如何使用仅10行Python
使用LazyPredict和Pycaret跳过咕unt的工作并直接跳到性能。我如何用仅10行Python自动化机器学习工作流程,这首先出现在数据科学上。
来源:走向数据科学是神奇的 - 直到您试图决定用于数据集的哪种型号为止。您应该随机森林或逻辑回归吗?如果幼稚的贝叶斯模型两者都优于两者,该怎么办?对于我们大多数人来说,回答这意味着数小时的手动测试,模型构建和混乱。
但是,如果您可以自动化整个模型选择过程?在本文中,我会引导您完成一个简单但功能强大的Python自动化,该自动化自动为您的数据集选择了最佳的机器学习模型。您不需要深入的ML知识或调整技巧。只需插入您的数据,然后让Python完成其余的工作。
python为什么自动选择ML模型选择?
有多种原因,让我们看看其中一些。考虑一下:
- 大多数数据集都可以通过多种方式进行建模。手动尝试每个模型是耗时的。尽早使用错误的模型可能会使您的项目脱轨。
自动化让您:
- 立即比较数十个模型。在不编写重复代码的情况下获取性能指标。根据准确性,F1分数或RMSE识别表现最好的算法。
它不仅方便,而且是智能的ML卫生。
库我们将使用
我们将探索2个被低估的Python ML自动化库。这些都是懒惰的和Pycaret。您可以使用下面给出的PIP命令安装这两个。
懒惰 pycaret。pip安装lazypredictpip安装pycaret
导入所需库
现在我们已经安装了所需的库,让我们导入它们。我们还将导入一些其他库,这些库将帮助我们加载数据并为建模做准备。我们可以使用下面给出的代码导入它们。
加载数据集
链接使用LazyPredict
使用pycaret
下面的代码将:
全部分为两行代码。