详细内容或原文请订阅后点击阅览
在微风中构建算法 - 敏捷的ML管道
该框架现在是用于流线型ML Workflows的开源Python软件包,邮政构建算法 - 敏捷的ML管道在微风中首先出现在数据科学上。
来源:走向数据科学关于算法 - 敏捷模型构建的主题。您可以在下面的TDS上找到前两篇文章。
算法 - 敏捷模型构建具有MLFlow
使用MLFlow
撰写了这两篇文章后,我继续开发框架,它逐渐演变成比我最初设想的要大得多的东西。我决定将其包装为一个名为Mlarena的开源Python图书馆,而不是将所有内容挤入另一篇文章,而是将其包装为与其他数据和ML从业者共享。 Mlarena是一种算法 - 敏捷的机器学习工具包,支持模型培训,诊断和优化。
您可以在github上找到完整的代码库:mlarena repo🧰
mlarena repo在其核心上,mlarena被实现为自定义mlflow.pyfunc模型。这使其与MLFlow生态系统完全兼容,启用了可靠的实验跟踪,模型版本和无缝部署,无论您使用哪种基础ML库,并在必要时启用算法之间的平稳迁移。
mlflow.pyfunc
此外,它还试图在自动化和模型开发方面的专家见解之间取得平衡。许多工具要么抽象过多,因此很难理解引擎盖下发生的事情,或者需要太多的样板以使其减慢迭代的速度。 Mlarena旨在弥合这一差距:它可以使用最佳实践自动化常规机器学习任务,同时还为专家用户提供工具来更有效地诊断,解释和优化其模型。
在以下各节中,我们将研究如何在工具包的设计中反映这些想法,并浏览如何支持现实世界机器学习工作流程的实践示例。
1。轻巧的培训和评估抽象
这是一个简单的示例,说明了核心MLPiPeline对象的工作方式:
mlpipeline
评估
1.1诊断报告
beta
对于回归模型,Mlarena会自动调整其评估指标和可视化:
dumend_case