如何为模型构建基准

建立基准和如何做的重要性是如何首先朝着数据科学构建基准。

来源:走向数据科学

过去三年来我的科学顾问,我有机会从事各个行业的多个项目。但是,我注意到与我合作的大多数客户中的一个共同点:

他们很少对项目目标有清晰的想法。

这是数据科学家所面临的主要障碍之一,尤其是现在AI一代正在接管每个领域。

,但是让我们假设在来回一段时间后,目标变得清晰。我们设法将一个特定的问题弄清楚。例如:

我想根据他们的流失的可能性将我的客户分为两组:“搅动的可能性很高”和“搅动的可能性很小”

好吧,现在呢?简单,让我们开始构建一些型号!

错误!

如果有一个明确的目标是很少见的,那么具有可靠的基准甚至更罕见。

基准

我认为,提供数据科学项目的最重要步骤之一是与客户定义并同意一套基准。

基准集

在这篇博客文章中,我将解释:

    什么是基准,为什么要有一个基准测试,我将如何使用示例场景和一些潜在的缺点来牢记
  • 什么是基准,
  • 为什么具有基准很重要,
  • 我将如何使用示例场景和
  • 牢记一些潜在的缺点
  • 什么是基准?

    基准是评估模型性能的标准化方法。它提供了一个可以比较新模型的参考点。

    基准需要两个关键组件要完成:

      一组指标,用于评估用作基线的简单模型集
  • 一组评估性能的指标
  • 一组指标
  • 一组简单的模型用作基线
  • 一组简单模型

    概念的核心很简单:每当我开发一个新模型时,我都会将其与以前的版本和基线模型进行比较。这样可以确保改进是真实的和跟踪的。

    为什么构建基准很重要

    基线 性能