从机器学习工程师那里学习 - 第1部分:数据

据说,要使机器学习模型成功,您需要拥有良好的数据。尽管这是真的(而且很明显),但很难定义,构建和维持良好的数据。让我与您分享几年来我学到的独特过程[…]从机器学习工程师那里进行的帖子学习 - 第1部分:数据首先出现在数据科学方面。

来源:走向数据科学

据说,要使机器学习模型成功,您需要拥有良好的数据。尽管这是真的(而且很明显),但很难定义,构建和维持良好的数据。让我与您分享我几年来构建不断增长的图像分类系统的独特过程,以及如何将这些技术应用于您自己的应用程序。

持久和勤奋,您可以避免经典的“垃圾,垃圾淘汰”,最大化模型的准确性,并展示真正的业务价值。

在这一系列文章中,我将深入研究多级,单标图像分类应用程序的护理和喂养,以及达到最高效果的最高水平。我不会进入任何编码或特定的用户界面,只是您可以通过可用的工具来合并的主要概念。

这是文章的简要描述。您会注意到该模型是列表中的最后一个,因为我们首先需要专注于策划数据:

背景

背景

在过去的六年中,我主要专注于为制造公司构建和维护图像分类应用程序。回到我开始时,大多数软件都不存在或太贵了,所以我从头开始创建了这些软件。在这段时间里,我已经部署了两个标识符应用程序,最大的手柄为1,500个班级,精度达到97-98%。

大约八年前,我开始了用于数据科学和机器学习的在线研究。因此,当创建AI应用程序的激动人心的机会出现时,我准备构建我需要利用最新进步的工具。我双脚跳进去!

数据科学

这一切都从数据开始

这一切都从数据开始

示例应用 - 动物动物

示例应用 - 动物动物

这是您的挑战:

  • 品种 - 动物园有很多不同的动物,其中许多人看起来非常相似。
  • 不是