从机器学习工程师那里学习 - 第2部分:数据集
在第1部分中,我们讨论了收集良好图像数据并为您的图像分类项目分配适当标签的重要性。另外,我们讨论了您数据的类和子类。这些似乎很简单,但是要对未来有一个扎实的理解很重要。因此,如果您还没有,请[…]从机器学习工程师那里进行的帖子学习 - 第2部分:数据集首先出现在数据科学上。
来源:走向数据科学在第1部分中,我们讨论了收集良好图像数据并为您的图像分类项目分配适当标签的重要性。另外,我们讨论了您数据的类和子类。这些似乎很简单,但是要对未来有一个扎实的理解很重要。因此,如果没有,请检查一下。
第1部分 图像分类现在,我们将讨论如何构建各种数据集以及对我的应用程序效果很好的技术。然后,在下一部分中,我们将超越简单的精度来评估您的模型。
下一个部分我将再次使用示例动物园动物图像分类应用程序。
数据集
数据集作为机器学习工程师,我们都熟悉火车验证测试集,但是当我们包括第1部分中讨论的子类的概念时,并将其纳入下面讨论的概念以设置最低和最大图像计数每个类别以及分阶段和合成数据的组合,过程变得更加复杂。我必须创建一个自定义脚本来处理这些选项。
第1部分我将在分配培训数据之前引导您浏览这些概念: