从机器学习工程师那里学习 - 第4部分:模型

在我系列的最新部分中,我将分享我在选择图像分类模型以及如何微调该模型时所学到的知识。我还将展示如何利用模型来加速您的标签过程,最后如何通过产生用法和性能来证明您的努力合理[…]从机器学习工程师那里进行的帖子学习 - 第4部分:该模型首先出现在朝向数据上。科学。

来源:走向数据科学

在我系列的最新部分中,我将分享我在选择图像分类模型以及如何微调该模型时所学到的知识。我还将展示如何利用模型来加速您的标签过程,最后如何通过生成使用和性能统计数据来证明您的工作合理性。

图像分类

在第1部分中,我讨论了在图像分类项目中使用的图像数据标记的过程。我展示了如何定义“良好”图像并创建子类。在第2部分中,我浏览了各种数据集,除了通常的火车验证测试集外,还具有基准集,以及如何处理合成数据和复制图像。在第3部分中,我解释了如何将不同的评估标准应用于受过训练的模型与部署的模型,并使用基准测试来确定何时部署模型。

第1部分 第2部分 第3部分

模型选择

模型选择

到目前为止,我已经将大量时间集中在标记和策划图像集上,并评估模型性能,就像将购物车放在马匹之前一样。我并不是要最大程度地减少设计大型神经网络所需的内容,这是您正在构建的应用程序中非常重要的一部分。就我而言,我花了几个星期的时间尝试了不同的可用型号,然后再解决适合该账单的模型。

选择模型结构后,通常不会对其进行任何重大更改。对我来说,部署了六年,我仍在使用相同的部署。具体而言,我之所以选择Inception V4,是因为它具有较大的输入图像大小和足够数量的图层,可以拾取微妙的图像特征。它在CPU上也足够快地进行推理,因此我不需要运行昂贵的硬件即可为模型服务。

您的里程可能会有所不同。但同样,主要要点是,专注于您的数据将支付股息与寻找最佳模型。

微调

微调 第3部分 第1部分

增强

增强

散装识别

散装识别 第1部分 未标记 第1部分 未知标签 第2部分