使用更少数据打造更出色 AI 的 5 大方法

1. 迁移学习迁移学习现在在机器学习中被广泛使用,因为它的好处很大。总体思路很简单。你用大量数据和大量训练来训练一个大型神经网络。当你遇到一个特定问题时,你会“切断”大型网络,并用你自己的数据训练几个新的层。大型网络已经理解了很多一般模式,而通过迁移学习,你这次不必教给网络。一个很好的例子是,如果你试图训练一个网络来识别不同种类的狗的图像。如果没有迁移学习,你需要大量的数据,也许需要 100,000 张不同种类的狗的图像,因为网络必须从头开始学习一切。如果你用迁移学习训练一个新模型,你可能只需要每个种类的 50 张图像。你可以在这里阅读有关迁移学习的更多信息。2. 主动学习主动学习是一种数据收集策略,它使你能够选择你的 AI 模型在训练时最能从中受益的数据。让我们继续以狗为例。您已经训练了一个可以区分不同物种的模型,但出于某种原因,该模型总是无法识别德国牧羊犬。使用主动学习策略,您可以自动或至少通过既定流程挑选出这些图像并发送它们进行标记。我在这里发表了一篇关于主动学习如何运作的较长文章。3. 更好的数据我在这里提出了一种可能听起来不错的策略

来源:Dan Rose AI | 应用人工智能博客

1. 迁移学习

迁移学习现在在机器学习中被广泛使用,因为它的好处很大。总体思路很简单。你用大量数据和大量训练来训练一个大型神经网络。当你遇到一个特定问题时,你会“切断”大型网络,用你自己的数据训练几个新的层。大型网络已经理解了很多一般模式,而有了迁移学习,你这次就不必教给网络了。

一个很好的例子是,如果你试图训练一个网络来识别不同种类的狗的图像。如果没有迁移学习,你需要大量的数据,也许需要 100,000 张不同种类的狗的图像,因为网络必须从头开始学习一切。如果你用迁移学习训练一个新模型,你可能只需要每个种类的 50 张图像。

你可以在这里阅读有关迁移学习的更多信息。

迁移学习在这里。 迁移学习在这里。

2. 主动学习

主动学习是一种数据收集策略,可让您选择训练时对您的 AI 模型最有益的数据。我们继续以狗物种为例。您已经训练了一个可以区分不同物种的模型,但由于某种原因,该模型总是无法识别德国牧羊犬。使用主动学习策略,您可以自动或至少通过既定流程挑选出这些图像并发送它们进行标记。

我在这里发表了一篇关于主动学习如何运作的较长文章。

主动学习如何运作 主动学习如何运作

3. 更好的数据

4. GAN

对于 GAN,您仍然需要大量数据,但您不需要标记数据,而且由于标记通常是成本最高的部分,因此您可以使用这种方法节省时间和数据。

5. 概率编程

您还可以在此处阅读有关概率编程的更多信息:https://www.danrose.ai/blog/63qy8s3vwq8p9mogsblddlti4yojon

https://www.danrose.ai/blog/63qy8s3vwq8p9mogsblddlti4yojon