深度主动学习——一种新的模型训练方法

深度主动学习将传统的神经网络训练与战略数据样本选择相结合。这种创新方法可在广泛的应用中提高模型性能、效率和准确性。

来源:Qudata

深度主动学习——一种新的模型训练方法

最近发表在《智能计算》上的一篇评论文章揭示了深度主动学习 (DeepAL) 这一新兴领域,该领域将主动学习原理与深度学习技术相结合,以优化人工智能任务神经网络训练中的样本选择。

深度主动学习

深度学习以其从数据中学习复杂模式的能力而闻名,长期以来一直被誉为人工智能领域的游戏规则改变者。然而,它的有效性取决于大量用于训练的标记数据,这是一个资源密集型的过程。您可以在我们的文章《机器学习与深度学习:了解差异》中了解有关深度学习的更多信息。

机器学习与深度学习:了解差异

另一方面,主动学习通过策略性地选择最具信息量的样本进行注释来提供解决方案,从而减轻注释负担。

通过在基础模型框架内结合深度学习的优势和主动学习的效率,研究人员正在为人工智能研究和应用开辟新的可能性。OpenAI的GPT-3和谷歌的BERT等基础模型是在海量数据集上进行预训练的,只需进行少量微调,即可在自然语言处理和其他领域拥有无与伦比的能力。

图1 DeepAL结构示意图

图1 DeepAL结构示意图

深度主动学习策略分为四类:基于不确定性、基于分布、混合和自动设计。基于不确定性的策略关注具有高度不确定性的样本,而基于分布的策略优先考虑代表性样本。混合方法结合了这两种指标,而自动设计的策略利用元学习或强化学习进行自适应选择。