详细内容或原文请订阅后点击阅览
在干净的环境中训练 AI 代理使它们在混乱中脱颖而出
大多数 AI 训练都遵循一个简单的原则:将训练条件与现实世界相匹配。但麻省理工学院的新研究正在挑战 AI 开发中的这一基本假设。他们的发现?当 AI 系统在干净、简单的环境中进行训练时,它们在不可预测的情况下通常会表现得更好——而不是在它们将面临的复杂条件下 […] 文章在干净的环境中训练 AI 代理使它们在混乱中脱颖而出首次出现在 Unite.AI 上。
来源:Unite.AI大多数 AI 训练都遵循一个简单的原则:将训练条件与现实世界相匹配。但麻省理工学院的新研究正在挑战 AI 开发中的这一基本假设。
麻省理工学院的新研究他们的发现?当 AI 系统在干净、简单的环境中进行训练时,它们在不可预测的情况下通常表现更好——而不是在部署时将面临的复杂条件下。这一发现不仅令人惊讶——它很可能重塑我们对构建更强大的 AI 系统的看法。
研究团队在研究 Pac-Man 和 Pong 等经典游戏时发现了这种模式。当他们在可预测的游戏版本中训练 AI,然后在不可预测的版本中对其进行测试时,它的表现始终优于直接在不可预测的条件下训练的 AI。
除了这些游戏场景之外,这一发现还对未来 AI 在现实世界中的应用开发具有重要意义,从机器人到复杂的决策系统。
AI 发展的未来传统方法
到目前为止,AI 训练的标准方法遵循明确的逻辑:如果您希望 AI 在复杂条件下工作,请在相同的条件下对其进行训练。
这导致:
- 旨在匹配现实世界复杂性的训练环境在多个具有挑战性的场景中进行测试在创建逼真的训练条件方面投入大量资金
但这种方法存在一个根本问题:当您从一开始就在嘈杂、不可预测的条件下训练 AI 系统时,它们很难学习核心模式。环境的复杂性会干扰它们掌握基本原理的能力。
但这种方法存在一个根本问题:这会带来几个关键挑战:
这会带来几个关键挑战: 这会带来几个关键挑战: