详细内容或原文请订阅后点击阅览
麻省理工学院的研究人员开发出一种训练更可靠 AI 代理的有效方法
该技术可以使人工智能系统更好地完成涉及多变性的复杂任务。
来源:MIT新闻 - 人工智能从机器人技术到医学再到政治学,各个领域都在尝试训练 AI 系统做出各种有意义的决策。例如,使用 AI 系统智能控制拥堵城市的交通可以帮助驾驶员更快地到达目的地,同时提高安全性或可持续性。
不幸的是,教会 AI 系统做出正确的决策并非易事。
这些 AI 决策系统的基础强化学习模型在面对它们所训练执行的任务的哪怕是微小的变化时仍然经常失败。在交通方面,模型可能难以控制一组具有不同速度限制、车道数量或交通模式的交叉路口。
为了提高强化学习模型对具有多变性的复杂任务的可靠性,麻省理工学院的研究人员引入了一种更有效的算法来训练它们。
该算法策略性地选择训练 AI 代理的最佳任务,以便它可以有效地执行相关任务集合中的所有任务。在交通信号控制的情况下,每个任务可以是包含城市所有交叉路口的任务空间中的一个交叉路口。
通过专注于对算法整体有效性贡献最大的少数交叉路口,该方法可以最大限度地提高性能,同时保持较低的训练成本。
研究人员发现,在一系列模拟任务上,他们的技术比标准方法效率高 5 到 50 倍。这种效率的提高有助于算法以更快的方式学习更好的解决方案,最终提高 AI 代理的性能。
与她一起撰写论文的还有 CEE 研究生 Jung-Hoon Cho、电气工程与计算机科学系 (EECS) 研究生 Vindula Jayawardana 和 IDSS 研究生 Sirui Li。这项研究将在神经信息处理系统会议上发表。
论文