研究人员教LLMS解决复杂的计划挑战

这个新框架利用了模型的推理能力来创建一个“智能助手”,从而找到了多步问题的最佳解决方案。

来源:MIT新闻 - 人工智能

想象一家咖啡公司试图优化其供应链。该公司来自三个供应商的豆类,将它们在两个设施中烤成深色或淡咖啡,然后将烤咖啡运送到三个零售地点。供应商具有不同的固定容量,烘焙成本和运输成本的各个地方各不相同。

该公司试图最大程度地减少成本,同时满足需求增加23%。

公司对Chatgpt提出一个最佳计划不是很容易吗?实际上,尽管他们所有令人难以置信的能力,但大型语言模型(LLM)的表现通常会直接解决如此复杂的计划问题时表现不佳。

不是试图改变模型以使LLM成为更好的计划者,而是采取了不同的方法。他们引入了一个框架,该框架指导LLM像人类一样分解问题,然后使用功能强大的软件工具自动解决它。

用户只需要描述自然语言的问题 - 不需要特定于任务的示例即可训练或提示LLM。该模型将用户的文本提示编码为一种格式,该格式可以被旨在有效破解非常艰难的计划挑战的优化求解器所揭示的格式。

在配方过程中,LLM在多个中间步骤中检查其工作,以确保将计划正确描述给求解器。 如果发现错误而不是放弃,LLM试图修复公式的破损部分。

研究人员在九个复杂的挑战上测试了他们的框架,例如最小化距离仓库机器人必须旅行以完成任务时,它实现了85%的成功率,而最佳基线仅达到了39%的成功率。

多功能框架可以应用于一系列多步计划任务,例如调度机组人员或在工厂管理机器时间。

这项研究的论文

优化101

完善计划