ASPERA: A Simulated Environment to Evaluate Planning for Complex Action Execution
这项工作评估了大语言模型(LLM)对能够进行复杂行动执行的数字助手的潜力。这些助手依靠预先训练的编程知识来执行多步目标,通过将助手库中定义的对象和功能撰写为行动执行程序。为了实现这一目标,我们开发了Aspera,该框架包括助理图书馆模拟和人为辅助的LLM数据生成引擎。我们的引擎允许开发人员指导LLM生成由复杂用户查询,模拟状态和…
Do you want one of the best jobs in the world?
您是一位出色的儿科研究人员,在她或他的职业生涯中建立了良好的研究人员,拥有丰富的领先研究人员和研究团队的经验并执行程序化计划?您是否对与政策相关的研究有承诺,并且您是否对与教职员工,外部研究合作者,资助者,运营式培养和维持生产关系的可能性感到充满活力[…]您是否希望世界上最好的工作之一?首次出现在偶然的经济学家中。