点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
最近几十年,连续决策任务主要通过专家系统和强化学习来解决。但是,这些方法仍然无法被概括地以低成本解决新任务。在本文中,我们讨论了一种新颖的范式,该范式利用基于变形金刚的序列模型来解决决策任务,名为大型决策模型。从离线增强学习方案开始,早期表明,可以将顺序建模用于培训有足够的专家轨迹的有效政策。当序列模型较大时,已经观察到了其对各种任务的概括能力,并且已经观察到了对新任务的快速适应,这是使代理在不久的将来实现人工通用智能的高潜力。
主要关键词