蒙特卡罗关键词检索结果

通过扭曲顺序蒙特卡罗对数学问题进行分步推理

Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo

增强大型语言模型 (LLM) 的多步推理能力一直是一个持续的挑战。最近,验证已显示出通过评估生成的输出来提高解决方案一致性的希望。然而,当前的验证方法存在采样效率低下的问题,需要大量样本才能达到令人满意的性能。此外,训练有效的验证者通常依赖于广泛的过程监督,而这需要高昂的成本。在本文中,我们通过引入一种基于 Twisted 的新型验证方法来克服这些限制...