改进法关键词检索结果

建设性电路放大:通过有针对性的子网络更新改进法学硕士的数学推理

Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates

之前对法学硕士内部运作的研究发现了稀疏子网络,通常称为电路,负责执行特定任务。此外,研究表明,通过微调来提高模型性能通常来自于模型中现有电路的强化。总而言之,这些发现表明直接干预此类电路以进行精确的、针对任务的更新的可能性。受这些发现的启发,我们提出了一种称为“结构性电路放大”的新方法,它可以识别关键令牌……