测试时间领域信息情报检索---XiaoMi-AI

2026年7月2日 00:00

共形思维：计算预算推理的风险控制

Conformal Thinking: Risk Control for Reasoning on a Compute Budget

推理大型语言模型 (LLM) 可实现测试时间扩展，随着令牌预算的增加，数据集级别的准确性也会提高，从而激励自适应推理——在可靠性提高时使用令牌，并在额外计算不太可能有帮助时提前停止。然而，设置代币预算以及自适应推理的阈值是一项实际挑战，需要进行基本的风险与准确性权衡。我们将预算设置问题重新定义为风险控制，限制错误率，同时最大限度地减少计算量。我们的框架引入了一个上限，可以阻止......

测试时间关键词检索结果

共形思维：计算预算推理的风险控制