Fighting Tool Sprawl: The Case for AI Tool Registries
随着企业人工智能代理采用规模的扩大,集中式组织级工具基础设施的缺乏正在产生复合成本。当围绕优化部署速度而采用时,企业就会面临一系列风险:重复的工程工作、安全漏洞和操作不透明。每个企业都需要自己的共享工具注册表,反映其特定的[...]
Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling
自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输