Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling
自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输
AI Race: power shifts in the model wars
2026 年 4 月是人工智能历史上最具爆炸性的月份之一。 OpenAI dropped GPT-5.5, Anthropic sparked debate by withholding Claude Mythos, and new releases from Google, DeepSeek, and other Chinese labs pushed reasoning, agentic capabilities, and multimodality to new heights.
DeepSeek’s new AI model is rolling out quietly, not to the Wall Street market shock
DeepSeek 的最新人工智能模型即将重大发布。然而,尽管这家中国初创公司在其最新软件方面取得了技术进展,但市场对 DeepSeek V4 预览版的发布并没有做出预期的反应。投资者不太可能对更强大、更高效、更便宜的人工智能模型的宣布感到震惊。他们知道我们的意思,并且正在等待它做出一些令人印象深刻的事情。这并不意味着 DeepSeek 最近的努力失败了,因为它显然没有失败。虽然其最新型号的表现优于前代产品,但它仍然巩固了中国的[...]
Three reasons why DeepSeek’s new model matters
周五,中国人工智能公司 DeepSeek 发布了其期待已久的新旗舰机型 V4 的预览。值得注意的是,由于新设计有助于更有效地处理大量文本,该模型可以处理比上一代更长的提示。与 DeepSeek 之前的模型一样,V4 是开源的,这意味着它可用......