推理领域信息情报检索---XiaoMi-AI

自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们，会怎样？我们对并行推理领域的最新进展进行了详细分析，特别是自适应并行推理。披露：这篇文章部分是景观调查，部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025)，这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。动机除了数据和参数缩放之外，LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的（OpenAI 等人，2024 年；DeepSeek-AI 等人，2025 年）。显式输

走向数据科学

2026年5月7日 13:30

随着它们对现实的建模越来越好，主要推理模型如何汇聚到同一个“大脑”

How Major Reasoning Models Converge to the Same “Brain” as They Model Reality Increasingly Better

因为只有一个现实需要建模！主要推理模型如何在对现实建模越来越好时收敛到同一个“大脑”一文首先出现在《走向数据科学》上。

MIT新闻 - 人工智能

2026年5月5日 17:00

人与机器玩的游戏：理清战略推理以推进人工智能

Games people — and machines — play: Untangling strategic reasoning to advance AI

助理教授 Gabriele Farina 挖掘复杂多智能体场景中决策的基础。

Apple机器学习研究

2026年5月1日 00:00

强化代理：工具调用代理的推理时间反馈

Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents

本文被 ACL 2026 第五届自然语言生成、评估和指标研讨会接受。工具调用代理在工具选择、参数准确性和范围识别方面进行评估，但 LLM 轨迹评估本质上仍然是事后评估。与活动执行循环断开连接，此类评估可以识别通常通过即时调整或重新训练来解决的错误，并且从根本上无法实时纠正代理。为了弥补这一差距，我们在推理时将评估转移到执行循环中：专门的审阅代理评估......

Apple机器学习研究

2026年5月4日 00:00

PORTool：使用奖励树进行重要性感知策略优化，用于多工具集成推理

PORTool: Importance-Aware Policy Optimization with Rewarded Tree for Multi-Tool-Integrated Reasoning

多工具集成推理使 LLM 授权的工具使用代理能够通过将自然语言推理与对外部工具的调用交错来解决复杂的任务。然而，使用仅结果奖励来训练此类代理会受到信用分配模糊性的影响，从而模糊了哪些中间步骤（或工具使用决策）会导致成功或失败。在本文中，我们提出了 PORTool，这是一种重要性感知的策略优化算法，可以通过结果级别的监督来增强代理的工具使用能力，同时在步骤级别上分配奖励。具体来说，PORTool 会产生奖励......

NVIDIA 博客 _机器人技术

2026年6月3日 15:00

NVIDIA 研究解锁高级抓取、更智能的自动驾驶和大规模代理训练

NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale

机器人抓手的有用之处不是它可以拾取一个物体，而是它可以使用以前从未握住过的工具拾取下一个物体，以及再下一个物体。自动驾驶汽车系统的安全性不仅仅在于它能够对情况进行推理，还在于 [...]

Novataxa | 物种新发现

2026年6月2日 14:38

[昆虫学 • 2026] Dolichopoda balrogi • 探究太深：来自希腊卡斯特洛里佐岛的一种新穴居 Dolichopoda（直翅目：Rhaphidophoridae）的形态和分子描述

[Entomology • 2026] Dolichopoda balrogi • Delving too Deep: Morphological and Molecular Description of A New Cave-dwelling Dolichopoda (Orthoptera: Rhaphidophoridae) from Kastellorizo Island, Greece

Dolichopoda balrogi Kalaentzis & Alexiou, A. 女性个体。 B.男性个体。 C. Juvenile.in Kalaentzis、Alexiou、Christopoulos、Minoudi、Koutsogiannopoulos、Kotselis et Triantafyllidis，2026。DOI：doi.org/10.3897/jor.35.187943照片：K. Kalaentzis.Abstract一种洞穴蟋蟀新种，Dolichopoda balrogi sp。 11月，描述于希腊卡斯特洛里佐岛（多德卡尼斯群岛，黎凡特海）。该物种是在人工地下栖息

亚马逊云科技 _机器学习

2026年6月1日 16:07

使用 Amazon FSx for Lustre 和 TurboQuant 上的 GPUDirect 加速 LLM 模型加载并增加上下文窗口

Accelerate LLM model loading and increase context windows with GPUDirect on Amazon FSx for Lustre and TurboQuant

如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM)，您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大，GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数，GPU 环境不断增长 [...]

亚马逊云科技 _机器学习

2026年6月1日 16:12

AgentOps：使用 Amazon Bedrock AgentCore 大规模运营代理 AI

AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore

当您构建代理 AI 解决方案时，您会面临独特的运营挑战。代理会做出不可预测的决策，成本会意外上升，并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策，并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地，它是在生产中部署、管理和持续改进 AI 代理的操作规程。

亚马逊云科技 _机器学习

2026年6月1日 21:31