Microsoft's first reasoning model is one of 7 AIs just released at Build - what we know so far
Microsoft AI 已全面加入与 MAI-Thinking-1 的对话,以及新的编码、图像和语音模型。
Solving a Murder Mystery Using Bayesian Inference
《利刃出鞘》如何教授贝叶斯思维(在您没有意识到的情况下) 使用贝叶斯推理解决谋杀之谜的帖子首先出现在《走向数据科学》上。
本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。
The Next Chapter: Clarifai Compute Orchestration and Reasoning Engine Joins Nebius
对 Gemma-3-4B、MiniCPM-o 2.6 和 Qwen2.5-VL-7B-Instruct 的延迟、吞吐量和可扩展性进行基准测试。
The Next AI Bottleneck Isn’t the Model: It’s the Inference System
企业人工智能系统正在进入一个阶段,推理设计与模型能力本身一样重要。下一个人工智能瓶颈不是模型:而是推理系统一文首先出现在《走向数据科学》上。
Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling
自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输
How Major Reasoning Models Converge to the Same “Brain” as They Model Reality Increasingly Better
因为只有一个现实需要建模!主要推理模型如何在对现实建模越来越好时收敛到同一个“大脑”一文首先出现在《走向数据科学》上。
Games people — and machines — play: Untangling strategic reasoning to advance AI
助理教授 Gabriele Farina 挖掘复杂多智能体场景中决策的基础。
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
本文被 ACL 2026 第五届自然语言生成、评估和指标研讨会接受。工具调用代理在工具选择、参数准确性和范围识别方面进行评估,但 LLM 轨迹评估本质上仍然是事后评估。与活动执行循环断开连接,此类评估可以识别通常通过即时调整或重新训练来解决的错误,并且从根本上无法实时纠正代理。为了弥补这一差距,我们在推理时将评估转移到执行循环中:专门的审阅代理评估......
PORTool: Importance-Aware Policy Optimization with Rewarded Tree for Multi-Tool-Integrated Reasoning
多工具集成推理使 LLM 授权的工具使用代理能够通过将自然语言推理与对外部工具的调用交错来解决复杂的任务。然而,使用仅结果奖励来训练此类代理会受到信用分配模糊性的影响,从而模糊了哪些中间步骤(或工具使用决策)会导致成功或失败。在本文中,我们提出了 PORTool,这是一种重要性感知的策略优化算法,可以通过结果级别的监督来增强代理的工具使用能力,同时在步骤级别上分配奖励。具体来说,PORTool 会产生奖励......
NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale
机器人抓手的有用之处不是它可以拾取一个物体,而是它可以使用以前从未握住过的工具拾取下一个物体,以及再下一个物体。自动驾驶汽车系统的安全性不仅仅在于它能够对情况进行推理,还在于 [...]
Dolichopoda balrogi Kalaentzis & Alexiou, A. 女性个体。 B.男性个体。 C. Juvenile.in Kalaentzis、Alexiou、Christopoulos、Minoudi、Koutsogiannopoulos、Kotselis et Triantafyllidis,2026。DOI:doi.org/10.3897/jor.35.187943照片:K. Kalaentzis.Abstract一种洞穴蟋蟀新种,Dolichopoda balrogi sp。 11月,描述于希腊卡斯特洛里佐岛(多德卡尼斯群岛,黎凡特海)。该物种是在人工地下栖息
如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
OpenAI models and Codex on Amazon Bedrock are now generally available
GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。
The 5–3–2 Assessment Model: A Balanced Way To Design Shorter Tests
5-3-2 模型是一个平衡的 10 个问题结构,适用于形成性检查、主题测验和短章测试。它评估基础、应用和推理,而无需进行不必要的长时间测试。这篇文章首先发表在电子学习行业。
Claude Opus 4.8 is now available on AWS
本文介绍了 Opus 4.8 的改进以及为 AI 工程师将模型集成到 Amazon Bedrock 上的代理系统和生产推理工作负载中的实用指南。
NVIDIA Research Advances Robotics From Simulation to the Real World
机器人技术正在进入一个新阶段:从受控演示和脚本自动化转向现实世界中可推广、可靠的具体自治。在国际机器人与自动化会议 (ICRA) 上,NVIDIA 研究中心 28 篇被接受的论文中的 8 篇展示了模拟到真实的迁移如何成为这一转变的基础,帮助机器人感知、推理、计划和 [...]