推理关键词检索结果

微软的第一个推理模型是刚刚在 Build 上发布的 7 个 AI 之一 - 目前我们所知道的

Microsoft's first reasoning model is one of 7 AIs just released at Build - what we know so far

Microsoft AI 已全面加入与 MAI-Thinking-1 的对话,以及新的编码、图像和语音模型。

使用贝叶斯推理解开谋杀之谜

Solving a Murder Mystery Using Bayesian Inference

《利刃出鞘》如何教授贝叶斯思维(在您没有意识到的情况下) 使用贝叶斯推理解决谋杀之谜的帖子首先出现在《走向数据科学》上。

Amazon SageMaker AI LLM 推理的全面可观察性:从 GPU 利用率到 LLM 质量

Comprehensive observability for Amazon SageMaker AI LLM inference: From GPU utilization to LLM quality

本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。

下一章:Clarifai 计算编排和推理引擎加入 Nebius

The Next Chapter: Clarifai Compute Orchestration and Reasoning Engine Joins Nebius

对 Gemma-3-4B、MiniCPM-o 2.6 和 Qwen2.5-VL-7B-Instruct 的延迟、吞吐量和可扩展性进行基准测试。

下一个人工智能瓶颈不是模型:而是推理系统

The Next AI Bottleneck Isn’t the Model: It’s the Inference System

企业人工智能系统正在进入一个阶段,推理设计与模型能力本身一样重要。下一个人工智能瓶颈不是模型:而是推理系统一文首先出现在《走向数据科学》上。

自适应并行推理:高效推理扩展的下一个范式

Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling

自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输

随着它们对现实的建模越来越好,主要推理模型如何汇聚到同一个“大脑”

How Major Reasoning Models Converge to the Same “Brain” as They Model Reality Increasingly Better

因为只有一个现实需要建模!主要推理模型如何在对现实建模越来越好时收敛到同一个“大脑”一文首先出现在《走向数据科学》上。

人与机器玩的游戏:理清战略推理以推进人工智能

Games people — and machines — play: Untangling strategic reasoning to advance AI

助理教授 Gabriele Farina 挖掘复杂多智能体场景中决策的基础。

NVIDIA Nemotron 3 Ultra 现已在 Amazon SageMaker JumpStart 上提供

NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

在 Amazon SageMaker JumpStart 上部署 NVIDIA Nemotron 3 Ultra。借助此前沿推理模型,代理 AI 工作负载的推理速度提高 5 倍,成本降低 30%。

NVIDIA 研究解锁高级抓取、更智能的自动驾驶和大规模代理训练

NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale

机器人抓手的有用之处不是它可以拾取一个物体,而是它可以使用以前从未握住过的工具拾取下一个物体,以及再下一个物体。自动驾驶汽车系统的安全性不仅仅在于它能够对情况进行推理,还在于 [...]

[昆虫学 • 2026] Dolichopoda balrogi • 探究太深:来自希腊卡斯特洛里佐岛的一种新穴居 Dolichopoda(直翅目:Rhaphidophoridae)的形态和分子描述

[Entomology • 2026] Dolichopoda balrogi • Delving too Deep: Morphological and Molecular Description of A New Cave-dwelling Dolichopoda (Orthoptera: Rhaphidophoridae) from Kastellorizo Island, Greece

Dolichopoda balrogi Kalaentzis & Alexiou, A. 女性个体。 B.男性个体。 C. Juvenile.in Kalaentzis、Alexiou、Christopoulos、Minoudi、Koutsogiannopoulos、Kotselis et Triantafyllidis,2026。DOI:doi.org/10.3897/jor.35.187943照片:K. Kalaentzis.Abstract一种洞穴蟋蟀新种,Dolichopoda balrogi sp。 11月,描述于希腊卡斯特洛里佐岛(多德卡尼斯群岛,黎凡特海)。该物种是在人工地下栖息

使用 Amazon FSx for Lustre 和 TurboQuant 上的 GPUDirect 加速 LLM 模型加载并增加上下文窗口

Accelerate LLM model loading and increase context windows with GPUDirect on Amazon FSx for Lustre and TurboQuant

如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]

AgentOps:使用 Amazon Bedrock AgentCore 大规模运营代理 AI

AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore

当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。

Amazon Bedrock 上的 OpenAI 模型和 Codex 现已全面可用

OpenAI models and Codex on Amazon Bedrock are now generally available

GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。

5-3-2 评估模型:设计较短测试的平衡方法

The 5–3–2 Assessment Model: A Balanced Way To Design Shorter Tests

5-3-2 模型是一个平衡的 10 个问题结构,适用于形成性检查、主题测验和短章测试。它评估基础、应用和推理,而无需进行不必要的长时间测试。这篇文章首先发表在电子学习行业。

Claude Opus 4.8 现已在 AWS 上推出

Claude Opus 4.8 is now available on AWS

本文介绍了 Opus 4.8 的改进以及为 AI 工程师将模型集成到 Amazon Bedrock 上的代理系统和生产推理工作负载中的实用指南。

NVIDIA 研究推动机器人技术从模拟走向现实世界

NVIDIA Research Advances Robotics From Simulation to the Real World

机器人技术正在进入一个新阶段:从受控演示和脚本自动化转向现实世界中可推广、可靠的具体自治。在国际机器人与自动化会议 (ICRA) 上,NVIDIA 研究中心 28 篇被接受的论文中的 8 篇展示了模拟到真实的迁移如何成为这一转变的基础,帮助机器人感知、推理、计划和 [...]

“代理人工智能”是代币的篝火,而晶圆厂产能、电网和损益表则是刹车:(不是)当日读物

"Agentic AI" Is a Bonfire of the Tokens While Fab Capacity, Power Grids, and P&Ls Are the brakes: (NOT THE) READ OF THE DAY

我们将“注意力就是你所需要的一切”规模化为一个工业规模的随机鹦鹉农场,然后安装了代理和工具,直到它开始看起来更像是我们的想法。现在,工程现实——晶圆厂、电力和令人眼花缭乱的代币账单——正在询问我们所做的事情是否值得。通用法学硕士开始在自己的输出上进行近亲繁殖,这与依靠严格约束的对抗性合成数据而蓬勃发展的游戏人工智能不同。我们是否将自己困在潜在推理空间的一个充满斜坡的子超平面中?从注意力开始就是你所需要的,然后进行扩展。结果是,正如 Cosma Shalizi 三年前指出的那样:分享赠送订阅Cosma Shalizi:神经网络“大型语言模型”中的“注意力”、“变形金刚”:“[一项]令人难以置信的