Microsoft's first reasoning model is one of 7 AIs just released at Build - what we know so far
Microsoft AI 已全面加入与 MAI-Thinking-1 的对话,以及新的编码、图像和语音模型。
Solving a Murder Mystery Using Bayesian Inference
《利刃出鞘》如何教授贝叶斯思维(在您没有意识到的情况下) 使用贝叶斯推理解决谋杀之谜的帖子首先出现在《走向数据科学》上。
本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。
The Next Chapter: Clarifai Compute Orchestration and Reasoning Engine Joins Nebius
对 Gemma-3-4B、MiniCPM-o 2.6 和 Qwen2.5-VL-7B-Instruct 的延迟、吞吐量和可扩展性进行基准测试。
The Next AI Bottleneck Isn’t the Model: It’s the Inference System
企业人工智能系统正在进入一个阶段,推理设计与模型能力本身一样重要。下一个人工智能瓶颈不是模型:而是推理系统一文首先出现在《走向数据科学》上。
Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling
自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输
How Major Reasoning Models Converge to the Same “Brain” as They Model Reality Increasingly Better
因为只有一个现实需要建模!主要推理模型如何在对现实建模越来越好时收敛到同一个“大脑”一文首先出现在《走向数据科学》上。
Games people — and machines — play: Untangling strategic reasoning to advance AI
助理教授 Gabriele Farina 挖掘复杂多智能体场景中决策的基础。
NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart
在 Amazon SageMaker JumpStart 上部署 NVIDIA Nemotron 3 Ultra。借助此前沿推理模型,代理 AI 工作负载的推理速度提高 5 倍,成本降低 30%。
NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale
机器人抓手的有用之处不是它可以拾取一个物体,而是它可以使用以前从未握住过的工具拾取下一个物体,以及再下一个物体。自动驾驶汽车系统的安全性不仅仅在于它能够对情况进行推理,还在于 [...]
Dolichopoda balrogi Kalaentzis & Alexiou, A. 女性个体。 B.男性个体。 C. Juvenile.in Kalaentzis、Alexiou、Christopoulos、Minoudi、Koutsogiannopoulos、Kotselis et Triantafyllidis,2026。DOI:doi.org/10.3897/jor.35.187943照片:K. Kalaentzis.Abstract一种洞穴蟋蟀新种,Dolichopoda balrogi sp。 11月,描述于希腊卡斯特洛里佐岛(多德卡尼斯群岛,黎凡特海)。该物种是在人工地下栖息
如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
OpenAI models and Codex on Amazon Bedrock are now generally available
GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。
The 5–3–2 Assessment Model: A Balanced Way To Design Shorter Tests
5-3-2 模型是一个平衡的 10 个问题结构,适用于形成性检查、主题测验和短章测试。它评估基础、应用和推理,而无需进行不必要的长时间测试。这篇文章首先发表在电子学习行业。
Claude Opus 4.8 is now available on AWS
本文介绍了 Opus 4.8 的改进以及为 AI 工程师将模型集成到 Amazon Bedrock 上的代理系统和生产推理工作负载中的实用指南。
NVIDIA Research Advances Robotics From Simulation to the Real World
机器人技术正在进入一个新阶段:从受控演示和脚本自动化转向现实世界中可推广、可靠的具体自治。在国际机器人与自动化会议 (ICRA) 上,NVIDIA 研究中心 28 篇被接受的论文中的 8 篇展示了模拟到真实的迁移如何成为这一转变的基础,帮助机器人感知、推理、计划和 [...]
我们将“注意力就是你所需要的一切”规模化为一个工业规模的随机鹦鹉农场,然后安装了代理和工具,直到它开始看起来更像是我们的想法。现在,工程现实——晶圆厂、电力和令人眼花缭乱的代币账单——正在询问我们所做的事情是否值得。通用法学硕士开始在自己的输出上进行近亲繁殖,这与依靠严格约束的对抗性合成数据而蓬勃发展的游戏人工智能不同。我们是否将自己困在潜在推理空间的一个充满斜坡的子超平面中?从注意力开始就是你所需要的,然后进行扩展。结果是,正如 Cosma Shalizi 三年前指出的那样:分享赠送订阅Cosma Shalizi:神经网络“大型语言模型”中的“注意力”、“变形金刚”:“[一项]令人难以置信的