推理领域信息情报检索---XiaoMi-AI

亚马逊云科技 _机器学习

2026年3月24日 20:27

使用训练计划部署具有设定 GPU 容量的 SageMaker AI 推理端点

Deploy SageMaker AI inference endpoints with set GPU capacity using training plans

在这篇文章中，我们将介绍如何搜索可用的 p 系列 GPU 容量、创建推理训练计划预留以及在该预留容量上部署 SageMaker AI 推理端点。我们跟踪数据科学家的旅程，因为他们保留模型评估的能力并在整个预订生命周期中管理端点。

走向数据科学

2026年3月23日 15:00

因果推理正在吞噬机器学习

Causal Inference Is Eating Machine Learning

您的 ML 模型可以完美预测，但会建议错误的操作。学习 5 个问题诊断、方法比较矩阵和 Python 工作流程，通过因果推理来修复它。因果推理正在吞噬机器学习这篇文章首先出现在《走向数据科学》上。

Apple机器学习研究

2026年3月18日 00:00

Goldilocks RL：调整任务难度以逃避推理奖励稀疏

Goldilocks RL: Tuning Task Difficulty to Escape Sparse Rewards for Reasoning

强化学习已成为解锁大型语言模型推理能力的强大范例。然而，依赖稀疏的奖励使得这个过程的样本效率非常低，因为模型必须以最少的反馈来导航巨大的搜索空间。虽然经典课程学习的目的是通过根据复杂性对数据进行排序来缓解这种情况，但特定模型的正确排序通常是不清楚的。为了解决这个问题，我们提出了 Goldilocks，这是一种新颖的教师驱动的数据采样策略，旨在预测学生模型的每个问题的难度。教师模型...

Clarifai博客 | 实际应用中的人工智能

2026年3月17日 10:45

llama.cpp：快速本地 LLM 推理、硬件选择和调整

llama.cpp: Fast Local LLM Inference, Hardware Choices & Tuning

将公共 MCP 服务器部署为 API 端点，并使用函数调用将其工具集成到 LLM 工作流程中。

亚马逊云科技 _机器学习

2026年3月16日 16:55

介绍由 llm-d 提供支持的 AWS 上的分解推理

Introducing Disaggregated Inference on AWS powered by llm-d

在这篇博文中，我们介绍了下一代推理能力背后的概念，包括分解服务、智能请求调度和专家并行。我们讨论它们的优势，并介绍如何在 Amazon SageMaker HyperPod EKS 上实施它们，以显着提高推理性能、资源利用率和运营效率。

Clarifai博客 | 实际应用中的人工智能

2026年3月16日 18:55

Clarifai 推理引擎在 Kimi K2.5 上实现每秒 414 个令牌

Clarifai Reasoning Engine Achieves 414 Tokens Per Second on Kimi K2.5

Clarifai 在 Kimi K2.5 上实现了每秒 414 个令牌，是首批在 Nvidia B200 GPU 上运行的万亿参数推理模型上达到 400+ TPS 的提供商之一。

Apple机器学习研究

2026年3月13日 00:00

多语言推理健身房：程序推理环境的多语言扩展

Multilingual Reasoning Gym: Multilingual Scaling of Procedural Reasoning Environments

我们提出了多语言推理 Gym，它是 Reasoning Gym（Stojanovski 等人，2025）的扩展，它可以在程序上生成跨 14 种语言的可验证推理问题。我们翻译 94 项任务的模板，并以 10 种语言进行母语验证，并进行有针对性的代码或模板调整，以确保语言的自然性。多语言推理 Gym 保留了原始 Reasoning Gym 中使用的程序生成方法的核心优势，例如几乎无限的问题实例生成和可调整的难度，并且仍然可直接用于强化......

亚马逊云科技 _机器学习

2026年3月13日 19:27