模型领域信息情报检索---XiaoMi-AI

2026年2月24日 15:33

为中东地区（阿联酋和巴林）的 Anthropic Claude 模型引入 Amazon Bedrock 全球跨区域推理

Introducing Amazon Bedrock global cross-Region inference for Anthropic’s Claude models in the Middle East Regions (UAE and Bahrain)

我们很高兴地宣布，Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理向中东运营的客户推出。在这篇文章中，我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的主要优势（包括提高的弹性）、您可以实现的实际用例，以及帮助您立即开始构建生成式 AI 应用程序的代码示例。

走向数据科学

2026年2月24日 20:00

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

走向数据科学

2026年2月24日 13:30

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

KDnuggets

2026年2月24日 23:16

AI 模型的云、本地与混合：从业者指南（赞助）

Cloud vs. Local vs. Hybrid for AI Models: A Practitioner’s Guide (Sponsored)

对于大多数中小型企业领导者来说，有关人工智能的问题已经发生了转变。过去的问题是“我们应该使用人工智能吗？”，但现在的问题是“我们应该在哪里运行它？”

Apple机器学习研究

2026年2月12日 00:00

迹线长度是推理模型中的简单不确定性信号

Trace Length is a Simple Uncertainty Signal in Reasoning Models

法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中，我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验，我们表明迹线长度的表现与其他零样本置信度估计器（例如言语置信度）具有可比较但互补的方式。我们的工作表明，训练后推理从根本上改变了踪迹之间的关系……

航空A2Z

2026年2月13日 05:41

沙特阿拉伯炫耀 F-35 模型，标志着隐形战斗机交易的新推动

Saudi Arabia Flaunts F-35 Mockup, Signals Fresh Push for Stealth Fighter Deal

带有沙特皇家空军标志的洛克希德·马丁公司 F-35 闪电 II 的全尺寸模型在利雅得世界防务展 (RUH) 上引起了人们的关注。沙特阿拉伯炫耀 F-35 模型，标志着隐形战斗机交易的新推动力首先出现在航空 A2Z 上。

Apple机器学习研究

2026年2月17日 00:00

证明自己正确性的模型

Models That Prove Their Own Correctness

我们如何才能相信学习模型对特定感兴趣输入的正确性？模型精度通常是根据输入分布的平均值来衡量的，不保证任何固定输入。本文针对这个问题提出了一个有理论基础的解决方案：训练自我证明模型，通过交互式证明向验证算法 V 证明其输出的正确性。自证明模型满足以下条件：对于从给定分布采样的输入，模型以高概率生成正确的输出并成功证明其对 V 的正确性。...

MIT新闻 - 人工智能

2026年2月19日 14:00

揭示隐藏在大型语言模型中的偏见、情绪、个性和抽象概念

Exposing biases, moods, personalities, and abstract concepts hidden in large language models

麻省理工学院开发的一种新方法可以根除漏洞并提高法学硕士的安全性和性能。

美国国家标准与技术研究院__标准品信息

2026年2月19日 12:00

新报告：利用统计模型扩展人工智能评估工具箱

New Report: Expanding the AI Evaluation Toolbox with Statistical Models

NIST AI 800-3 认为，LLM 评估的统计有效性得益于评估者明确采用模型来分析评估结果并披露相关假设。广义线性混合建模是一种有前途的方法，可以为更有原则的人工智能评估统计奠定基础。未来的 CAISI 和 NIST 出版物将进一步探讨统计模型在人工智能评估中的应用。

美国国防杂志新闻

2026年2月19日 15:00

最新消息：新报告发现，高级人工智能模型以惊人的速度拒绝军事查询

JUST IN: Advanced AI Models Refuse Military Queries at Alarming Rates, New Report Finds

根据 EdgeRunner AI 进行的一项研究，美国人工智能公司构建的许多大型语言模型都难以处理与军事相关的查询，从而限制了它们的作战效用。

亚马逊云科技 _机器学习

2026年2月23日 23:20

使用视觉语言模型扩展数据注释来为物理 AI 系统提供支持

Scaling data annotation using vision-language models to power physical AI systems

在这篇文章中，我们研究了 Bedrock Robotics 如何应对这一挑战。通过加入 AWS 物理 AI 奖学金，该初创公司与 AWS 生成 AI 创新中心合作，应用视觉语言模型来分析施工视频片段、提取操作细节并大规模生成标记的训练数据集，以改进自主施工设备的数据准备。

亚马逊云科技 _机器学习

2026年2月20日 20:26

Amazon SageMaker AI 2025 年回顾，第 2 部分：提高 SageMaker AI 模型自定义和托管的可观测性并增强功能

Amazon SageMaker AI in 2025, a year in review part 2: Improved observability and enhanced features for SageMaker AI model customization and hosting

2025 年，Amazon SageMaker AI 进行了多项改进，旨在帮助您训练、调整和托管生成型 AI 工作负载。在本系列的第 1 部分中，我们讨论了灵活的培训计划和对推理组件的性价比改进。在这篇文章中，我们讨论可观察性、模型定制和模型托管方面的增强功能。这些改进有助于在 SageMaker AI 上托管全新类别的客户用例。

亚马逊云科技 _机器学习

2026年2月23日 17:29