模型关键词检索结果

为中东地区(阿联酋和巴林)的 Anthropic Claude 模型引入 Amazon Bedrock 全球跨区域推理

Introducing Amazon Bedrock global cross-Region inference for Anthropic’s Claude models in the Middle East Regions (UAE and Bahrain)

我们很高兴地宣布,Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理向中东运营的客户推出。在这篇文章中,我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的主要优势(包括提高的弹性)、您可以实现的实际用例,以及帮助您立即开始构建生成式 AI 应用程序的代码示例。

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

AI 模型的云、本地与混合:从业者指南(赞助)

Cloud vs. Local vs. Hybrid for AI Models: A Practitioner’s Guide (Sponsored)

对于大多数中小型企业领导者来说,有关人工智能的问题已经发生了转变。过去的问题是“我们应该使用人工智能吗?”,但现在的问题是“我们应该在哪里运行它?”

迹线长度是推理模型中的简单不确定性信号

Trace Length is a Simple Uncertainty Signal in Reasoning Models

法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中,我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验,我们表明迹线长度的表现与其他零样本置信度估计器(例如言语置信度)具有可比较但互补的方式。我们的工作表明,训练后推理从根本上改变了踪迹之间的关系……

沙特阿拉伯炫耀 F-35 模型,标志着隐形战斗机交易的新推动

Saudi Arabia Flaunts F-35 Mockup, Signals Fresh Push for Stealth Fighter Deal

带有沙特皇家空军标志的洛克希德·马丁公司 F-35 闪电 II 的全尺寸模型在利雅得世界防务展 (RUH) 上引起了人们的关注。沙特阿拉伯炫耀 F-35 模型,标志着隐形战斗机交易的新推动力首先出现在航空 A2Z 上。

证明自己正确性的模型

Models That Prove Their Own Correctness

我们如何才能相信学习模型对特定感兴趣输入的正确性?模型精度通常是根据输入分布的平均值来衡量的,不保证任何固定输入。本文针对这个问题提出了一个有理论基础的解决方案:训练自我证明模型,通过交互式证明向验证算法 V 证明其输出的正确性。自证明模型满足以下条件:对于从给定分布采样的输入,模型以高概率生成正确的输出并成功证明其对 V 的正确性。...

揭示隐藏在大型语言模型中的偏见、情绪、个性和抽象概念

Exposing biases, moods, personalities, and abstract concepts hidden in large language models

麻省理工学院开发的一种新方法可以根除漏洞并提高法学硕士的安全性和性能。

新报告:利用统计模型扩展人工智能评估工具箱

New Report: Expanding the AI Evaluation Toolbox with Statistical Models

NIST AI 800-3 认为,LLM 评估的统计有效性得益于评估者明确采用模型来分析评估结果并披露相关假设。广义线性混合建模是一种有前途的方法,可以为更有原则的人工智能评估统计奠定基础。未来的 CAISI 和 NIST 出版物将进一步探讨统计模型在人工智能评估中的应用。

最新消息:新报告发现,高级人工智能模型以惊人的速度拒绝军事查询

JUST IN: Advanced AI Models Refuse Military Queries at Alarming Rates, New Report Finds

根据 EdgeRunner AI 进行的一项研究,美国人工智能公司构建的许多大型语言模型都难以处理与军事相关的查询,从而限制了它们的作战效用。

使用视觉语言模型扩展数据注释来为物理 AI 系统提供支持

Scaling data annotation using vision-language models to power physical AI systems

在这篇文章中,我们研究了 Bedrock Robotics 如何应对这一挑战。通过加入 AWS 物理 AI 奖学金,该初创公司与 AWS 生成 AI 创新中心合作,应用视觉语言模型来分析施工视频片段、提取操作细节并大规模生成标记的训练数据集,以改进自主施工设备的数据准备。

Amazon SageMaker AI 2025 年回顾,第 2 部分:提高 SageMaker AI 模型自定义和托管的可观测性并增强功能

Amazon SageMaker AI in 2025, a year in review part 2: Improved observability and enhanced features for SageMaker AI model customization and hosting

2025 年,Amazon SageMaker AI 进行了多项改进,旨在帮助您训练、调整和托管生成型 AI 工作负载。在本系列的第 1 部分中,我们讨论了灵活的培训计划和对推理组件的性价比改进。在这篇文章中,我们讨论可观察性、模型定制和模型托管方面的增强功能。这些改进有助于在 SageMaker AI 上托管全新类别的客户用例。

使用 Amazon SageMaker HyperPod 加速 Hexagon 的 AI 模型生产

Accelerating AI model production at Hexagon with Amazon SageMaker HyperPod

在这篇博文中,我们演示了 Hexagon 如何与 Amazon Web Services 合作,通过使用 Amazon SageMaker HyperPod 的模型训练基础设施预训练最先进的分割模型来扩展其 AI 模型生产。

AlpamayoR1:自动驾驶的大型因果推理模型

AlpamayoR1: Large Causal Reasoning Models for Autonomous Driving

关于因果链推理和自动驾驶现状您需要了解的一切!AlpamayoR1:自动驾驶的大型因果推理模型首先出现在《走向数据科学》上。

7 个 XGBoost 技巧,实现更准确的预测模型

7 XGBoost Tricks for More Accurate Predictive Models

7 个 Python 技巧,可能有助于充分利用独立的 XGBoost 库,特别是在寻求更准确的预测模型方面。

AI 成本控制:预算、节流和模型分层

AI Cost Controls: Budgets, Throttling & Model Tiering

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

LLM 模型架构解释:MoE 的转换器

LLM Model Architecture Explained: Transformers to MoE

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

关系神经符号马尔可夫模型

Relational neurosymbolic Markov models

使用 Gemini 3 Nano Banana Pro 生成的图像。告诉代理该做什么 我们最强大的人工智能代理无法被准确告知该做什么,尤其是在复杂的规划环境中。它们几乎完全依赖神经网络来执行任务,但神经网络不能轻易被告知遵守某些规则或遵守 [...]