Mak关键词检索结果

Amazon SageMaker AI Async Inference 现在支持内联请求负载

Amazon SageMaker AI Async Inference now supports inline request payloads

今天,我们宣布为 Amazon SageMaker AI 异步推理提供内联负载支持。客户现在可以直接在 InvokeEndpointAsync API 的请求正文中发送推理负载,无需在每次调用之前将输入数据上传到 Amazon Simple Storage Service (Amazon S3)。

在 Amazon SageMaker AI 中引入容器缓存以加快模型扩展

Introducing container caching in Amazon SageMaker AI for faster model scaling

今天,我们很高兴地宣布用于 Amazon SageMaker AI 推理的容器映像缓存,这是我们更快的扩展优化之旅的下一个重大进展。这使得生成式 AI 模型在横向扩展事件期间的端到端延迟速度提高了 2 倍。

在 Amazon SageMaker AI 上使用 P-EAGLE 并行化推测解码

Parallelize speculative decoding with P-EAGLE on Amazon SageMaker AI

本文将引导您了解如何直接在 Amazon SageMaker AI 中使用 P-EAGLE。它将演示如何从 SageMaker JumpStart 目录中选择兼容模型、配置并行绘图规范以及部署高度优化的实时 SageMaker AI 端点以加速您的生成式 AI 应用程序。

在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 扩展机器人强化学习

Scale Robot Reinforcement Learning with NVIDIA Isaac Lab on Amazon SageMaker AI

在这篇文章中,我们展示了如何在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 跨两个计算选项训练 Unitree H1 人形机器人策略:Amazon SageMaker HyperPod 和 Amazon SageMaker 训练作业。

NVIDIA Nemotron 3 Ultra 现已在 Amazon SageMaker JumpStart 上提供

NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

在 Amazon SageMaker JumpStart 上部署 NVIDIA Nemotron 3 Ultra。借助此前沿推理模型,代理 AI 工作负载的推理速度提高 5 倍,成本降低 30%。

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。

Fundamental 的大型表格模型 NEXUS 现已在 Amazon SageMaker JumpStart 上提供

Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart

在本文中,我们将向您展示如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS、逐步完成部署过程,并演示如何针对企业数据集运行预测。

JINSA 首席执行官 Michael Makovsky:“美国”失去了对伊朗的阴谋

JINSA CEO Michael Makovsky: ‘U.S. Has Lost the Plot on Iran’

鹰派犹太国家安全研究所所长兼首席执行官迈克尔·马科夫斯基 (Michael Makovsky) 批评了特朗普政府最近对美国伊朗战争的处理方式,对达成更广泛和平协议的可能性表示担忧……阅读更多 ›后 JINSA 首席执行官迈克尔·马科夫斯基 (Michael Makovsky):“美国” 《失去了对伊朗的阴谋》首先出现在 JINSA 上。

以色列是在一只手被束缚的情况下作战吗? JINSA 总裁兼首席执行官 Michael Makovsky 在 Brian Kilmeade 秀上

Is Israel Fighting With One Hand Tied? JINSA President and CEO Michael Makovsky on the Brian Kilmeade Show

据报道,美国和伊朗政权即将达成协议以结束战争。然而,除非德黑兰完全且可证实地放弃其核基础设施,否则美国未来可能会再次面临这种情况,JINSA 总裁兼首席执行官迈克尔……阅读更多 ›以色列的一只手被束缚了吗? JINSA 总裁兼首席执行官 Michael Makovsky 在 Brian Kilmeade Show 上首先出现在 JINSA 上。

在 Amazon SageMaker AI 上训练阿塞拜疆语语言模型

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom LLC 是阿塞拜疆领先的电信提供商,希望在 Amazon SageMaker AI 上针对电信用例和面向客户的聊天机器人构建阿塞拜疆大语言模型 (LLM)。挑战:使基础模型 (FM) 适应形态丰富的语言,但训练数据有限,而且阿塞拜疆没有现有的高效法学硕士培训蓝图。在为期六周的合作中,Azercell 与 AWS Generative AI 创新中心合作,在 Amazon SageMaker AI 上建立了一个生产就绪框架。

使用 REST API 代理简化对 Amazon SageMaker MLflow 的外部访问

Streamline external access to Amazon SageMaker MLflow using a REST API proxy

在本文中,我们演示如何构建基于 Flask 的安全 MLflow 代理服务,该服务提供对 Amazon SageMaker MLflow 的 HTTPS 访问,而无需 MLflow SDK。该解决方案适用于正在进行云转型、希望在采用云原生服务的同时保留现有机器学习工作流程的组织。

Amazon SageMaker AI LLM 推理的全面可观察性:从 GPU 利用率到 LLM 质量

Comprehensive observability for Amazon SageMaker AI LLM inference: From GPU utilization to LLM quality

本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。

Ryan McMaken 和 Ron Paul 在 John Stossel 的《America at 250》中亮相

Ryan McMaken and Ron Paul Featured on John Stossel's America at 250

宣布为 Amazon SageMaker AI 终端节点提供与 OpenAI 兼容的 API 支持

Announcing OpenAI-compatible API support for Amazon SageMaker AI endpoints

今天,Amazon SageMaker AI 推出了针对实时推理终端节点的 OpenAI 兼容 API 支持。如果您使用 OpenAI SDK、LangChain 或 Strands Agents,您现在可以通过仅更改端点 URL 来调用 SageMaker AI 上的模型。您不需要自定义客户端、SigV4 包装器或代码重写。概述 通过此次发布,SageMaker AI 端点 [...]

利用 Amazon SageMaker Feature Store 中的新功能加速 ML 功能管道

Accelerate ML feature pipelines with new capabilities in Amazon SageMaker Feature Store

今天,我们宣布 SageMaker Python SDK v3.8.0 提供三项新功能。在这篇文章中,我们将通过可用于入门的代码示例来介绍每项功能。有关完整的端到端演练,请参阅 SageMaker Python SDK 存储库中有关 Lake Formation 治理和 Iceberg 表属性的随附笔记本。

Marty Makary 对 FDA 的误解

What Marty Makary Misunderstood About the FDA

Joshua M. Sharfstein,周二统计,食品和药物管理局局长 Marty Makary

JINSA 总裁兼首席执行官:谅解备忘录最大的问题之一是美国承诺不干涉伊朗

JINSA President and CEO: One of MOU’s Biggest Problems is U.S. Pledge to Leave Iran Alone

请注意:Makovsky 博士的采访从 59:10 开始。作为 6 月 14 日达成的谅解备忘录 (MOU) 的一部分,唐纳德·特朗普总统同意对伊朗做出重大让步。就在不到两个月前,特朗普总统……阅读更多 ›《JINSA 总裁兼首席执行官:谅解备忘录最大的问题之一是美国承诺让伊朗独自一人》一文首先出现在 JINSA 上。

利用Prophet模型对人流数据进行时间序列预测分析~新冠疫情及世博会后大阪主要景点的人流特征及未来游客量预测~

Prophetモデルを用いた人流データの時系列予測分析~コロナ禍・万博を経た大阪主要スポットの人流の特徴と来訪者数の将来予測~

■摘要 近年来,通过智能手机等设备获取的“人流数据”,因其能够直观、准确地了解人流活动和停留的实际状态,越来越多地应用于城市规划、旅游推广等广泛领域。了解人流数据的特征对于了解房地产需求和城市结构也很重要。因此,本文利用Location AI Co., Ltd.提供的人流数据,利用Prophet模型进行时间序列分析,掌握大阪市主要景点的游客特征,预测未来的人流趋势。分析表明,大阪主要景点的游客量不仅受到季节变化和天气条件的强烈影响,而且还受到传染病传播和大阪关西世博会等外部事件的影响,并且影响程度根据每个景点的用途和位置特征而存在很大差异。特别是,对大阪站周边地区的分析表明,近年来的大规模开发