在这篇文章中,我们宣布了亚马逊萨吉马制造商Hyperpod支持,用于从SageMaker Jumpstart部署基础模型,以及来自Amazon S3或Amazon FSX的自定义或微调模型。这种新功能使客户可以在相同的HyperPod计算资源上训练,微调和部署模型,从而最大程度地利用整个模型生命周期的资源利用率。
Gemma 3 27B model now available on Amazon Bedrock Marketplace and Amazon SageMaker JumpStart
我们很高兴地宣布,通过亚马逊基岩市场和亚马逊Sagemaker Jumpstart宣布Gemma 3 27B指示模型。在这篇文章中,我们向您展示了如何开始使用Amazon Bedrock Marketplace和SageMaker Jumpstart上的Gemma 3 27B指令,以及如何在应用程序中使用模型强大的指令遵循功能。
Racing beyond DeepRacer: Debut of the AWS LLM League
AWS LLM LOAGEWAS旨在通过提供一种体验来降低生成AI模型定制的进入障碍,而参与者无论其先前的数据科学经验如何,都可以从事微调LLMS。使用Amazon Sagemaker Jumpstart,引导与会者通过自定义LLMS来解决适应其领域的实际业务挑战的过程。
Meta SAM 2.1 is now available in Amazon SageMaker JumpStart
我们很高兴地宣布,Meta 的 Segment Anything Model (SAM) 2.1 视觉分割模型已通过 Amazon SageMaker JumpStart 公开发布,可用于部署和运行推理。Meta SAM 2.1 在单个模型中提供了最先进的视频和图像分割功能。在这篇文章中,我们探讨了 SageMaker JumpStart 如何帮助数据科学家和 ML 工程师发现、访问和部署各种预先训练的 FM 进行推理,包括 Meta 迄今为止最先进、最强大的模型。
Falcon 3 models now available in Amazon SageMaker JumpStart
我们很高兴地宣布,TII 的 Falcon 3 系列模型已在 Amazon SageMaker JumpStart 中推出。在本文中,我们将探讨如何在 Amazon SageMaker AI 上高效部署此模型。
Build agentic AI solutions with DeepSeek-R1, CrewAI, and Amazon SageMaker AI
在这篇文章中,我们将演示如何将 DeepSeek-R1 等 LLM(或您选择的其他 FM)从 SageMaker JumpStart 或 Hugging Face Hub 等热门模型中心部署到 SageMaker AI 进行实时推理。我们探索了 Hugging Face TGI 等推理框架,它有助于简化部署,同时集成内置性能优化以最大限度地减少延迟并最大限度地提高吞吐量。此外,我们还展示了 SageMaker 开发人员友好的 Python SDK 如何简化端点编排,从而实现 LLM 支持的应用程序的无缝实验和扩展。
Enhancing LLM Capabilities with NeMo Guardrails on Amazon SageMaker JumpStart
将 NeMo Guardrails 与大型语言模型 (LLM) 集成是向面向客户的应用程序中部署 AI 的重要一步。AnyCompany Pet Supplies 的示例说明了这些技术如何在处理拒绝和引导对话实现实施结果的同时增强客户互动。这一走向道德 AI 部署的旅程对于与客户建立可持续的、基于信任的关系以及塑造技术与人类价值观无缝契合的未来至关重要。
DeepSeek-R1 model now available in Amazon Bedrock Marketplace and Amazon SageMaker JumpStart
DeepSeek-R1 是一种先进的大型语言模型,它结合了强化学习、思维链推理和混合专家架构,通过 Amazon Bedrock Guardrails 集成提供高效、可解释的响应,同时保持安全性。
How BQA streamlines education quality reporting using Amazon Bedrock
教育和培训质量管理局 (BQA) 在提高巴林王国的教育和培训服务质量方面发挥着关键作用。BQA 审查所有教育和培训机构的表现,包括学校、大学和职业学院,从而促进国家人力资本的专业发展。在这篇文章中,我们探讨了 BQA 如何利用 Amazon Bedrock、Amazon SageMaker JumpStart 和其他 AWS 服务的强大功能来简化整体报告工作流程。
Llama 3.3 70B now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布 Meta 的 Llama 3.3 70B 已在 Amazon SageMaker JumpStart 中推出。 Llama 3.3 70B 标志着大型语言模型 (LLM) 开发方面取得了令人兴奋的进步,它以更少的计算资源提供了与大型 Llama 版本相当的性能。在本文中,我们将探讨如何在 Amazon SageMaker AI 上高效部署此模型,并使用高级 SageMaker AI 功能实现最佳性能和成本管理。
在本文中,我们探讨了 Clearwater Analytics 在生成 AI 方面的尝试,他们如何使用 Amazon SageMaker 构建解决方案,并深入研究 Clearwater Analytics 如何使用 LLM 利用投资管理领域超过 18 年的经验,同时优化模型成本和性能。
Pixtral 12B is now available on Amazon SageMaker JumpStart
今天,我们很高兴地宣布,Pixtral 12B (pixtral-12b-2409) 是一款由 Mistral AI 开发的先进视觉语言模型 (VLM),在纯文本和多模式任务中均表现出色,现已通过 Amazon SageMaker JumpStart 向客户提供。您可以使用 SageMaker JumpStart 试用此模型,SageMaker JumpStart 是一个机器学习 (ML) 中心,可访问算法和模型,只需单击一下即可部署这些算法和模型以运行推理。在这篇文章中,我们将介绍如何发现、部署和使用 Pixtral 12B 模型来处理各种现实世界的视觉用例。
Mistral-NeMo-Instruct-2407 and Mistral-NeMo-Base-2407 are now available on SageMaker JumpStart
今天,我们很高兴地宣布,Mistral AI 的 Mistral-NeMo-Base-2407 和 Mistral-NeMo-Instruct-2407 大型语言模型在文本生成方面表现优异,可通过 Amazon SageMaker JumpStart 供客户使用。在本文中,我们将介绍如何发现、部署和使用 Mistral-NeMo-Instruct-2407 和 Mistral-NeMo-Base-2407 模型来处理各种实际用例。
Deploy RAG applications on Amazon SageMaker JumpStart using FAISS
在本文中,我们展示了如何使用 Facebook AI 相似性搜索 (FAISS) 在 Amazon SageMaker JumpStart 上构建 RAG 应用程序。
Use Amazon Bedrock tooling with Amazon SageMaker JumpStart models
在本文中,我们探讨了如何从 SageMaker JumpStart 部署 AI 模型并将它们与 Amazon Bedrock 的强大功能一起使用。用户可以将 SageMaker JumpStart 的模型托管与 Bedrock 的安全和监控工具相结合。我们以 Gemma 2 9B Instruct 模型为例进行了演示,展示了如何部署它并使用 Bedrock 的高级功能。
Speed up your AI inference workloads with new NVIDIA-powered capabilities in Amazon SageMaker
在 re:Invent 2024 上,我们很高兴地宣布了新功能,利用 Amazon SageMaker 上的 NVIDIA 加速计算和软件产品来加速您的 AI 推理工作负载。在这篇文章中,我们将探讨如何使用这些新功能来增强您在 Amazon SageMaker 上的 AI 推理。我们将介绍从 AWS Marketplace 为 SageMaker Inference 部署 NVIDIA NIM 微服务的过程。然后,我们将深入介绍 NVIDIA 在 SageMaker JumpStart 上提供的模型,展示如何直接在 JumpStart 界面中访问和部署 Nemotron-4 模型。这将包括分步
Fast and accurate zero-shot forecasting with Chronos-Bolt and AutoGluon
Amazon SageMaker 客户可以通过 AutoGluon-TimeSeries 和 Amazon SageMaker JumpStart 使用 Chronos 模型。在这篇文章中,我们介绍了 Chronos-Bolt,这是我们最新的预测 FM,已集成到 AutoGluon-TimeSeries 中。
我们很高兴地宣布,Meta Llama 3.1 8B 和 70B 推理支持已在 Amazon SageMaker JumpStart 中的 AWS Trainium 和 AWS Inferentia 实例上推出。 Trainium 和 Inferentia 由 AWS Neuron 软件开发工具包 (SDK) 提供支持,可提供高性能并将 Meta Llama 3.1 的部署成本降低高达 50%。在这篇文章中,我们演示了如何在 SageMaker JumpStart 中的 Trainium 和 Inferentia 实例上部署 Meta Llama 3.1。