Fine-tune Llama 3 for text generation on Amazon SageMaker JumpStart
在本文中,我们将演示如何使用 Amazon SageMaker JumpStart 对 Meta 中最近发布的 Llama 3 模型(特别是 llama-3-8b 和 llama-3-70b 变体)进行微调。
Deploy Amazon SageMaker pipelines using AWS Controllers for Kubernetes
在本文中,我们展示了熟悉 Jupyter 笔记本和 SageMaker 环境的 ML 工程师如何与熟悉 Kubernetes 和相关工具的 DevOps 工程师高效合作,设计和维护具有适合其组织的基础架构的 ML 管道。这使 DevOps 工程师能够使用他们习惯的同一套工具和环境来管理 ML 生命周期的所有步骤。
在这篇文章中,我们探讨了 Model Registry 的新功能,这些功能简化了基础模型 (FM) 管理:您现在可以注册解压的模型工件并传递最终用户许可协议 (EULA) 接受标志,而无需用户干预。
How Thomson Reuters Labs achieved AI/ML innovation at pace with AWS MLOps services
在本文中,我们将向您展示汤森路透实验室 (TR Labs) 如何通过采用使用 AWS SageMaker、SageMaker Experiments、SageMaker Model Registry 和 SageMaker Pipelines 的标准化 MLOps 框架来开发高效、灵活且功能强大的 MLOps 流程。目标是加快团队使用 AI 和机器学习 (ML) 进行实验和创新的速度——无论是使用自然语言处理 (NLP)、生成式 AI 还是其他技术。我们讨论了这如何帮助缩短新想法的上市时间并帮助构建具有成本效益的机器学习生命周期。
在本文中,我们将探讨如何使用新的 EMR Serverless 集成、Spark 的分布式处理以及由 LangChain 编排框架提供支持的 Amazon OpenSearch Service 向量数据库构建可扩展且高效的检索增强生成 (RAG) 系统。此解决方案使您能够处理大量文本数据,生成相关嵌入,并将它们存储在强大的向量数据库中,以实现无缝检索和生成。
Best practices for prompt engineering with Meta Llama 3 for Text-to-SQL use cases
在本文中,我们将探索一种解决方案,该解决方案使用向量引擎 ChromaDB 和 Meta Llama 3(托管在 SageMaker JumpStart 上的公开基础模型)来实现文本到 SQL 用例。我们分享了 Meta Llama 3 的简要历史、使用 Meta Llama 3 模型进行快速工程的最佳实践,以及使用少样本提示和 RAG 提取存储在 ChromaDB 中的相关模式的架构模式。
Accelerate Generative AI Inference with NVIDIA NIM Microservices on Amazon SageMaker
在本文中,我们将演示客户如何通过 NVIDIA NIM 与 SageMaker 的集成来使用生成人工智能 (AI) 模型和 LLM。我们演示了这种集成的工作原理,以及如何在 SageMaker 上部署这些最先进的模型,以优化其性能和成本。
AWS AI chips deliver high performance and low cost for Llama 3.1 models on AWS
今天,我们很高兴地宣布 AWS Trainium 和 AWS Inferentia 支持 Llama 3.1 模型的微调和推理。Llama 3.1 系列多语言大型语言模型 (LLM) 是一组预先训练和指令调整的生成模型,大小分别为 8B、70B 和 405B。在上一篇文章中,我们介绍了如何在 Amazon SageMaker JumpStart 中基于 AWS Trainium 和 Inferentia 的实例上部署 Llama 3 模型。在这篇文章中,我们概述了如何开始在 AWS AI 芯片上微调和部署 Llama 3.1 系列模型,以实现其性价比优势。
Use Llama 3.1 405B for synthetic data generation and distillation to fine-tune smaller models
今天,我们很高兴地宣布 Llama 3.1 405B 模型已在 Amazon SageMaker JumpStart 和 Amazon Bedrock 上推出预览版。 Llama 3.1 模型是一组先进的预训练和指导微调的生成式人工智能 (AI) 模型,大小分别为 8B、70B 和 405B。Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心,提供对算法、模型和 ML 解决方案的访问,以便您可以快速开始使用 ML。Amazon Bedrock 提供了一种使用 Meta Llama 模型构建和扩展生成式 AI 应用程序的简单方法,只需一个 API 即可。
Llama 3.1 models are now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布,最先进的 Llama 3.1 多语言大型语言模型 (LLM) 集合(包括 8B、70B 和 405B 大小的预训练和指令调整生成式 AI 模型)可通过 Amazon SageMaker JumpStart 部署以进行推理。Llama 是一种可公开访问的 LLM,专为开发人员、研究人员和企业设计,用于构建、试验和负责任地扩展他们的生成式人工智能 (AI) 创意。在这篇文章中,我们将介绍如何使用 SageMaker JumpStart 发现和部署 Llama 3.1 模型。
Amazon SageMaker unveils the Cohere Command R fine-tuning model
AWS 宣布在 Amazon SageMaker 上推出 Cohere Command R 微调模型。SageMaker 机器学习 (ML) 功能套件的最新成员使企业能够利用大型语言模型 (LLM) 的强大功能,并充分发挥其在各种应用中的潜力。Cohere Command R 是一种可扩展的前沿 […]
Improve RAG accuracy with fine-tuned embedding models on Amazon SageMaker
这篇文章演示了如何使用 Amazon SageMaker 微调 Sentence Transformer 嵌入模型并将其部署到 Amazon SageMaker Endpoint。本文中的代码和更多示例可在 GitHub 存储库中找到。
这篇文章是与 BRIA AI 的 Bar Fingerman 共同撰写的。这篇文章解释了 BRIA AI 如何快速且经济地在包含 PB 级许可图像的数据集上训练高分辨率 (1024×1024) 文本到图像传播模型 BRIA AI 2.0。Amazon SageMaker 训练作业和 Amazon SageMaker 分布式训练库承担了与基础设施相关的无差别繁重工作 [...]
这篇文章向您展示了如何使用其他依赖项扩展 Amazon SageMaker Distribution,以创建针对地理空间分析量身定制的自定义容器映像。虽然这篇文章中的示例侧重于地理空间数据科学,但所介绍的方法可以应用于基于 SageMaker Distribution 的任何类型的自定义映像。
随着生成式人工智能 (AI) 推理对企业越来越重要,客户正在寻求扩展其生成式 AI 操作或将生成式 AI 模型集成到现有工作流程中的方法。模型优化已成为一个关键步骤,使组织能够平衡成本效益和响应能力,从而提高生产力。但是,性价比要求在不同用例之间差异很大。对于 [...]
今天,Amazon SageMaker 宣布了一款新的推理优化工具包,可帮助您将优化生成式人工智能 (AI) 模型所需的时间从数月缩短到数小时,从而为您的用例实现一流的性能。借助这项新功能,您可以从优化技术菜单中进行选择,将它们应用于您的生成式 AI [...]
The Weather Company enhances MLOps with Amazon SageMaker, AWS CloudFormation, and Amazon CloudWatch
在本文中,我们分享了 The Weather Company (TWCo) 如何使用 Amazon SageMaker、AWS CloudFormation 和 Amazon CloudWatch 等服务增强其 MLOps 平台的故事。TWCo 数据科学家和 ML 工程师利用自动化、详细的实验跟踪、集成训练和部署管道来帮助有效扩展 MLOps。TWCo 将基础设施管理时间缩短了 90%,同时还将模型部署时间缩短了 20%。
Generate unique images by fine-tuning Stable Diffusion XL with Amazon SageMaker
Stability AI 的 Stable Diffusion XL 是一种高质量的文本到图像深度学习模型,可让您生成各种风格的专业图像。托管版本的 Stable Diffusion XL 已在 Amazon SageMaker JumpStart 上提供给您(请参阅在 Amazon SageMaker Studio 中将 Stable Diffusion XL 与 Amazon SageMaker JumpStart 结合使用)和 Amazon Bedrock(请参阅 […]