John Snow Labs Medical LLMs are now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布,John Snow Labs 的医学 LLM – 小型和医学 LLM – 中大型语言模型 (LLM) 现已在 Amazon SageMaker Jumpstart 上推出。对于医生来说,此工具可以快速了解患者的医疗历程,帮助他们从大量文档中及时做出明智的决策。这种总结能力不仅可以提高效率,还可以确保不会忽略任何关键细节,从而支持最佳患者护理并改善医疗保健结果。
Accelerating Mixtral MoE fine-tuning on Amazon SageMaker with QLoRA
在本文中,我们将演示如何通过使用完全托管的环境和 Amazon SageMaker 训练作业来使用 PyTorch 完全分片数据并行 (FSDP) 和量化低秩自适应 (QLoRA) 对 Mixtral 8x7B 模型进行微调,从而解决模型定制复杂、耗时且通常成本高昂的挑战。
Amazon SageMaker Inference now supports G6e instances
SageMaker 上的 G6e 实例解锁了以经济高效的方式部署各种开源模型的能力。凭借卓越的内存容量、增强的性能和成本效益,这些实例为希望部署和扩展其 AI 应用程序的组织提供了极具吸引力的解决方案。处理更大模型、支持更长上下文长度和保持高吞吐量的能力使 G6e 实例对于现代 AI 应用程序特别有价值。
在本文中,我们将展示如何使用 SageMaker Ground Truth 实现音频和视频分割解决方案。我们将指导您使用 AWS CloudFormation 部署必要的基础设施、创建内部标记团队以及设置您的第一个标记作业。在本文结束时,您将拥有一个功能齐全的音频/视频分割工作流程,您可以根据各种用例进行调整,从训练语音合成模型到提高视频生成能力。
Fine-tune large language models with Amazon SageMaker Autopilot
微调基础模型 (FM) 是一个过程,涉及将预先训练的 FM 暴露给特定于任务的数据并微调其参数。然后它可以加深理解并为该特定领域产生更准确和相关的输出。在本文中,我们将展示如何使用 Amazon SageMaker Autopilot 训练作业和 AutoMLV2 […]
How FP8 boosts LLM training by 18% on Amazon SageMaker P5 instances
近年来,LLM 培训取得了显著的进步,组织在模型大小、性能和效率方面不断突破极限。在本文中,我们将探讨 FP8 优化如何显著加快 Amazon SageMaker P5 实例上的大型模型训练。
Cohere Embed multimodal embeddings model is now available on Amazon SageMaker JumpStart
Cohere Embed 多模式嵌入模型现已在 Amazon SageMaker JumpStart 上正式推出。该模型是最新的 Cohere Embed 3 模型,它现在是多模式的,能够从文本和图像生成嵌入,使企业能够从以图像形式存在的大量数据中释放真正的价值。在本文中,我们将通过一些示例讨论这种新模型的优势和功能。
Fine-tune multimodal models for vision and text use cases on Amazon SageMaker JumpStart
在本文中,我们将展示如何微调文本和视觉模型(例如 Meta Llama 3.2),以便在视觉问答任务中表现更好。Meta Llama 3.2 Vision Instruct 模型在具有挑战性的 DocVQA 视觉问答基准上表现出色。通过利用 Amazon SageMaker JumpStart 的强大功能,我们展示了调整这些生成式 AI 模型以更好地理解和回答有关图像的自然语言问题的过程。
Centralize model governance with SageMaker Model Registry Resource Access Manager sharing
我们最近宣布使用 AWS Resource Access Manager (AWS RAM) 实现 Amazon SageMaker Model Registry 的跨账户共享,从而更轻松地在您的 AWS 账户之间安全地共享和发现机器学习 (ML) 模型。在本文中,我们将向您展示如何使用这个新的跨账户模型共享功能来构建您自己的集中模型治理能力,这通常是集中模型审批、部署、审计和监控工作流所需要的。
Understanding prompt engineering: Unlock the creative potential of Stability AI models on AWS
Stability AI 在 Amazon SageMaker JumpStart 上最新推出的 Stable Diffusion 3.5 Large (SD3.5L) 通过生成更多样化的输出并紧密遵循用户提示来增强图像生成、人体解剖渲染和排版,使其成为对其前身的重大升级。在这篇文章中,我们将探索可以增强这些模型性能的高级提示工程技术,并通过文本到图像的转换促进引人注目的图像的创建。
Introducing Stable Diffusion 3.5 Large in Amazon SageMaker JumpStart
我们很高兴地宣布,Stability AI 最新、最先进的文本转图像模型 Stable Diffusion 3.5 Large 现已在 Amazon SageMaker JumpStart 中推出。在这篇文章中,我们提供了在 SageMaker JumpStart 中订阅 Stable Diffusion 3.5 Large、在 Amazon SageMaker Studio 中部署模型以及使用文本转图像提示生成图像的实施指南。
Improve governance of models with Amazon SageMaker unified Model Cards and Model Registry
现在,您可以使用 Amazon SageMaker 模型卡在 Amazon SageMaker 模型注册表中注册机器学习 (ML) 模型,只需单击几下即可直接在 SageMaker 模型注册表中管理特定模型版本的治理信息。在本文中,我们讨论了一项支持将模型卡与模型注册表集成的新功能。我们讨论了使用注册模型版本管理模型卡的解决方案架构和最佳实践,并逐步介绍如何使用模型注册表中的集成来设置、操作和管理您的模型。
在本文中,我们将演示如何使用 Amazon SageMaker JumpStart 针对特定领域的应用程序微调 Meta 最新的 Llama 3.2 文本生成模型 Llama 3.2 1B 和 3B。通过使用 SageMaker JumpStart 中提供的预构建解决方案和可定制的 Meta Llama 3.2 模型,您可以解锁模型增强的推理、代码生成和指令遵循功能,以根据您的独特用例进行定制。
How Zalando optimized large-scale inference and streamlined ML operations on Amazon SageMaker
这篇文章由 Zalando 的 Mones Raslan、Ravi Sharma 和 Adele Gouttes 共同撰写。Zalando SE 是欧洲最大的电子商务时尚零售商之一,拥有约 5000 万活跃客户。Zalando 面临着定期(每周或每天)为 100 多万种产品打折的挑战,也称为降价定价。降价定价是 […]
Accelerate custom labeling workflows in Amazon SageMaker Ground Truth without using AWS Lambda
Amazon SageMaker Ground Truth 支持创建高质量、大规模的训练数据集,这对于在包括大型语言模型 (LLM) 和生成式 AI 在内的各种应用程序中进行微调至关重要。通过将人工注释者与机器学习相结合,SageMaker Ground Truth 显着降低了数据标记所需的成本和时间。无论是注释图像、视频还是 […]
这篇文章是关于大规模管理机器学习 (ML) 生命周期的系列文章的一部分。要从头开始,请参阅大规模管理 ML 生命周期,第 1 部分:使用 Amazon SageMaker 构建 ML 工作负载的框架。多账户策略不仅对于改善治理至关重要,而且对于增强 […]
这篇文章介绍了一种从不同的云环境(例如 Google Cloud Platform (GCP) BigQuery)中提取数据的架构方法,无需移动数据。这最大限度地降低了在云环境之间移动数据所涉及的复杂性和开销,使组织能够访问和利用其不同的数据资产进行 ML 项目。我们重点介绍了使用 Amazon Athena Federated Query 从 GCP BigQuery 提取数据、使用 Amazon SageMaker Data Wrangler 执行数据准备,然后使用准备好的数据在无代码 ML 界面 Amazon SageMaker Canvas 中构建 ML 模型的过程。
Customized model monitoring for near real-time batch inference with Amazon SageMaker
在本文中,我们介绍了一个框架,用于自定义使用 Amazon SageMaker Model Monitor 来处理近乎实时推理场景的多负载推理请求。SageMaker Model Monitor 监控生产中 SageMaker ML 模型的质量。尽早主动检测模型质量偏差使您能够采取纠正措施,例如重新训练模型、审核上游系统或修复质量问题,而无需手动监控模型或构建其他工具。