Accelerating LLM fine-tuning with unstructured data using SageMaker Unified Studio and S3
去年,AWS 宣布了 Amazon SageMaker Unified Studio 与 Amazon S3 通用存储桶之间的集成。这种集成使团队可以轻松地将存储在 Amazon Simple Storage Service (Amazon S3) 中的非结构化数据用于机器学习 (ML) 和数据分析用例。在这篇文章中,我们展示了如何将 S3 通用存储桶与 Amazon SageMaker Catalog 集成,以使用 Amazon SageMaker Unified Studio 微调 Llama 3.2 11B Vision Instruct 以实现视觉问答 (VQA)。
Build an offline feature store using Amazon SageMaker Unified Studio and SageMaker Catalog
此博文提供了有关在 SageMaker Unified Studio 域中使用 SageMaker Catalog 实施离线功能存储的分步指南。通过采用发布-订阅模式,数据生产者可以使用此解决方案来发布精选的版本化特征表,而数据消费者可以安全地发现、订阅和重用它们以进行模型开发。