详细内容或原文请订阅后点击阅览
在 Amazon SageMaker JumpStart 上微调 Llama 3 以生成文本
在本文中,我们将演示如何使用 Amazon SageMaker JumpStart 对 Meta 中最近发布的 Llama 3 模型(特别是 llama-3-8b 和 llama-3-70b 变体)进行微调。
来源:亚马逊云科技 _机器学习生成人工智能(AI)模型已经变得越来越流行和强大,从而实现了广泛的应用程序,例如文本生成,摘要,问题答案和代码生成。但是,尽管具有令人印象深刻的功能,但由于其一般培训数据,这些模型经常在特定领域的任务或用例中遇到困难。为了应对这一挑战,对这些模型进行微调对于在专用域中实现最佳性能至关重要。
在这篇文章中,我们演示了如何使用Amazon Sagemaker Jumpstart来调整Meta最近发布的Llama 3模型,特别是Llama-3-8B和Llama-3-70B变体。微调过程基于Meta的Llama-Recipes Repo中提供的脚本,利用Pytorch FSDP,PEFT/LORA等技术,以及INT8量化,以有效地对这些大型模型进行域特异性数据集的这些大型模型进行微调。
Amazon Sagemaker Jumpstart通过使用Sagemaker Jumpstart微调Meta Llama 3型号,您可以利用其改进的推理,代码生成和指令,遵循针对特定用例的功能量身定制的功能。
Meta Llama 3概述
Meta Llama 3 Amazon Sagemaker Amazon Sagemaker Pipelines Amazon Sagemaker调试器sagemaker jumpstart
sagemaker Jumpstart是Sagemaker机器学习(ML)环境中的一个强大功能,它为ML从业者提供了全面的公开可用和专有基础模型(FMS)的枢纽。借助这项托管服务,ML从业人员可以访问领先的模型枢纽和提供商越来越多的尖端模型列表,它们可以将其部署到网络隔离环境中的专用sagemaker实例中,并使用萨吉马制造商自定义模型进行模型培训和部署。
先决条件
要使用SageMaker Jumpstart尝试此解决方案,您将需要以下先决条件:
微调元美洲驼3型
通过SageMaker Studio UI
专有基础模型 meta1