利用新的 Amazon SageMaker AI 模型定制和大规模训练功能转变 AI 开发

本文探讨了新的无服务器模型定制功能、弹性训练、无检查点训练和无服务器 MLflow 如何协同工作,将您的 AI 开发速度从几个月缩短到几天。

来源:亚马逊云科技 _机器学习

随着工具和服务的进步,使生成式 AI 模型变得可用,企业现在可以像竞争对手一样访问相同的基础模型 (FM)。真正的差异化来自于构建为您的业务高度定制的人工智能——这是您的竞争对手无法轻松复制的。尽管今天的 FM 具有真正的智能,拥有丰富的知识和推理能力,但没有上下文的智能只是潜在的。模型知道如何思考,但它不知道你如何思考、你的词汇、你的数据模式或你的行业限制。

构建深入了解您的业务的模型取决于您如何让模型从您的数据和偏好中学习。模型通过反映人类学习的逐步过程进行学习:它们首先通过预训练获取一般世界知识,然后通过监督微调获得专业知识,最后通过直接偏好优化(DPO)等技术学会与特定偏好保持一致。在推理阶段,模型可以将所学到的一切应用到现实世界的任务中,并且可以通过低秩适应 (LoRA) 等参数高效的方法继续进行适应,而无需重新训练整个基础模型。

这一学习之旅涵盖了从预训练大规模 FM 到针对特定用例对其进行定制,Amazon SageMaker AI 现在提供了涵盖整个范围的功能。

在 AWS re:Invent 2025 上,Amazon SageMaker AI 宣布了重大进步,这些进步改变了组织进行模型定制和大规模培训的方式。新功能解决了两个长期存在的挑战:针对特定用例定制 FM 所需的复杂性和时间,以及导致数周训练进度脱轨的代价高昂的基础设施故障。

通过高级强化学习进行无服务器 AI 模型定制

桥接模型定制和预训练

以下视频介绍了 Amazon Nova Forge。

开始使用