SFT领域信息情报检索---XiaoMi-AI

2026年6月3日 15:56

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

在本文中，您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业，因此您可以专注于训练代码，而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性，并将基本模型与多个微调变体进行比较，以便您可以就模型质量做出数据驱动的决策。

SFT关键词检索结果

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性