微调领域信息情报检索---XiaoMi-AI

Artificial Lawyer

2026年6月1日 06:51

柯克兰暗示它可以针对自己的法律人工智能模型微调法学硕士

Kirkland Hints It Could Fine-Tune LLMs For Own Legal AI Model

Kirkland & Ellis 的 5 亿美元技术项目可能涉及对开源法学硕士进行微调，以创建他们“自己的”合法人工智能模型，以及他们对创新角色的招聘狂潮......

亚马逊云科技 _机器学习

2026年6月3日 15:56

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

在本文中，您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业，因此您可以专注于训练代码，而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性，并将基本模型与多个微调变体进行比较，以便您可以就模型质量做出数据驱动的决策。

亚马逊云科技 _机器学习

2026年6月2日 17:39

Amazon Nova Forge 上超参数优化的艺术与科学

The art and science of hyperparameter optimization on Amazon Nova Forge

针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能，而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡，从为数据和任务选择正确的定制策略，到配置最影响结果的训练参数，例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误，以便您可以提高域性能，而不会降低一般功能或因可避免的故障而消耗计算资源。最后，您将了解如何在不降低一般功能的情况下提高域性能，以及如何避免因平衡错误而导致代价高昂的故障。

Eos杂志

2026年5月19日 12:59