Kirkland Hints It Could Fine-Tune LLMs For Own Legal AI Model
Kirkland & Ellis 的 5 亿美元技术项目可能涉及对开源法学硕士进行微调,以创建他们“自己的”合法人工智能模型,以及他们对创新角色的招聘狂潮......
Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。
The art and science of hyperparameter optimization on Amazon Nova Forge
针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能,而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡,从为数据和任务选择正确的定制策略,到配置最影响结果的训练参数,例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误,以便您可以提高域性能,而不会降低一般功能或因可避免的故障而消耗计算资源。最后,您将了解如何在不降低一般功能的情况下提高域性能,以及如何避免因平衡错误而导致代价高昂的故障。
A New Approach Can Better Predict Debris Flow Hazards Years After Fires
美国地质调查局灾害地图并不总能反映野火发生后几年的真实山体滑坡风险。对植被恢复的微调评估可能会有所帮助。
Геоскан представил обновленную платформу для настройки образовательных дронов Pioneer Station 2.0
Geoscan Pioneer 系列教育无人机配置器的大规模更新旨在简化任何培训级别用户的程序工作。典型的操作已减少到几个步骤,参数管理变得更加透明,并且无人机的工作在一个窗口中进行 - 从第一次启动和固件更新到微调自动驾驶仪和分析飞行日志。
Ученые МФТИ научили роботов не сбиваться с пути
MIPT 科学家正在弥合机器人虚拟世界和现实世界之间的差距。新系统使用特殊的模拟器来微调机器人的虚拟模型。这样的“替身”利用其运动数据,准确地重复机器人的行为,并有效地训练现实世界的算法。该技术对于创造可操作且灵活的敏捷机器人非常重要:机械手、快递员、家庭助理等。