Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。
Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart
在本文中,我们将向您展示如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS、逐步完成部署过程,并演示如何针对企业数据集运行预测。
Why I'm sticking with Firefox as my browser - after years of using Chrome, Edge, and Safari
Firefox 仍然充满活力,并且为关心的开发人员提供快速、可定制、无膨胀、私密、安全的浏览体验。
The art and science of hyperparameter optimization on Amazon Nova Forge
针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能,而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡,从为数据和任务选择正确的定制策略,到配置最影响结果的训练参数,例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误,以便您可以提高域性能,而不会降低一般功能或因可避免的故障而消耗计算资源。最后,您将了解如何在不降低一般功能的情况下提高域性能,以及如何避免因平衡错误而导致代价高昂的故障。
How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore
本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果
DOJ is investigating former congressman George Santos for insider trading on Kalshi
据称,这位名誉扫地的前国会议员打赌他是否会出现在国情咨文演讲中,从而引发了联邦调查。
New Scientist recommends Togetherness, a radical new view of life
Penny Sarchet 发现,对生物合作如何支撑所有生命的探索,以及为什么我们到现在为止都忽视了它的力量,读起来令人兴奋
Canada’s Voyageur Airways completes Q400 exit
本文仅适用于订阅商业航空新闻、运营商和机场数据
RedCabin Summit: Thompson exhibits custom Discover Airlines VantageXL
Thompson Aero Seating 公开展示了其为 Discover Airlines 的 A330 机队定制的 VantageXL 座椅。RedCabin 峰会后:Thompson 展示定制的 Discover Airlines VantageXL 座椅首先出现在《航空商业新闻》上。
Astrobotic to join Voyager to accelerate America’s Moon Base
Astrobotic 将被 Voyager 收购,推进从着陆器和 LunaGrid 电源到长期栖息地的完整月球操作堆栈。加入 Voyager 以加速美国月球基地的后 Astrobotic 首先出现在 AeroMorning 上。
Ukraine Deploys Mirage-2000 Jets to Bomb Russian Targets
乌克兰已部署配备炸弹的幻影2000飞机,其制导套件已开发完毕
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
Enable safe agentic payments with built-in guardrails using Amazon Bedrock AgentCore payments
在这篇文章中,我们解决了设计代理支付系统时出现的几个关键风险,以及如何使用 AgentCore 支付功能来解决这些风险。
AmLaw 200 Firm Hanson Bridgett Goes All-In with Claude
总部位于旧金山的 AmLaw 200 公司 Hanson Bridgett 宣布已全力支持 Claude,采用一般模型以及法律附加组件......
The Viking Ráðagerð Further Gels: IMAGE OF THE DAY
这张乌克兰总统站在瑞典战斗机前的照片可能是风向发生重大变化的标志:如果舆论、工业和部队结构保持一致,北方的维京人......
S5E29: Owen Engelmann on Field Testing Direct Instruction Programs
欢迎回到《渐进式错误》。我是主持人扎克·格罗谢尔博士。今天,我为您带来直接教学播客中的一集,我认为任何对教学设计、课程开发或循证教学感兴趣的人都会觉得它很有趣。我与 Engelmann-Becker 公司的 Owen Engelmann 一起,该公司是由 Siegfried Engelmann 创立的课程开发组织,并且……继续阅读 S5E29:Owen Engelmann 谈现场测试直接教学计划