Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。
The Ultimate Beginners’ Guide to Building an AI Agent in Python
在 Python 中构建 AI 代理的简单分步教程《用 Python 构建 AI 代理的终极初学者指南》一文首先出现在 Towards Data Science 上。
Securing AI agents: How AWS and Cisco AI Defense scale MCP and A2A deployments
思科和 AWS 的合作伙伴关系解决了企业在扩展 AI 代理时面临的三个挑战:可见性差距、安全瓶颈和合规风险。在这篇文章中,我们探讨如何通过自动扫描和统一治理来克服人工智能安全挑战。
OpenClaw vs Hermes vs Claude – competing visions for AI agents
人工智能代理正在演变成永远在线的自主系统,可以跨多个平台连续记忆、学习和操作。 OpenClaw、Hermes Agent 和 Claude 正在引领这一转变,但每个人都采取了截然不同的方法来定义人工智能自动化的未来。
Gartner прогнозирует взрывной рост агентного ИИ
未来两年内,完全自主的代理将相当罕见:人类将保留其在安全、控制和风险管理方面的作用。
Teaching AI agents to ask better questions by playing “Battleship”
麻省理工学院的研究人员使用这款经典游戏作为 AI 代理的测试平台,发现小型 AI 模型可以以 1% 的成本超越最大的模型。
随着语法变得廉价和丰富,架构控制成为稀缺资源。有效的治理从上游开始,意图、约束和威胁模型在生成开始之前就塑造了代理的工作环境。目标不是更好的提示,而是构建时边界,防止结构上无效的代码进入系统。弗兰肯斯坦工厂 黑暗工厂(如 Dan [...]
Дженсен Хуанг: чипы Nvidia RTX Spark «переопределяют ноутбук»
Nvidia 的新型 SoC 是用于游戏、创意工作和基于代理的人工智能的移动 PC 的基础。
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
随着代理的兴起,很多人都宣称软件即服务(SaaS)的时代已经结束。当你可以通过一些英语提示和花费几美元购买代币来创建自己的软件时,谁还需要订阅服务呢?您自己的软件,很可能是 [...]
以下文章最初出现在 Addy Osmani 的博客上,经作者许可在此转载。任何人工智能编码代理的默认行为都是采取最短路径“完成”。询问一个功能,它就会写出该功能。它不会询问您是否有规范,请在 [...]
The Infrastructure Behind Making Local LLM Agents Actually Useful
使用本地开放权重模型、vLLM 和长上下文基础设施构建快速、可靠的科学代理的经验教训使本地 LLM 代理真正有用的基础设施背后的帖子首先出现在走向数据科学上。
Rethinking organizational design in the age of agentic AI
随着企业级人工智能代理的迅速普及,野心与执行力之间出现了脱节。尽管 85% 的组织表示他们希望在未来三年内实现代理,但 76% 的组织表示他们当前的运营和基础设施无法支持这种变化。他们指出人员、流程和工作流程缺乏准备。粘性...
Building the enterprise agentic AI factory with DataRobot and Dell
面向生产就绪的代理人工智能的竞赛已经开始,但对于大多数企业来说,终点线仍在不断前进。模型建立起来,试点开始运行,然后团队就碰壁了:在企业规模运行人工智能代理的基础设施、安全性、治理和操作要求比任何单一工具或供应商预期的要复杂得多……这篇文章《与 DataRobot 和戴尔一起构建企业代理人工智能工厂》首先出现在 DataRobot 上。
Just AI,一家俄罗斯人工智能解决方案开发商,宣布开放 Just AI Agent Platform Cloud - 用于创建和扩展人工智能代理的云版本平台。该解决方案针对的是自己的解决方案开发人员,他们创建代理和多代理系统来解决客户的痛点(个人解决方案、中小企业公司的任务)。该平台的云版本提供了低代码方法、现成的人工智能代理模板库和扩展功能。
Smart Engines обучил кадрового ИИ-агента оформлять 100 кандидатов в минуту
Smart Engines 科学家加速了 AI 代理的速度,用于将人事文档中的数据输入 KEDO 系统。现在它可以在没有GPU的服务器上1分钟内识别100套就业所需的文档。即使在峰值负载下,响应也只有几秒钟。该解决方案适用于快速增长的企业和招聘人员需求量大的行业,例如零售贸易、酒店业务、旅游、物流和运输。
Blind Ambition: AI agents can turn tasks into digital disasters
加州大学河滨分校的计算机科学家发现了新一代人工智能 (AI) 代理的令人不安的缺陷,这些代理旨在在用户离开时接管日常计算机杂务 - 整理电子邮件、组织文件、分析数据以及处理其他可能耗费数小时的日常数字任务。研究人员发现,自动化代理可能会危险地专注于完成任务,而没有意识到自己的行为何时有害、矛盾或根本不合理。
多模式代理的真正空间智能超越了低级几何感知,从了解事物的位置发展到理解它们的用途。虽然 VSI-Bench 等现有基准可以有效评估这一基础几何阶段,但它们未能探索基础智能所必需的高阶认知能力。为了弥补这一差距,我们引入了空间功能智能基准 (SFI-Bench),这是一个基于视频的基准,包含来自多样化、以自我为中心的室内视频扫描的 1700 多个问题。 SFI-Bench 旨在...