调用领域信息情报检索---XiaoMi-AI

2026年7月15日 00:00

LLM 函数调用的不确定性量化

Uncertainty Quantification for LLM Function-Calling

大型语言模型 (LLM) 越来越多地用于自主解决现实世界的任务。其中一个关键要素是法学硕士函数调用范式，这是一种广泛使用的方法，为法学硕士配备工具使用功能。然而，LLM 错误地调用函数可能会产生严重影响，特别是当其影响不可逆转时，例如转账或删除数据。因此，在执行函数调用之前，考虑法学硕士对函数调用正确解决任务的信心至关重要。不确定性量化（UQ）方法可用于量化……

DataRobot博客

2026年7月16日 14:30

委托链、困惑的代理以及你实际部署的协议

Delegation chains, the confused deputy, and the protocols you actually deploy

委托链、混乱的代理以及您实际部署的协议代理很少单独行动。用户请求代理做某事。代理调用工具。该工具调用另一个代理。当工作完成时，三到四个参与者已经触及了请求，每个参与者都代表之前的参与者...后委托链、困惑的代理以及您实际部署的协议首先出现在 DataRobot 上。

Apple机器学习研究

2026年7月14日 00:00

主动代理研究环境：模拟活跃用户评估主动助理

Proactive Agent Research Environment: Simulating Active Users to Evaluate Proactive Assistants

预测用户需求并自动执行任务的主动代理作为数字助理具有广阔的前景，但缺乏现实的用户模拟框架阻碍了它们的发展。现有方法将应用程序建模为平面工具调用 API，无法捕获数字环境中用户交互的状态和顺序性质，并使真实的用户模拟不可行。我们引入主动代理研究环境（Pare），这是一个用于在数字环境中构建和评估主动代理的框架。将应用程序建模为有限状态机......

DataRobot博客

2026年7月10日 14:30

您的代理正在使用您的凭据，这就是问题

Your agents are using your credentials, and that is the problem

您的代理正在使用您的凭据，这就是问题所在工程师将代理运送到生产环境。它需要调用内部 API，因此它使用工程师环境中已有的密钥。代理运行。它现在还拥有工程师拥有的所有权限。这是大多数人的默认状态...您的代理正在使用您的凭据，这就是 DataRobot 上首先出现的问题。

DataRobot博客

2026年7月8日 14:30

您的身份堆栈是为两种参与者构建的。代理商是第三位。

Your identity stack was built for two kinds of actor. Agents are a third.

您的身份堆栈是为两种参与者构建的。代理商是第三位。一名工程师本周将一个代理运送到生产环境。它需要调用内部 API，因此它使用工程师环境中已有的密钥。代理运行。它现在还拥有工程师拥有的所有权限。那就是......您的身份堆栈帖子是为两种演员构建的。代理商是第三位。首先出现在 DataRobot 上。

OSP网站大数据新闻

2026年7月6日 15:27

人工智能代理的实际成本由哪些因素构成

Из чего складывается реальная стоимость агентного ИИ

自主代理的经济性较少依赖于所使用的模型，而更多地依赖于“思考”的数量、周期的数量以及对辅助工具的调用频率。

走向数据科学

2026年7月3日 13:30

LLM Wiki 过度设计 - 我用纯 Python 编译器替换了我的

LLM Wikis Are Over-Engineered — I Replaced Mine With a Pure Python Compiler

大多数“LLM wiki”使用代理、嵌入和重复模型调用来组织本地注释。我构建了一个确定性的替代方案：一个纯 Python 编译器，仅使用标准库将杂乱的 Markdown 转换为链接的、经过 linted 的 wiki。在此过程中，我修复了两个真正的错误，在两个操作系统上对管道进行了基准测试，并展示了为什么编译器通常比代理更适合机械文本组织。LLM 维基百科过度设计——我用纯 Python 编译器替换了我的编译器首先出现在《走向数据科学》上。

亚马逊云科技 _机器学习

2026年6月29日 17:25

使用 Amazon Bedrock AgentCore Observability 调试生产代理

Debugging production agents with Amazon Bedrock AgentCore Observability

在本文中，您将了解如何使用内置的可观察性功能来调试生产代理故障。我们介绍常见的故障模式，展示如何通过跟踪和指标分析代理行为，并提供结构化工作流程来解决无限循环和工具调用失败等问题。这是由两部分组成的系列的第 1 部分。第 2 部分介绍性能优化和内存管理。

DataRobot博客

2026年6月26日 21:51

企业如何大规模管理 MCP 连接？

How can enterprises govern MCP connections at scale?

企业可以通过将模型上下文协议 (MCP) 连接视为代理 AI 控制平面的一部分来大规模管理它们。每个 MCP 服务器、公开的工具、权限和代理关系都需要所有权、范围、监控和可审核性，然后才能支持自主工作。 MCP 治理是控制 AI 代理如何发现、选择、调用和...企业如何大规模管理 MCP 连接的学科？首先出现在 DataRobot 上。

Qudata

2026年6月25日 09:00

SpatialClaw：NVIDIA 的 AI 空间推理新方法

SpatialClaw: NVIDIA’s new approach to AI spatial reasoning

SpatialClaw 是 NVIDIA Research 最新的 AI 框架，使代理能够通过可执行的 Python 代码编写、执行和完善自己的推理，而不是依赖预定义的工具调用。该方法无需额外培训即可在复杂的 3D 和 4D 任务中显着提高空间智能。

DataRobot博客

2026年6月24日 01:15

现在可以通过代理资源发现来发现 DataRobot 代理技能和 MCP

DataRobot Agent Skills and MCPs are now discoverable through Agentic Resource Discovery

DataRobot 现在支持代理资源发现规范，使 AI 客户、注册机构和开发人员更容易找到 DataRobot 代理技能和 MCP。代理的作用取决于其所能达到的能力。编码代理可以编写代码。工作流代理可以调用工具。企业代理可以跨系统进行推理。但所有...后 DataRobot 代理技能和 MCP 现在可通过代理资源发现发现首先出现在 DataRobot 上。

DataRobot博客

2026年6月22日 19:55

影子代理：查找并管理未经批准的 AI 代理

Shadow agents: find and govern unsanctioned AI agents

团队正在快速将人工智能代理从原型转变为工作流程。一名代理连接到文档存储。另一个开始调用内部工具。第三个开始接触客户数据。很快，在治理团队清楚地记录他们可以访问什么、谁拥有它们或者他们做了什么之前，代理就可以跨系统运行。 AI...《影子代理：查找和管理未经批准的 AI 代理》一文首先出现在 DataRobot 上。

亚马逊云科技 _机器学习

2026年6月18日 17:32

Amazon Bedrock AgentCore 工具现已全面上市：只需几分钟即可从创意变为生产级代理

Amazon Bedrock AgentCore harness is now generally available: Go from idea to production-grade agent in minutes

今天，Amazon Bedrock AgentCore 线束正式上市。两次 API 调用（CreateHarness 定义代理，InvokeHarness 运行它），几秒钟内即可运行代理。该代理在具有文件系统和 shell 的独立环境中运行，因此它可以安全地读取文件、运行命令和编写代码。它会记住会话中的用户和对话，获取您指定的技能（包括 AWS 策划的目录），浏览网页，通过网关或 MCP 调用您的工具，并在会话中切换模型提供商而不会丢失上下文。每一步都会实时反馈给您，并自动跟踪到 Amazon CloudWatch。除非您愿意，否则您不需要编写编排代码或构建容器。

亚马逊云科技 _机器学习

2026年6月17日 20:56

Amazon SageMaker AI Async Inference 现在支持内联请求负载

Amazon SageMaker AI Async Inference now supports inline request payloads

今天，我们宣布为 Amazon SageMaker AI 异步推理提供内联负载支持。客户现在可以直接在 InvokeEndpointAsync API 的请求正文中发送推理负载，无需在每次调用之前将输入数据上传到 Amazon Simple Storage Service (Amazon S3)。

O'Reilly Media _AI & ML

2026年6月16日 11:02

线性思维，非线性成本

Linear Thinking, Nonlinear Costs

许多人工智能代理系统在技术上变得令人印象深刻之前很久就在经济上变得不可持续。团队通常关注模型选择、提示设计、工具调用和编排。这些事情很重要，但它们只是系统设置的一部分。更深层次的问题是编码代理，例如 Claude Code、Codex 和 Jules，使代理工作流程变得更容易 [...]

亚马逊云科技 _机器学习

2026年6月15日 20:24

在 Amazon Bedrock 上推出 Gemma 4 模型

Introducing Gemma 4 models on Amazon Bedrock

今天，我们宣布 Gemma 4 系列在 Amazon Bedrock 上上市。 Gemma 4 由 Google DeepMind 构建并在 Apache 2.0 许可下发布，是一系列开放权重模型，其设计重点是跨广泛部署场景的每参数智能。该系列包括三个指令调整变体：Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B。这些涵盖密集和专家混合 (MoE) 架构，其中每个请求仅激活模型参数的一小部分。这些变体提供内置推理、本机函数调用以及跨文本和图像的多模式输入。

调用关键词检索结果