Lexis Launches Protégé Work, Expands Offering
LexisNexis 通过 Protégé Work 扩展了其 Lexis+ AI 平台,并将其基于 LLM 的产品重新定义为“法律的基础设施......
Abacus AI Review: Features, AI Agents & Automation Explained (Honest Guide)
详细的 Abacus AI 评论,涵盖 ChatLLM、Abacus AI Agent、Claw、自动化、应用程序构建、图像和视频生成、定价、优点、缺点以及谁应该使用它。
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
本文被 ACL 2026 第五届自然语言生成、评估和指标研讨会接受。工具调用代理在工具选择、参数准确性和范围识别方面进行评估,但 LLM 轨迹评估本质上仍然是事后评估。与活动执行循环断开连接,此类评估可以识别通常通过即时调整或重新训练来解决的错误,并且从根本上无法实时纠正代理。为了弥补这一差距,我们在推理时将评估转移到执行循环中:专门的审阅代理评估......
PORTool: Importance-Aware Policy Optimization with Rewarded Tree for Multi-Tool-Integrated Reasoning
多工具集成推理使 LLM 授权的工具使用代理能够通过将自然语言推理与对外部工具的调用交错来解决复杂的任务。然而,使用仅结果奖励来训练此类代理会受到信用分配模糊性的影响,从而模糊了哪些中间步骤(或工具使用决策)会导致成功或失败。在本文中,我们提出了 PORTool,这是一种重要性感知的策略优化算法,可以通过结果级别的监督来增强代理的工具使用能力,同时在步骤级别上分配奖励。具体来说,PORTool 会产生奖励......
在这篇文章中,我们介绍了生成式 AI 生产中 LLM 迁移或升级的系统框架,包括基本工具、方法和最佳实践。该框架通过提供用于快速转换和优化的强大协议来促进不同法学硕士之间的转换。
Why AI Engineers Are Moving Beyond LangChain to Native Agent Architectures
框架加速了第一波 LLM 应用程序的发展,但生产需要不同的架构。为什么 AI 工程师超越 LangChain 转向本机代理架构一文首先出现在 Towards Data Science 上。
This startup’s new mechanistic interpretability tool lets you debug LLMs
总部位于旧金山的初创公司 Goodfire 刚刚发布了一款名为 Silico 的新工具,它可以让研究人员和工程师在训练期间查看 AI 模型内部并调整其参数(决定模型行为的设置)。 This could give model makers more fine-grained control over how this technology is built than was once thought possible. Goodfire 声称 Silico...