Building a strong data infrastructure for AI agent success
在采用和展示人工智能价值的竞赛中,企业比以往任何时候都更快地部署代理人工智能作为副驾驶、助理和自主任务运行者。根据……,到 2025 年末,近三分之二的公司正在试验人工智能代理,而 88% 的公司在至少一项业务功能中使用人工智能,高于 2024 年的 78%。
«Яндекс» обновил платформу для разработки ИИ-агентов
Yandex AI Studio 提供对 30 多个生成模型的访问 - 都是开放的并且是在 Yandex 本身中开发的。
Mapping the Design Space of User Experience for Computer Use Agents
基于大型语言模型 (LLM) 的计算机使用代理通过与可用的 UI 元素交互来执行用户命令,但对于用户希望如何与这些代理交互或哪些设计因素对其用户体验 (UX) 至关重要,人们知之甚少。我们进行了一项两阶段的研究来绘制计算机使用代理的用户体验设计空间。在第一阶段,我们审查了现有系统,以制定用户体验考虑因素的分类法,然后通过采访八位用户体验和人工智能从业者来完善它。由此产生的分类法包括用户提示、可解释性、用户控制和用户……等类别。
Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents
开发与图形用户界面 (GUI) 有效交互的自主代理仍然是一个具有挑战性的开放问题,特别是对于小型设备上模型。在本文中,我们介绍了 Ferret-UI Lite,这是一种紧凑的端到端 GUI 代理,可以跨不同平台(包括移动、Web 和桌面)运行。利用为开发小型模型而优化的技术,我们通过从真实和合成来源中策划多样化的 GUI 数据混合物来构建我们的 3B Ferret-UI Lite 代理,通过思想链推理和可视化工具的使用来增强推理时性能,并且......
Here's what to know about the constitutional right to record immigration agents in public
在公共场合对值班的移民代理人进行录音是第一修正案的权利,但阻碍移民代理人工作是犯罪行为。某件事是否构成妨碍可能是主观的。以下是法律专家认为您应该了解的内容。
AMUSE: Audio-Visual Benchmark and Alignment Framework for Agentic Multi-Speaker Understanding
最近的多模态大语言模型 (MLLM),例如 GPT-4o 和 Qwen3-Omni,表现出很强的感知能力,但在多说话者、以对话为中心的环境中表现不佳,这些环境需要代理推理跟踪谁说话、维持角色以及跨时间的基础事件。这些场景是多模式音频-视频理解的核心,其中模型必须在会话视频助手和会议分析等应用程序中联合推理音频和视频流。我们引入 AMUSE,这是一个围绕本质上代理的任务设计的基准,需要模型分解复杂的......
Jim Wetekamp — Connected Risk Intelligence for the AI Enterprise
执行摘要。随着风险变得越来越快、相互关联性越来越强,传统的定期审查模式正在崩溃。在这次对话中,Riskonnect 首席执行官 Jim Wetekamp 解释了为什么企业风险管理正在成为人工智能的关键试验场,以及集成数据、基于代理的工作流程和治理优先的设计如何使组织从回顾性报告转向持续风险 [...]
Claude Code Security Causes A SaaS-pocalypse In Cybersecurity
我们以前见过这种模式,即使具体情况看起来有所不同。回想一下 AWS 推出 GuardDuty 的那一天,当时 Microsoft 将 Defender for Endpoint 纳入其企业许可承诺并推出 Microsoft Sentinel,或者 Google 收购了 Mandiant 并最终收购了 Wiz。当然,完全自主的人工智能代理的推出可以摄取整个[...]
Am I going to be replaced by AI?
随着时间的推移,似乎另一个行业正在遭受人工智能引发的股市波动。当一种新的以法律为重点的人工智能工具推出时,我们看到大数据公司损失了数十亿美元的价值;我们看到,随着人工智能代理的升级,消费者和个人金融平台的所有者受到了打击;和昨天 [...]
Building real-time voice assistants with Amazon Nova Sonic compared to cascading architectures
Amazon Nova Sonic 通过双向流接口提供实时、类人的语音对话。在本文中,您将了解 Amazon Nova Sonic 如何解决级联方法所面临的一些挑战、简化语音 AI 代理的构建并提供自然的对话功能。我们还提供有关何时选择每种方法的指导,以帮助您为语音 AI 项目做出明智的决策。
Prompt Fidelity: Measuring How Much of Your Intent an AI Agent Actually Executes
您的 AI 代理的输出中有多少是真实数据,而不是自信的猜测?帖子提示保真度:测量 AI 代理实际执行的意图的数量首先出现在《走向数据科学》上。