Amazon Bedrock AgentCore Runtime 现已提供用于实时代理交互的双向流式传输

在本文中,您将了解 AgentCore 运行时上的双向流以及创建 WebSocket 实现的先决条件。您还将了解如何使用 Strands Agents 为语音代理实现双向流解决方案。

来源:亚马逊云科技 _机器学习

与人工智能代理建立自然的语音对话需要复杂的基础设施和工程团队的大量代码。基于文本的代理交互遵循基于回合的模式:用户发送完整的请求,等待代理处理它,并在继续之前收到完整的响应。双向流通过建立同时在两个方向上传输数据的持久连接来消除这一限制。

Amazon Bedrock AgentCore Runtime 支持双向流,以实现用户和 AI 代理之间的实时双向通信。借助此功能,代理可以在生成响应的同时监听用户输入,从而创建更自然的对话流程。这特别适合多模式交互,例如语音和视觉代理对话。代理可以在仍然接收用户输入的同时开始响应,处理对话中的中断,并根据实时反馈调整其响应。

双向语音聊天代理可以进行具有人类对话流畅性的口语对话,以便用户可以自然地打断、澄清或改变话题。这些代理同时处理流音频输入和输出,同时保持会话状态。构建此基础设施需要管理持续的低延迟连接、处理并发音频流、保留交换之间的上下文以及扩展多个对话。从头开始实现这些功能需要数月的工程工作和专门的实时系统专业知识。 Amazon Bedrock AgentCore Runtime 通过提供安全、无服务器且专门构建的托管环境来部署和运行 AI 代理来解决这些挑战,而无需开发人员自行构建和维护复杂的流基础设施。

AgentCore Runtime 双向流

WebSocket 实现

wss://bedrock-agentcore..amazonaws.com/runtimes//ws

结论