在2025年初,我们引入了Amazon Nova Act SDK,作为研究预览,以帮助开发人员构建可以在Web浏览器中可靠完成任务的代理。 Now, we are excited to work with customers to take their agents to production in a limited preview, using new AWS integrations including AWS Identity and Access Management (IAM) for secure credentialing, Amazon Simple Storage Service (Amazon S3) for data storage and policy control, and the new Amazon Bedrock AgentCore Browser Tool for scalable, cloud-based browser execution.In this post, we walk through what makes the Amazon Nova Act SDK unique, how it works, and how各个行业的团队已经在使用它来自动化基于浏览器的工作流程。授予传统自动化业务工作流程的日常业务运营,需要浏览器,例如提交超时请求,处理发票,访问供应商门户或审查仪表板。缺乏API覆盖范围通常意味着手动完成工作流程:团队跨选项卡复制数据,遵循多步流,然后单击无数界面以完成工作。基于传统规则的浏览器自动化框架通常会在动态网络环境中面临挑战。团队可以花费更多的时间来进行持续的维护,而不是构建新的自动化,因为页面结构的变化(例如,新添加的表单字段或下拉列表选项)破坏了脆弱的选择器。最重要的是,这些框架难以扩展。如果在50个不同的网站上执行一种用例(例如,在州网站上进行专业许可证验证),则团队必须构建50个特定网站的自动化,因为基于规则的框架不概括。作为人类,我们执行任务的能力在不同的工具和接口上适应。例如,一旦您知道如何在Outlook中起草电子邮件,即使您以前从未使用过,也可以在Gmail中轻松地做同样的事情。大型语言模型(LLMS)接受了数百万个UI示例的培训,提供了有效的