CNCF Warns Kubernetes Alone Is Not Enough to Secure LLM Workloads
来自云原生计算基金会的一篇新博客强调了组织在 Kubernetes 上部署大型语言模型 (LLM) 的关键差距:虽然 Kubernetes 擅长编排和隔离工作负载,但它本质上并不理解或控制人工智能系统的行为,从而创建了一个根本不同且更复杂的威胁模型。作者:克雷格·里西
Cloud PAM for AI Agents: Why Traditional PAM Can't Protect Agentic Workloads
AI 代理是云身份。他们在部署时接收 IAM 角色、持有凭证并访问云资源来执行任务。但与人类用户不同的是,他们这样做不需要基于会话的检查点,不需要手动批准步骤,有时甚至需要最少的人工参与。传统的 PAM 是基于一个人发起访问的假设而构建的。人工智能代理挑战 [...]
Best practices to run inference on Amazon SageMaker HyperPod
本文探讨了 Amazon SageMaker HyperPod 如何为推理工作负载提供全面的解决方案。我们将引导您了解该平台的动态扩展、简化部署和智能资源管理的关键功能。在本文结束时,您将了解如何使用 HyperPod 自动化基础设施、成本优化功能和性能增强功能将总拥有成本降低高达 40%,同时加速从概念到生产的生成式 AI 部署。
Helping data centers deliver higher performance with less hardware
研究人员开发了一种智能平衡工作负载的系统,以提高数据中心闪存存储硬件的效率。
Manage AI costs with Amazon Bedrock Projects
借助 Amazon Bedrock Projects,您可以将推理成本归因于特定工作负载,并在 AWS Cost Explorer 和 AWS Data Exports 中对其进行分析。在这篇文章中,您将学习如何端到端地设置项目,从设计标记策略到分析成本。
How Treating AI Agents as Identities Can Reduce Enterprise AI Risk
AI 代理不再是实验性的。他们运行生产工作负载、调用 API、查询数据库、配置基础设施以及跨云环境做出决策。讽刺的是,这些代理最终往往比构建它们的开发人员拥有更多的访问权限。当出现问题时,他们以真实的凭证、真实的权限和真实的后果进行操作。大多数企业安全 [...]
5 AWS AI Controls Every Security Team Should Have
大多数团队在应用层管理 AI 工作负载。他们为其 Bedrock 代理配置护栏,确定每个工作负载的 IAM 角色范围,并围绕批准的模型构建策略。该规则很重要,但当开发人员启动新帐户或直接调用模型而不接触应用程序堆栈时,它就会崩溃。组织级执法 [...]
Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic era
为静态部署设计的传统框架无法解决定义代理工作负载的动态交互。来自 AWS 生成式 AI 创新中心的 AI 风险情报 (AIRI) 提供了管理企业规模代理所需的自动化严格性,这是对安全、运营和治理如何系统地协同工作的根本性重新构想。
HashiCorp Vault 1.21 Brings SPIFFE Authentication, Granular Secret Recovery, and More
HashiCorp 已发布 Vault 1.21。此版本引入了针对非人类工作负载的本机 SPIFFE 身份验证,扩展了 Vault 1.20 中引入的粒度秘密恢复模型,并添加了 KV v2 秘密归属、MFA TOTP 自注册、Vault Secrets Operator CSI 驱动程序(可将秘密直接装载到 pod 中,而不将其保留在 etcd 中)等等。作者:迪奥戈·卡莱托