工作负载关键词检索结果

CNCF 警告仅靠 Kubernetes 不足以保护 LLM 工作负载

CNCF Warns Kubernetes Alone Is Not Enough to Secure LLM Workloads

来自云原生计算基金会的一篇新博客强调了组织在 Kubernetes 上部署大型语言模型 (LLM) 的关键差距:虽然 Kubernetes 擅长编排和隔离工作负载,但它本质上并不理解或控制人工智能系统的行为,从而创建了一个根本不同且更复杂的威胁模型。作者:克雷格·里西

适用于 AI 代理的云 PAM:为什么传统 PAM 无法保护代理工作负载

Cloud PAM for AI Agents: Why Traditional PAM Can't Protect Agentic Workloads

AI 代理是云身份。他们在部署时接收 IAM 角色、持有凭证并访问云资源来执行任务。但与人类用户不同的是,他们这样做不需要基于会话的检查点,不需要手动批准步骤,有时甚至需要最少的人工参与。传统的 PAM 是基于一个人发起访问的假设而构建的。人工智能代理挑战 [...]

云工作负载安全:注意差距

Cloud workload security: Mind the gaps

随着 IT 基础设施的扩展,可见性和控制往往会滞后 – 直到发生事件迫使我们进行清算

在 Amazon SageMaker HyperPod 上运行推理的最佳实践

Best practices to run inference on Amazon SageMaker HyperPod

本文探讨了 Amazon SageMaker HyperPod 如何为推理工作负载提供全面的解决方案。我们将引导您了解该平台的动态扩展、简化部署和智能资源管理的关键功能。在本文结束时,您将了解如何使用 HyperPod 自动化基础设施、成本优化功能和性能增强功能将总拥有成本降低高达 40%,同时加速从概念到生产的生成式 AI 部署。

帮助数据中心以更少的硬件提供更高的性能

Helping data centers deliver higher performance with less hardware

研究人员开发了一种智能平衡工作负载的系统,以提高数据中心闪存存储硬件的效率。

通过 Amazon Bedrock 项目管理 AI 成本

Manage AI costs with Amazon Bedrock Projects

借助 Amazon Bedrock Projects,您可以将推理成本归因于特定工作负载,并在 AWS Cost Explorer 和 AWS Data Exports 中对其进行分析。在这篇文章中,您将学习如何端到端地设置项目,从设计标记策略到分析成本。

将 AI 代理视为身份如何降低企业 AI 风险

How Treating AI Agents as Identities Can Reduce Enterprise AI Risk

AI 代理不再是实验性的。他们运行生产工作负载、调用 API、查询数据库、配置基础设施以及跨云环境做出决策。讽刺的是,这些代理最终往往比构建它们的开发人员拥有更多的访问权限。当出现问题时,他们以真实的凭证、真实的权限和真实的后果进行操作。大多数企业安全 [...]

每个安全团队都应该拥有的 5 个 AWS AI 控制

5 AWS AI Controls Every Security Team Should Have

大多数团队在应用层管理 AI 工作负载。他们为其 Bedrock 代理配置护栏,确定每个工作负载的 IAM 角色范围,并围绕批准的模型构建策略。该规则很重要,但当开发人员启动新帐户或直接调用模型而不接触应用程序堆栈时,它就会崩溃。组织级执法 [...]

您的治理能否跟上您的人工智能雄心?代理时代的AI风险情报

Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic era

为静态部署设计的传统框架无法解决定义代理工作负载的动态交互。来自 AWS 生成式 AI 创新中心的 AI 风险情报 (AIRI) 提供了管理企业规模代理所需的自动化严格性,这是对安全、运营和治理如何系统地协同工作的根本性重新构想。

HashiCorp Vault 1.21 带来 SPIFFE 身份验证、精细秘密恢复等功能

HashiCorp Vault 1.21 Brings SPIFFE Authentication, Granular Secret Recovery, and More

HashiCorp 已发布 Vault 1.21。此版本引入了针对非人类工作负载的本机 SPIFFE 身份验证,扩展了 Vault 1.20 中引入的粒度秘密恢复模型,并添加了 KV v2 秘密归属、MFA TOTP 自注册、Vault Secrets Operator CSI 驱动程序(可将秘密直接装载到 pod 中,而不将其保留在 etcd 中)等等。作者:迪奥戈·卡莱托