今天,我们宣布针对 Amazon Bedrock 推出两个新的 Amazon CloudWatch 指标:TimeToFirstToken 和 EstimatedTPMQuotaUsage。在这篇文章中,我们将介绍它们的工作原理以及如何设置警报、建立基线以及使用它们主动管理容量。
Helping data centers deliver higher performance with less hardware
研究人员开发了一种智能平衡工作负载的系统,以提高数据中心闪存存储硬件的效率。
Дата‑центры вносят свой вклад на глобальное потепление
具有 AI 负载的数据中心可在最远 10 公里的距离内提高地球表面的温度。
5 AWS AI Controls Every Security Team Should Have
大多数团队在应用层管理 AI 工作负载。他们为其 Bedrock 代理配置护栏,确定每个工作负载的 IAM 角色范围,并围绕批准的模型构建策略。该规则很重要,但当开发人员启动新帐户或直接调用模型而不接触应用程序堆栈时,它就会崩溃。组织级执法 [...]
Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic era
为静态部署设计的传统框架无法解决定义代理工作负载的动态交互。来自 AWS 生成式 AI 创新中心的 AI 风险情报 (AIRI) 提供了管理企业规模代理所需的自动化严格性,这是对安全、运营和治理如何系统地协同工作的根本性重新构想。
HashiCorp Vault 1.21 Brings SPIFFE Authentication, Granular Secret Recovery, and More
HashiCorp 已发布 Vault 1.21。此版本引入了针对非人类工作负载的本机 SPIFFE 身份验证,扩展了 Vault 1.20 中引入的粒度秘密恢复模型,并添加了 KV v2 秘密归属、MFA TOTP 自注册、Vault Secrets Operator CSI 驱动程序(可将秘密直接装载到 pod 中,而不将其保留在 etcd 中)等等。作者:迪奥戈·卡莱托
В Nvidia предложили перспективную архитектуру дата-центров для ИИ
Nvidia 相信,“AI 工厂”将解决处理 AI 负载的许多问题。