负载的关键词检索结果

利用 TTFT 和估计配额消耗的新 CloudWatch 指标提高 Amazon Bedrock 上推理工作负载的运营可见性

Improve operational visibility for inference workloads on Amazon Bedrock with new CloudWatch metrics for TTFT and Estimated Quota Consumption

今天,我们宣布针对 Amazon Bedrock 推出两个新的 Amazon CloudWatch 指标:TimeToFirstToken 和 EstimatedTPMQuotaUsage。在这篇文章中,我们将介绍它们的工作原理以及如何设置警报、建立基线以及使用它们主动管理容量。

帮助数据中心以更少的硬件提供更高的性能

Helping data centers deliver higher performance with less hardware

研究人员开发了一种智能平衡工作负载的系统,以提高数据中心闪存存储硬件的效率。

数据中心导致全球变暖

Дата‑центры вносят свой вклад на глобальное потепление

具有 AI 负载的数据中心可在最远 10 公里的距离内提高地球表面的温度。

每个安全团队都应该拥有的 5 个 AWS AI 控制

5 AWS AI Controls Every Security Team Should Have

大多数团队在应用层管理 AI 工作负载。他们为其 Bedrock 代理配置护栏,确定每个工作负载的 IAM 角色范围,并围绕批准的模型构建策略。该规则很重要,但当开发人员启动新帐户或直接调用模型而不接触应用程序堆栈时,它就会崩溃。组织级执法 [...]

您的治理能否跟上您的人工智能雄心?代理时代的AI风险情报

Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic era

为静态部署设计的传统框架无法解决定义代理工作负载的动态交互。来自 AWS 生成式 AI 创新中心的 AI 风险情报 (AIRI) 提供了管理企业规模代理所需的自动化严格性,这是对安全、运营和治理如何系统地协同工作的根本性重新构想。

HashiCorp Vault 1.21 带来 SPIFFE 身份验证、精细秘密恢复等功能

HashiCorp Vault 1.21 Brings SPIFFE Authentication, Granular Secret Recovery, and More

HashiCorp 已发布 Vault 1.21。此版本引入了针对非人类工作负载的本机 SPIFFE 身份验证,扩展了 Vault 1.20 中引入的粒度秘密恢复模型,并添加了 KV v2 秘密归属、MFA TOTP 自注册、Vault Secrets Operator CSI 驱动程序(可将秘密直接装载到 pod 中,而不将其保留在 etcd 中)等等。作者:迪奥戈·卡莱托

Nvidia 提出了一种有前景的 AI 数据中心架构

В Nvidia предложили перспективную архитектуру дата-центров для ИИ

Nvidia 相信,“AI 工厂”将解决处理 AI 负载的许多问题。