内存关键词检索结果

为什么多代理系统需要内存工程

Why Multi-Agent Systems Need Memory Engineering

大多数多智能体人工智能系统在悄然失效之前都会付出高昂的代价。对于任何调试过该模式的人来说,这种模式都很熟悉:代理 A 完成一项子任务并继续前进。代理 B 由于无法了解 A 的工作,因此使用略有不同的参数重新执行相同的操作。代理 C 收到双方的不一致结果并协商达成一致。 [...]

打破主机内存瓶颈:Peer Direct 如何改变 Gaudi 的云性能

Breaking the Host Memory Bottleneck: How Peer Direct Transformed Gaudi’s Cloud Performance

使用 libfabric、DMA-BUF 和 HCCL 在云主机 NIC 上设计类似 RDMA 的性能,以恢复分布式训练可扩展性 文章《打破主机内存瓶颈:如何对等直接转变 Gaudi 的云性能》首先出现在《走向数据科学》上。

内存技术的进步可以让英特尔回归本源

Успех в технологиях памяти может вернуть Intel к истокам

在运行 AI 工作负载时,Z-Angle Memory 的性能优于 HBM。

内存芯片是否短缺?

Is There A Memory-Chip Shortage?

查看全球存储芯片短缺将让我们付出代价:人工智能公司对一种曾经价格实惠的微芯片的需求可能会推高所有电子产品的价格,并限制克里斯托弗·米姆斯 (Christopher Mims) 的数据中心雄心。短缺是指需求量大于供应量且价格低于均衡状态。但这看起来价格正在上涨,因为需求增加了。新买家愿意支付更高的价格,而老买家可能不愿意,因此他们得到的更少。这对他们来说似乎是短缺,但在这个市场上并不短缺。摘录:“世界上升值最快的资产之一的价值背后是人工智能公司的贪婪胃口。地球上几乎所有数字设备都需要这些相同的芯片(主要是所谓的 RAM,但也有通常称为闪存或固态存储器的存储芯片)。”“2025 年最后一个季度内存

AI 数据中心的繁荣可能导致 Nintendo Switch 2 内存短缺

The AI data center boom could cause a Nintendo Switch 2 memory shortage

数据中心正在消耗计算资源,并推动芯片制造商转向 AI 级内存,从而导致任天堂和其他硬件制造商的供应紧张

depyf:为机器学习研究人员打开PyTorch编译器的不透明盒子

depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers

PyTorch \texttt{2.x} 引入了一个旨在加速深度学习程序的编译器。然而,对于机器学习研究人员来说,充分发挥 PyTorch 编译器的潜力可能具有挑战性。编译器在 Python 字节码级别运行,使其看起来像一个不透明的盒子。为了解决这个问题,我们引入了 \texttt{depyf},这是一个旨在揭开 PyTorch 编译器内部工作原理的工具。 \texttt{depyf} 将 PyTorch 生成的字节码反编译回等效的源代码,并在内存中的代码对象与其磁盘上的源代码之间建立连接...

学习从键值缓存中逐出

Learning to Evict from Key-Value Cache

大型语言模型 (LLM) 规模的不断增长给高效推理带来了挑战,这主要是由于自回归键值 (KV) 缓存的内存需求。现有的逐出或压缩方法可以降低成本,但依赖于启发法,例如新近度或过去的注意力分数,它们只能作为代币未来效用的间接代理,并引入计算开销。我们将 KV 缓存驱逐重新定义为强化学习 (RL) 问题:学习根据令牌对未来解码的预测有用性对令牌进行排名。为此,我们引入了 KV 策略(KVP),这是一个......的框架

多 GPU 与单 GPU 扩展经济学

Multi-GPU vs Single-GPU Scaling economics

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

LLM 的 DPO 与 PPO:主要差异和用例

DPO vs PPO for LLMs: Key Differences & Use Cases

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

AI 成本控制:预算、节流和模型分层

AI Cost Controls: Budgets, Throttling & Model Tiering

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

2026 年最佳私有云托管平台

Best Private Cloud Hosting Platforms in 2026

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

LLM 模型架构解释:MoE 的转换器

LLM Model Architecture Explained: Transformers to MoE

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

跨 SaaS、VPC 和本地部署 MCP | 2026年指南

Deploying MCP Across SaaS, VPC & On-Prem | 2026 Guide

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

Dixon 的 Atul Lall 表示,贸易协议对 EMS 参与者的出口前景有很大积极作用

Trade deals a big positive for export prospects of EMS players, says Dixon’s Atul Lall

请观看 Bijoy 今天点击的 Atul Lall 的照片 由于近几个月内存价格上涨导致移动销售疲软,拖累了 Dixon 在截至 12 月的季度的营收

最便宜的云 GPU:AI 团队节省计算成本的地方

Cheapest Cloud GPUs: Where AI Teams Save on Compute

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

什么是托管云?优点、用例及其工作原理

What Is Managed Cloud? Benefits, Use Cases, and How It Works

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

2026 年十大混合云提供商 | AI 就绪企业指南

Top 10 Hybrid Cloud Providers in 2026 | AI-Ready Enterprise Guide

企业级 AMD MI355X 指南,涵盖 AI 推理、LLM 培训、内存扩展、性能权衡和部署策略。

总结:Anthropic、Litera、LegalOS(再次)、失业恐惧 + 更多

Wrap: Anthropic, Litera, LegalOS (Again), Job Loss Fears + More

大家早上好,这是本周的 AL Wrap,为了改变一下,让我们从即将举行的关于“内存层”的 Litera 网络研讨会开始,这就是......