内存领域信息情报检索---XiaoMi-AI

2026年2月25日 12:12

为什么多代理系统需要内存工程

Why Multi-Agent Systems Need Memory Engineering

大多数多智能体人工智能系统在悄然失效之前都会付出高昂的代价。对于任何调试过该模式的人来说，这种模式都很熟悉：代理 A 完成一项子任务并继续前进。代理 B 由于无法了解 A 的工作，因此使用略有不同的参数重新执行相同的操作。代理 C 收到双方的不一致结果并协商达成一致。 [...]

走向数据科学

2026年2月25日 18:43

打破主机内存瓶颈：Peer Direct 如何改变 Gaudi 的云性能

Breaking the Host Memory Bottleneck: How Peer Direct Transformed Gaudi’s Cloud Performance

使用 libfabric、DMA-BUF 和 HCCL 在云主机 NIC 上设计类似 RDMA 的性能，以恢复分布式训练可扩展性文章《打破主机内存瓶颈：如何对等直接转变 Gaudi 的云性能》首先出现在《走向数据科学》上。

OSP网站大数据新闻

2026年2月5日 18:40

内存技术的进步可以让英特尔回归本源

Успех в технологиях памяти может вернуть Intel к истокам

在运行 AI 工作负载时，Z-Angle Memory 的性能优于 HBM。

危险的经济学家

2026年2月8日 02:19

查看全球存储芯片短缺将让我们付出代价：人工智能公司对一种曾经价格实惠的微芯片的需求可能会推高所有电子产品的价格，并限制克里斯托弗·米姆斯 (Christopher Mims) 的数据中心雄心。短缺是指需求量大于供应量且价格低于均衡状态。但这看起来价格正在上涨，因为需求增加了。新买家愿意支付更高的价格，而老买家可能不愿意，因此他们得到的更少。这对他们来说似乎是短缺，但在这个市场上并不短缺。摘录：“世界上升值最快的资产之一的价值背后是人工智能公司的贪婪胃口。地球上几乎所有数字设备都需要这些相同的芯片（主要是所谓的 RAM，但也有通常称为闪存或固态存储器的存储芯片）。”“2025 年最后一个季度内存

科学美国人

2026年2月5日 16:00

AI 数据中心的繁荣可能导致 Nintendo Switch 2 内存短缺

The AI data center boom could cause a Nintendo Switch 2 memory shortage

数据中心正在消耗计算资源，并推动芯片制造商转向 AI 级内存，从而导致任天堂和其他硬件制造商的供应紧张

Apple机器学习研究

2026年2月24日 00:00

depyf：为机器学习研究人员打开PyTorch编译器的不透明盒子

depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers

PyTorch \texttt{2.x} 引入了一个旨在加速深度学习程序的编译器。然而，对于机器学习研究人员来说，充分发挥 PyTorch 编译器的潜力可能具有挑战性。编译器在 Python 字节码级别运行，使其看起来像一个不透明的盒子。为了解决这个问题，我们引入了 \texttt{depyf}，这是一个旨在揭开 PyTorch 编译器内部工作原理的工具。 \texttt{depyf} 将 PyTorch 生成的字节码反编译回等效的源代码，并在内存中的代码对象与其磁盘上的源代码之间建立连接...

Apple机器学习研究

2026年2月23日 00:00

学习从键值缓存中逐出

Learning to Evict from Key-Value Cache

大型语言模型 (LLM) 规模的不断增长给高效推理带来了挑战，这主要是由于自回归键值 (KV) 缓存的内存需求。现有的逐出或压缩方法可以降低成本，但依赖于启发法，例如新近度或过去的注意力分数，它们只能作为代币未来效用的间接代理，并引入计算开销。我们将 KV 缓存驱逐重新定义为强化学习 (RL) 问题：学习根据令牌对未来解码的预测有用性对令牌进行排名。为此，我们引入了 KV 策略（KVP），这是一个......的框架

Clarifai博客 | 实际应用中的人工智能

2026年2月18日 17:26