Learning to Evict from Key-Value Cache
大型语言模型 (LLM) 规模的不断增长给高效推理带来了挑战,这主要是由于自回归键值 (KV) 缓存的内存需求。现有的逐出或压缩方法可以降低成本,但依赖于启发法,例如新近度或过去的注意力分数,它们只能作为代币未来效用的间接代理,并引入计算开销。我们将 KV 缓存驱逐重新定义为强化学习 (RL) 问题:学习根据令牌对未来解码的预测有用性对令牌进行排名。为此,我们引入了 KV 策略(KVP),这是一个......的框架
GAO Report on Navy Operational Testing
以下是 2026 年 1 月 15 日政府问责办公室的报告,《海军造船:改进作战人员参与度和作战测试工具可以提高及时性和有用性》。作战测试——用于评估新舰艇在现实和相关条件下执行的能力——对于海军了解舰艇对抗对手先进能力的能力至关重要。 GAO 发现,海军测试和评估政策并不能确保代表作战人员的关键组织持续参与测试和评估工作级集成产品团队。作战人员组织在这些团队中的代表方式存在不确定性,这对于测试至关重要