令牌领域信息情报检索---XiaoMi-AI

走向数据科学

2026年2月24日 20:00

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

Sunsea航空博客

2026年3月2日 22:18

Plinko 游戏的神灵：改变机会的神圣赌场体验

Deities of Plinko Game: The Sacred Casino Experience That Transforms Chance

部分索引神圣机制驱动我们的游戏古代框架与主题集成计算的游戏组件乘数系统与支付框架平台规格与公平游戏神圣机制为我们的游戏提供动力该游戏代表了古代神话与先进概率论相结合的创新融合。在《Gods of Plinko》的基础上开发，我们提供了一种独特的体验，玩家可以看到令牌从障碍物结构中下降，每次碰撞都通过完全的数学机会决定结果。物理引擎驱动……继续阅读“Plinko 游戏的神性：改变机会的神圣赌场体验”

DataRobot博客

2026年3月2日 17:45

自我管理的可观察性：在您的边界内运行代理 AI

Self-managed observability: Running agentic AI inside your boundary

当人工智能系统在生产中表现不可预测时，问题很少出现在单个模型端点上。出现延迟峰值或失败请求的情况通常可以追溯到重试循环、不稳定的集成、令牌过期、编排错误或跨多个服务的基础设施压力。在分布式、代理架构中，症状出现在边缘，而根本原因......自我管理的可观察性：在边界内运行代理人工智能一文首先出现在 DataRobot 上。

Apple机器学习研究

2026年2月25日 00:00

建设性电路放大：通过有针对性的子网络更新改进法学硕士的数学推理

Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates

之前对法学硕士内部运作的研究发现了稀疏子网络，通常称为电路，负责执行特定任务。此外，研究表明，通过微调来提高模型性能通常来自于模型中现有电路的强化。总而言之，这些发现表明直接干预此类电路以进行精确的、针对任务的更新的可能性。受这些发现的启发，我们提出了一种称为“结构性电路放大”的新方法，它可以识别关键令牌……

Apple机器学习研究

2026年2月23日 00:00

学习从键值缓存中逐出

Learning to Evict from Key-Value Cache

大型语言模型 (LLM) 规模的不断增长给高效推理带来了挑战，这主要是由于自回归键值 (KV) 缓存的内存需求。现有的逐出或压缩方法可以降低成本，但依赖于启发法，例如新近度或过去的注意力分数，它们只能作为代币未来效用的间接代理，并引入计算开销。我们将 KV 缓存驱逐重新定义为强化学习 (RL) 问题：学习根据令牌对未来解码的预测有用性对令牌进行排名。为此，我们引入了 KV 策略（KVP），这是一个......的框架

令牌关键词检索结果

优化 PyTorch 解码器模型中的令牌生成

Plinko 游戏的神灵：改变机会的神圣赌场体验

自我管理的可观察性：在您的边界内运行代理 AI

建设性电路放大：通过有针对性的子网络更新改进法学硕士的数学推理

学习从键值缓存中逐出