张量关键词检索结果

IEEE Transactions on Neural Networks and Learning Systems,第 37 卷,第 2 期,2026 年 2 月

IEEE Transactions on Neural Networks and Learning Systems, Volume 37, Issue 2, February 2026

1) 视觉曼巴:全面的调查和分类作者:X. Liu,C. Zhang,F. Huang,S. Xia,G. Wang,L. Zhang 页数:505 - 5252) Hard Sample Mining: A New Paradigm of Efficient and Robust Model Training 作者:L. Liu,Y. Liang,X. Yan,L. Huangfu,S. Samtani,Z. Yu,Y.张,D. D. Zeng页数:526 - 5463) FEU-Diff:用于医学图像分割的模糊证据驱动的动态不确定性融合的扩散模型作者:S. Geng,S. Jiang,T.

并行轨道变压器:通过减少同步实现快速 GPU 推理

Parallel Track Transformers: Enabling Fast GPU Inference with Reduced Synchronization

基于 Transformer 的大型语言模型 (LLM) 的高效大规模推理仍然是一个基本的系统挑战,经常需要多 GPU 并行性来满足严格的延迟和吞吐量目标。传统的张量并行性会分解跨设备的矩阵运算,但会引入大量的 GPU 间同步,从而导致通信瓶颈和可扩展性下降。我们提出了并行轨道(PT)变压器,这是一种新颖的架构范例,可以重组计算以最小化跨设备依赖性。 PT 实现了高达 16 倍的减少……