FP8关键词检索结果

打破硬件障碍:适用于较旧 GPU 的软件 FP8

Breaking the Hardware Barrier: Software FP8 for Older GPUs

深度学习工作负载越来越受内存限制,GPU 核心在等待数据传输时处于空闲状态。 FP8 精度在较新的硬件上解决了这个问题,但是已经部署的数百万个 RTX 30 和 20 系列 GPU 又如何呢? Feather 证明,通过按位打包进行基于软件的 FP8 仿真可以实现接近理论的 4 倍带宽改进(实测为 3.3 倍),无需昂贵的硬件升级即可实现高效的深度学习。《打破硬件障碍:适用于旧版 GPU 的软件 FP8》一文首先出现在《走向数据科学》上。