在不同 NUMA 节点中的多个 GPU 上运行 NCCL 多年来,随着越来越多的计算、内存和加速集成到一台机器中,计算节点的复杂性日益增加。现在,单个主机通常具有多个 GPU 和 CPU 插槽,并且设备之间具有连接层次,并排列在多个 NUMA 节点中。为确保工作负载与 CPU、GPU 和内存一起放置在同一个 PCIe 总线上,PBS Professional 可以根据 NUMA 拓扑将计算节点划分为 vnode。通过这种方式,PBS Professional 可以保证在使用部分主机时将较小的作业最佳地放置在拓扑上彼此接近的资源上,但又可以灵活地将整个主机分配给较大的作业(如果需要)。
主要关键词