网络 网络是将 ALCF 的所有计算系统连接在一起的结构。InfiniBand 支持系统 I/O 节点和 ALCF 的各种存储系统之间的通信。生产 HPC SAN 建立在 NVIDIA Mellanox 高数据速率 (HDR) InfiniBand 硬件之上。两台 800 端口核心交换机在 80 台边缘交换机之间提供主干链路,在无阻塞胖树拓扑中产生总共 1600 个可用主机端口,每个端口的速率为 200 Gbps。此结构的完整二分带宽为 320 Tbps。HPC SAN 由 NVIDIA Mellanox 统一结构管理器 (UFM) 维护,提供自适应路由以避免拥塞,以及 NVIDIA Mellanox 智能数据中心自修复互连增强 (SHIELD) 弹性系统,用于链路故障检测和恢复。
主要关键词