Infiniband是世界领先的超级计算机的首选选择,可以取代较低的性能和专有互连选项。基于Infiniband的端到端NVIDIA网络可实现极低的潜伏期和高数据吞吐量和消息率。其高价值功能,例如智能网络计算机加速发动机,结合了先进的自我修复网络能力,交通拥堵控制,服务质量和自适应路由,为高性能计算,人工智能,人工智能以及其他计算和数据密集应用提供了领先的性能和可扩展性。Infiniband的性能优势是首屈一指的,而其开放的行业标准支持后代兼容性的保证,请确保用户保护其数据中心投资。
重要提示 本产品应安装在限制访问位置。本产品应仅由服务人员安装、更换和/或维修。- 限制访问位置 设备的位置,同时满足以下两个条件: − 只有服务人员或已被告知限制位置的原因以及应采取的任何预防措施的用户才能访问。− 访问是通过使用工具或锁和钥匙或其他安全手段进行的,并由负责该位置的机构控制 - 服务人员 具有适当的技术培训和经验,了解执行任务时可能遇到的危险,并了解尽量减少对该人或他人的风险的措施。
• 通过连接多个 Exadata 数据库机 X5-2 机架或 Exadata 存储扩展机架进行扩展。只需通过 InfiniBand 电缆连接并使用内部交换机,即可连接最多 18 个机架。可以使用外部 InfiniBand 交换机构建更大的配置
nvidia(mlnx_ofed)是ofed的NVIDIA测试和包装版本,并使用相同的RDMA(远程DMA)和核旁路APIS支持两种互连类型,称为Infiniband和Ethernet。最多可达400GB/s Infiniband和ROCE(基于RDMA,基于RDMA),并支持启用OEM和系统集成商,以满足上述市场中最终用户的需求。
复杂的工作负载需要高分辨率模拟,极尺寸的数据集和高度平行算法的超快速处理。随着这些计算需求的不断增长,NVIDIA®量子Infiniband平台(世界唯一完全可攻击的,网络内计算机互连技术)提供了在HPC,AI和Hyperscale云基础设施中实现无与伦比的性能所需的巨大绩效飞跃,其成本和复杂性较小。NVIDIA Quantum-2是第七代Infiniband Architecture,它为AI开发人员,科学研究人员和产品设计师提供了更快的网络性能和功能集,以解决世界上最具挑战性的问题。NVIDIA Quantum-2是第七代Infiniband Architecture,它为AI开发人员,科学研究人员和产品设计师提供了更快的网络性能和功能集,以解决世界上最具挑战性的问题。
网络 网络是将 ALCF 的所有计算系统连接在一起的结构。InfiniBand 支持系统 I/O 节点和 ALCF 的各种存储系统之间的通信。生产 HPC SAN 建立在 NVIDIA Mellanox 高数据速率 (HDR) InfiniBand 硬件之上。两台 800 端口核心交换机在 80 台边缘交换机之间提供主干链路,在无阻塞胖树拓扑中产生总共 1600 个可用主机端口,每个端口的速率为 200 Gbps。此结构的完整二分带宽为 320 Tbps。HPC SAN 由 NVIDIA Mellanox 统一结构管理器 (UFM) 维护,提供自适应路由以避免拥塞,以及 NVIDIA Mellanox 智能数据中心自修复互连增强 (SHIELD) 弹性系统,用于链路故障检测和恢复。
Supermicro的超集群参考体系结构旨在解决计划和部署高度复杂的规模规模AI基础架构的挑战。超集群通过提供可互操作的组件(称为“可伸单元(SU)”的基本包装来大大简化基础架构项目。使用NVIDIA的突破性H100/H200 GPU以及Infiniband Compute Fabric -Supermicro Supercluster SU,具有32个超级功能强大的GPU系统,是建立世界上最大的AI AI训练基础设施的终极组成部分。随着需求的增长,这种独特的SU毫不费力地利用Nvidia Quantum Infiniband的力量扩展基础架构 - 确保客户始终具有满足不断发展的
● 570 台 2U4N 服务器,用于 2,280 个双处理器节点 ● 4,560 个 AMD Epyc 7601 32 核处理器 ● 总共 145,920 个核心 ● 仅 DLC 处理器冷却回路 ● 30 个 DLC 冷却机架,配备 15 个行内冷却器 ● InfiniBand HDR 核心交换机、HDR100 边缘交换机 ● 两个带有行内冷却器的 ILC 冷却机架,用于存储系统
• 每个 VAST 数据文件服务器都是双宿主的,通过一个 (1) 100Gb HDR InfiniBand 端口(使用来自 200Gb 交换机端口的双向分离器)连接,以服务来自 DGX A100 系统的存储请求,并通过两个 (2) 100GbE 端口连接到后端存储(以太网)结构。