对于需要比最大的 16-GPU 系统更多的 CUDA 核心和 GPU 内存的 AI 模型和数据批次,GPUDirect RDMA 和 NCCL 用于通过 100Gigabit InfiniBand 或以太网结构扩展 GPU 核心和内存。NGC 软件使部署多个 GPU 系统变得容易。可以聚合数十或数百个这样的系统来运行最大的 AI 模型和数据批次。结合高性能 NVMe 结构存储和网络,这些系统可以轻松快速地构建复杂的 AI 系统。
基于NVIDIA Quantum-2的QM9700和QM9790开关系统在1U标准底盘设计中,每个端口提供了前所未有的64个端口,为400GB/s Infiniband。单个开关的汇总双向吞吐量为每秒51.2 Terabits(TB/s),地标超过665亿数据包(BPPS)。NVIDIA Quantum-2支持最新的NVIDIA高速互连400GB/S技术,带来了高速,极低的潜伏期和可扩展的解决方案,其中包含了最先进的技术,例如远程直接内存访问(RDMA),适应性路由,适应性路由,以及NVIDIA可伸缩的层次汇总集合和锋利的层次结构(Sprand Cartigation and Replection and Redication and Redication and Redication and Redication and Reduction and Reduction and Reduction and Repluction and Reduction)™。
64位微处理器(MPU)的PIC64-HPSC(高性能太空计算)系列代表了辐射硬化和耐辐射的处理器的革命性步骤。与传统的空间处理器相比,提供100×的处理能力提高,并将新的功能带入空间,例如虚拟化,AI,TSN以太网,RDMA,超过融合以太网V2,PCIE®,Compute ExpressLink®(CXL®)(CXL®)2.0和Qualtum Cryptography,PIC64-HPS和PIC64-HPS的空间以及可能的空间以及可能的空间。PIC64-HPSC1000和PIC64-HPSC1100家族在同一硬件和软件足迹中包含多个设备版本,以满足从低地球轨道(LEO)到Deep Space的任务配置文件。
QFX5240 800GBE开关(64端口800GBE)是一个专为脊柱,叶子和边界开关角色设计的下一代,固定配置平台。该开关为IP内织物连接性提供了灵活的,具有成本效益的高密度800GBE,400GBE,100GBE和50GBE接口,以及较高的密度200/400GBE NIC连接性,用于AI/ML使用情况。是51.2TBPS单向吞吐量满足AI/ML工作负载和存储系统的带宽要求,其延迟范围在700-750NS(商店和前方)。远程直接内存访问(RDMA)是AI/ML Workloads中使用的事实数据传输技术,并且它使用远程直接内存访问在收敛的以太网V2(ROCEV2)上用于网络层的传输。QFX5240支持ROCEV2以及拥塞管理功能,例如优先流量控制(PFC),明确的拥塞
Fusion Applications Suite 在单一数据平台上提供世界上最完整、原生集成的业务解决方案套件。它提供广泛的嵌入式 AI 功能,并且每季度为 14,000 名客户提供新的 AI 功能和更好的结果。Fusion Applications 中的 AI 功能由 Oracle Cloud Infrastructure (OCI) 提供支持,该基础设施在运行 AI 工作负载方面具有独特优势,因为它提供最高性能和最低成本的 GPU 集群技术,每个集群的规模超过 16K H100 GPU,并且具有极低的延迟和云中最高带宽的 RDMA 网络。OCI、Fusion Applications 和每天使用这些应用程序的数千名客户的结合使 Oracle 能够不断改进其 AI 功能,以提供一流的 AI。
摘要 - 光纤通道正在作为一种航空电子通信架构应用于各种新型军用飞机和现有飞机的升级。光纤通道标准(参见 T11 网站 www.t11.org )定义了各种网络拓扑和多种数据协议。一些拓扑和协议(ASM、1553、RDMA)适用于航空电子应用,其中设备之间的数据移动必须以确定性的方式进行,并且需要非常可靠地传输。所有飞机飞行硬件都需要进行测试,以确保它能够在光纤通道网络中正确传递信息。机身制造商需要测试集成网络以验证所有飞行硬件是否通信正常。需要进行持续的维护测试,以确保所有通信都是确定性和可靠的。本文概述了光纤通道航空电子网络和用于航空电子的协议。本文还讨论了航空电子级测试的实际实施以及与这些应用相关的测试挑战。
Oracle Exadata 数据库云服务器旨在显著提高 Oracle 数据库的性能、成本效益和可用性。Exadata 采用现代云架构,具有横向扩展高性能数据库服务器、具有最先进 PCIe 闪存的横向扩展智能存储服务器、使用持久内存的前沿存储缓存,以及连接所有服务器和存储的云级 RDMA over Converged Ethernet (RoCE) 内部结构。Exadata 中的独特算法和协议在存储、计算和网络中实现数据库智能,以比其他平台更低的成本提供更高的性能和容量,适用于所有类型的现代数据库工作负载,包括在线事务处理 (OLTP)、数据仓库 (DW)、内存分析、物联网 (IoT)、财务、游戏和合规性数据管理,以及混合工作负载的高效整合。
系统,但始终在线的服务模型继续将其系统性能界限提高到一个新的水平。传统的基于SAS的全闪存存储无法破坏延迟0.5 ms的瓶颈。nvme All-Flash存储是一种未来的隔热架构,可实现CPU和SSD之间的直接通信,从而缩短了传输路径。此外,同意的数量增加了65,536次,并且协议相互作用从四次减少到两次,这使写作请求处理加倍。华为是整个系列中采用端到端NVME架构的先驱。OceanStor Dorado 5000/6000 All-Flash Systems使用行业领先的32 GB FC- NVME/100 GB ROCE协议在前端使用,并采用华为开发的Link-Layer协议来在几秒钟内实施故障转移,并在插件和插件内实施故障,从而提高了可靠性和O&&&&&M。它还在后端使用100 GB RDMA协议以进行E2E数据加速度。这使得延迟低至0.05 ms,比SAS All-Flash存储快10倍。
Sobi® 及其合作伙伴的新数据将于 2024 年 12 月 7 日至 10 日在美国加利福尼亚州圣地亚哥举行的第 66 届美国血液学会 (ASH) 年会上公布。会议期间,将公布关于血友病 A、噬血细胞性淋巴组织细胞增生症 (HLH)、骨髓纤维化、阵发性睡眠性血红蛋白尿 (PNH) 和免疫性血小板减少症 (ITP) 的几项分析。“血友病 A 对关节健康和生活质量有着持久的影响。在 ASH 2024 上,三场口头报告将揭示有关 ALTUVOCT® 预防长期结果的重要新数据,”Sobi 研发和医疗事务 (RDMA) 主管兼首席医疗官 Lydia Abad-Franch 医学博士、工商管理硕士说道。 “我们还将展示涵盖不同严重和致残性罕见疾病的新数据,包括关于 Doptelet® 在治疗 ITP 患者方面的真实效果的口头报告,展示我们致力于为罕见血液病患者提供创新治疗的更广泛承诺。我们期待在圣地亚哥分享这些发现。” 将在 ASH 2024 上展示的关键数据