近年来,人工智能模型的计算密度和规模都快速增长,这推动了高效可靠的专用网络基础设施的建设。本文介绍了 Meta 用于分布式人工智能训练的融合以太网远程直接内存访问 (RoCE) 网络的设计、实现和运行。我们的设计原则涉及对工作负载的深入了解,并将这些见解转化为各种网络组件的设计:网络拓扑 - 为了支持一代又一代人工智能硬件平台的快速发展,我们将基于 GPU 的训练分离到其自己的“后端”网络中。路由 - 训练工作负载本质上会导致负载不平衡和突发性,因此我们部署了几次路由方案迭代以实现近乎最佳的流量分配。传输 - 我们概述了我们最初尝试使用 DCQCN 进行拥塞管理,但后来放弃 DCQCN 转而利用集体库本身来管理拥塞。运营 - 我们分享运营大型人工智能网络的经验,包括我们开发的工具和故障排除示例。
由于工业应用需要新的拓扑结构来满足更快的周期时间、更高的吞吐量、更宽的带宽和更小的系统架构,因此引入了实时以太网协议(例如 Ethernet/IP、EtherCAT、Profinet 等)以最大限度地减少延迟。然而,上述协议在实时系统中都包含菊花链架构。因此,需要对注入系统的外部噪声具有更高的容忍度和免疫力,以防止系统中的信息丢失。再举一个例子,如果在菊花链网络的早期阶段出现任何信息失真或链接断开,菊花链网络中的所有剩余阶段也会受到影响。例如,如果伺服电机连接到菊花链网络的每个阶段,则早期阶段的任何信号丢失都可能阻止剩余的伺服电机运行,直到从早期的网络阶段接收到命令。因此,工业应用中的 EMC 已成为以太网的关键性能标准。
在展示了英特尔以太网 E810 网络适配器和 NVIDIA Mellanox ConnectX-5 适配器之间的性能对等后,该团队正在评估即将发布的英特尔以太网 E830 网络适配器,该适配器提供高达 200 千兆位每秒 (Gbps) 的最大数据速率、PCIe 5.0x8 主机互连支持、精确的计时功能以及全面的安全性和可管理性功能。网络适配器可以支持更高的带宽工作负载要求。该团队还在考虑英特尔® 基础设施处理单元 (IPU) 适配器。英特尔 IPU 适配器能够执行各种与基础设施相关的任务,包括隔离租户和提供商网络和存储 (NVME) 卸载、安全性、存储和虚拟化以及网络。
在许多电磁兼容性(EMC)标准中描述了各种干扰环境,并且可能是在给定情况下可能会遇到的危害的有用资源。在产生,运输,消耗或(尤其是)切换的大量电力的环境中,可以在10 MHz以下产生大量噪声。可能发生这种情况的设置示例包括制造线,机械车间,空中,海上,道路和铁路车辆,发电,变电站和开关房间,仅举几例。用于自动化控制的SPE可能会在10 MHz以下遇到大量噪声。预期会遇到的干扰水平和频谱的细节自然取决于要部署系统的环境细节。但是,在EMC测试标准和建议中,耦合干扰与信号线的来源和机制的性质一次又一次地显示为常见主题。这些包括:
静态 IP 路由、浮动静态路由、多网、代理 ARP、动态 IP 路由(OSPFv2、RIPv1/v2)、VRRPv2/v3、协议独立组播 - 稀疏模式(PIM-SM)、静态组播路由、状态检测防火墙、防火墙命中计数器、IP 伪装(NAT/NAPT)、端口转发、无状态 NAT(1-1 NAT)、IPsec VPN(IKEv2 PSK)、SSL VPN(客户端和服务器、证书身份验证、预共享密钥 (PSK) 点对点模式、第 2 层和第 3 层 VPN、第 2 层 VPN 桥接、每个 CN 的地址池和地址、TLS 身份验证)、通用路由封装(GRE)、基于策略的路由、等价多路径 (ECMP)、OpenVPN 多路径 TCP (MPTCP)、路由监控器
工业机器人技术近年来经历了显着的演变,这是由于半导体技术的进步以及对更智能,更安全和更有效系统的需求不断增长的。这种转换的核心是使用高级嵌入式处理器,该处理器使用芯片上的系统架构(SOC)体系结构,该架构集成了包括外围设备和硬件加速器在内的各种组件。这些处理器在增强工业机器人的能力方面起着至关重要的作用,使他们能够以精确,速度和可靠性执行任务。在本文中,我们将深入研究高度集成的嵌入式处理器在推进工业机器人技术中的作用。
在模块内部,每对差分电信号都输入到 CDR(时钟数据恢复)芯片。然后,恢复和重新定时的信号被传送到激光驱动器,该驱动器将小的摆动电压转换为驱动冷却 EML 激光器的输出调制。激光驱动器分别控制四个 EML,其中心波长为 1296 nm、1300 nm、1305 nm 和 1309 nm。每个激光器都提供对传输激光功率和调制摆动随温度和电压变化的控制。来自四个激光器的光信号以光学方式多路复用在一起。组合的光信号通过行业标准 LC 光连接器耦合到单模光纤。光信号经过设计,符合 100 千兆以太网或 OTU4 规范。
在模块内部,每对差分电信号都输入到 CDR(时钟数据恢复)芯片。然后将恢复和重新定时的信号传递到激光驱动器,该驱动器将小的摆动电压转换为驱动冷却 EML 激光器的输出调制。激光驱动器分别控制四个 EML,其中心波长分别为 1296 nm、1300 nm、1305 nm 和 1309 nm。每个激光器都提供对传输激光功率和调制摆动随温度和电压变化的控制。来自四个激光器的光信号在光学上被多路复用在一起。组合的光信号通过行业标准 LC 光连接器耦合到单模光纤。光信号经过设计以满足 100 千兆以太网或 OTU4 规范。
Advanced Optics Cisco提供可插入的40 GBIT以太网QSFP+收发器,使客户能够使用现有的10 Gigabit以太网数据中心电缆来支持40千兆以太网连接。这项技术有助于采用40千兆以太网,而没有电缆基础设施升级成本。
ET-7219Z 10 通道 AI、5 通道 DO DAQ 模块 - 快速入门(2019 年 4 月)ICP DAS USA, Inc. | www.icpdas-usa.com | 1-310-517-9888 | 24309 纳博讷大道200 套房。洛米塔,加利福尼亚州 90717