1. DDR5 架构包括效率改进,即使在相同的理论速度 3200MT/s 下,由于 DDR5 技术具有高总线效率,系统带宽也比 DDR4 多 36%。结合每个模块的较低电压,此设计可提供卓越(更好)的性能。2. 在内存密集型工作负载下,由于突发长度增加一倍,存储体和存储体组增加一倍,并且速度明显高于 DDR4,DDR5 可提供 1.87 倍的带宽。它不仅在测试期间,而且在实际条件下,都支持以更高的通道效率扩展内存性能,即使在更高的速度下也是如此,这由为微电子行业制定开放标准的独立标准化机构 JEDEC 确定。3. 计算机必须具有支持 DDR5 的 CPU 和主板。Crucial DDR5 台式机内存与 DDR4 主板不兼容。 4. DDR5 的发布速度为 4800MT/s,可与极限性能 DDR4 内存速度相媲美,比标准 DDR4 的最大速度 3200MT/s 快 1.5 倍(50%)。DDR5 的发布速度为 4800MT/s,可提供标准 DDR4 的最大速度 3200MT/s 的 1.87 倍带宽。5. DDR5 的发布数据速率为 4800MT/s,传输的数据量比标准 DDR4 的最大数据速率 3200MT/s 多 1.5 倍(50%)。6. 发布时的密度和计划中的密度由 JEDEC 针对 DDR5 一代内存的使用寿命进行定义。7. DDR5 模块 (DIMM) 通过电源管理集成电路 (PMIC) 在模块上引入电压调节,从而实现更好的电源调节并减少主板上 DRAM 电源输送网络 (PDN) 管理的范围,从而提高效率。 8. Crucial DDR5 台式机内存是非 ECC 内存。ECC 适用于 RDIMM、LRDIMM、ECC UDIMM 和 ECC SODIMM,它是一种需要模块级额外 DRAM 的功能,以便服务器和工作站等平台可以纠正单个模块 (DIMM) 上的错误。但是,片上 ECC (ODECC) 是 DDR5 组件规范的一项功能,不应与模块级 ECC 功能混淆。Crucial DDR5 台式机内存采用包含 ODECC 的 DDR5 组件构建,但这些模块不包含系统级 ECC 所需的额外组件。9. 有限终身保修在除德国和法国以外的所有地区有效,在这两个国家,保修有效期为自购买之日起十年。
12 Habana Gaudi2 深度学习加速器:所有测量均使用 Habana SynapseAI 版本 1.10 和 optimum-habana 版本 1.6 在 HLS2 Gaudi2 服务器上进行,该服务器具有八个 Habana Gaudi2 HL-225H 夹层卡和两个 Intel Xeon Platinum 8380 CPU @ 2.30GHz 和 1TB 系统内存。性能测量于 2023 年 7 月进行。第四代英特尔至强 8480:英特尔第四代至强铂金 8480+ 2 插槽系统,112 核/224 线程,Turbo Boost 开启,超线程开启,内存:16x32GB DDR5 4800MT/s,存储:953.9GB);操作系统:CentOS Stream 8;内核:5.15.0-spr.bkc.pc.16.4.24.x86_64;批次大小:1;在 1 个插槽上测量:1;PyTorch 每日构建 0711;英特尔® PyTorch 扩展标签 v2.1.0.dev+cpu.llm;模型:Llama 2 7B 和 Llama 2 13B;数据集 LAMBADA;令牌长度:32/128/1024/2016(输入)、32(输出);波束宽度 4;精度:BF16 和 INT8;英特尔于 2023 年 7 月 12 日进行测试。英特尔至强 Max 9480:英特尔至强 Max 9480 2 插槽系统,112 核/224 线程,Turbo Boost 开启,超线程开启,内存:16x64GB DDR5 4800MT/s;8x16GB HBM2 3200 MT/s,存储:1.8TB;操作系统:CentOS Stream 8;内核:5.19.0-0812.intel_next.1.x86_64+server;批次大小:1;在 1 个插槽上测量;PyTorch nightly build0711;英特尔® PyTorch 扩展 llm_feature_branch;模型:Llama 2 7B 和 Llama 2 13B,数据集 LAMBADA;令牌长度:32/128/1024/2016(输入)、32(输出);波束宽度 4;精度:BF16 和 INT8;英特尔于 2023 年 7 月 12 日进行测试。英特尔数据中心 GPU Max 系列:1 个节点、2 个英特尔至强铂金 8480+、56 个内核、超线程开启、睿频开启、NUMA 2、总内存 1024GB(16x64GB DDR5 4800 MT/s [4800 MT/s])、BIOS SE5C7411.86B.9525.D19.2303151347、微码 0x2b0001b0、1 个以太网控制器 X710(用于 10GBASE-T)、1 个 1.8T WDC WDS200T2B0B、1 个 931.5G 英特尔 SSDPELKX010T8、Ubuntu 22.04.2 LTS、5.15.0-76-generic、4 个英特尔数据中心 GPU Max 1550(仅使用单个 OAM 的单个 Tile 进行测量) GPU 卡)、IFWI PVC 2_1.23166、agama 驱动程序:agama-ci-devel-627.7、英特尔 oneAPI 基础工具包 2023.1、PyTorch 2.0.1 + 英特尔 PyTorch 扩展 v2.0.110+xpu(dev/LLM 分支)、AMC 固件版本:6.5.0.0、型号:Meta AI Llama 2 7B 和 Llama 2 13B、数据集 LAMBADA;令牌长度:32/128/1024/2016(输入)、32(输出);贪婪搜索;精度 FP16;由英特尔于 2023 年 7 月 7 日测试。
Supermicro B13DET 支持双第四代英特尔® 至强® 可扩展处理器(插槽 E1 LGA 4677-1),具有三个 UPI(最高 16GT/s)和高达 350W 的 TDP(热设计功率)。B13DET 采用英特尔 C741 芯片组构建,支持 4TB(最高)3DS RDIMM/RDIMM DDR5 ECC 内存,在 16 个 DIMM 插槽中速度高达 4800MT/s(下面的注释 1)。这款主板具有出色的 I/O 可扩展性和灵活性,包括两个支持 SATA 6G/NVMe 的 HDD 连接器、一个支持 PCIe 5.0 的 M.2 连接器、两个支持子转接卡的夹层插槽、一个支持 25GbE 以太网 LAN 的中板,以及来自 PCH 的用于支持 SATA 6.0 的额外 SATA 连接器。它还提供最先进的数据保护,支持硬件 RoT(信任根)和 TPM(可信平台模块)(见下文注释 2)。B13DET 针对 4U/8U SuperBlade 系统进行了优化,具有高密度和高速输入/输出能力。它是高性能计算 (HPC)、云计算、财务建模、企业应用程序、具有数据密度应用程序的科学和工程计算的理想选择。请注意,此主板仅供专业技术人员安装和维修。有关处理器/内存更新,请参阅我们的网站 http://www.supermicro.com/products/。
Supermicro B13DET 支持双第四代 Intel® Xeon® 可扩展处理器(插槽 E1 LGA 4677-1),具有三个 UPI(最高 16GT/s)和高达 350W 的 TDP(热设计功率)。B13DET 采用 Intel C741 芯片组构建,支持 4TB(最高)3DS RDIMM/RDIMM DDR5 ECC 内存,在 16 个 DIMM 插槽中速度高达 4800MT/s(见下文注释 1)。该主板具有出色的 I/O 可扩展性和灵活性,包括两个支持 SATA 6G/NVMe 的 HDD 连接器、一个支持 PCIe 5.0 的 M.2 连接器、两个支持子转接卡的夹层插槽、一个支持 25GbE 以太网 LAN 的中板,以及一个来自 PCH 的用于支持 SATA 6.0 的附加 SATA 连接器。它还提供最先进的数据保护,支持硬件 RoT(信任根)和 TPM(可信平台模块)(下面的注释 2)。B13DET 针对具有高密度和高速输入/输出能力的 4U/8U SuperBlade 系统进行了优化。它是高性能计算 (HPC)、云计算、财务建模、企业应用程序、具有数据密度应用程序的科学和工程计算的理想选择。请注意,此主板仅供专业技术人员安装和维修。有关处理器/内存更新,请参阅我们的网站 http://www.supermicro.com/products/。
