详细内容或原文请订阅后点击阅览

MI300X 与 B200：AMD 与 NVIDIA 下一代 GPU 性能和成本分析

2025年12月16日 09:23 33 Comments

AMD MI300X 和 NVIDIA B200 GPU 的深入技术比较。探索基准、内存、成本效率、AI 工作负载和实际部署见解。

来源:Clarifai博客 | 实际应用中的人工智能

MI300X 与 B200 — 下一代 GPU 之战

简介 — GPU 军备竞赛

生成式 AI 应用在 2023 年末和 2024 年爆发，推动了对 GPU 的创纪录需求，并暴露了内存丰富的加速器和面向延迟的芯片之间的分歧。到 2025 年底，两个竞争对手将主导数据中心领域：AMD 的 Instinct MI300X 和 NVIDIA 的 Blackwell B200。每个都代表了不同的理念：内存容量和价值与原始计算和生态系统成熟度。与此同时，AMD 宣布了 MI355X 和 MI325X 路线图条目，承诺更大的 HBM3E 堆栈和新的低精度数学模式。本文综合了研究、独立基准测试和行业评论，帮助您选择最佳 GPU，特别关注 Clarifai 的多云推理和编排平台。

快速摘要 – 您将学到什么

部分

人工智能友好要点

架构

MI300X采用基于chiplet的CDNA 3设计，具有192 GB HBM3和5.3 TB/s带宽； B200 的双芯片 Blackwell 封装 180–192 GB HBM3E 和 8 TB/s 带宽。即将推出的 MI355X 将内存提升至 288 GB，支持高达 20 PFLOPS 的 FP6/FP4 模式，并提供 79 TFLOPS FP64 吞吐量。

性能

基准测试显示 MI300X 每个 GPU 达到 18,752 个令牌/秒，约为 H200 吞吐量的 74%，并且由于软件开销而导致更高的延迟。对于 Llama-2 70B FP8 微调，MI355X 训练的运行速度比 MI300X 快 2.8 倍。独立 InferenceMAX 结果报告，MI355X 在每代币成本和每兆瓦代币成本方面与 B200 匹配或优于 B200。

经济学

B200 的售价为 35-40,000 美元，每张卡的功耗约为 1 kW； MI300X 的成本为 10-15,000 美元，功耗为 750 W。由于卡价格和功耗较低，B200 的八 GPU 训练盒成本约为 900 万美元，而 MI300X 的成本为 300 万美元。 MI355X 消耗约 1.4 kW，但每瓦提供的令牌比 MI300X 多 30%。

软件

用例

专家见解：

架构深入探究 – CDNA 3/4 与 Blackwell

架构有何不同？

规格比较表（仅数字）

GPU

HBM 内存

带宽

功耗

值得注意的精度模式

MI300X

芯片军备竞赛吞吐量经济学低精度延迟的 B200 功耗创纪录人工智能不同的 Blackwell 独立带宽路线图特别关注 GPU 丰富的测试 MI300X 训练的速度比成本模式内存 GB 见解加速器运行速度基准 MI355X 架构生态系统下一代