来源Intel测量的结果与H100数据源:https://github.com/nvidia/tensorrt-llm/blob/ain/ain/main/main/aind/courds/cource/perferct/perf-overview.md Input-uptup-output序列:128-2048tps on 2 Accelerators/gpus/gpus。Intel结果在2024年11月9日获得。硬件:两个Intel Gaudi 3 AI加速器(128 GB HBM)与两个NVIDIA H100 GPU(80 GB HBM); 。软件:Intel Gaudi软件版本1.18.0。有关H100软件详细信息,请参见NVIDIA链接。结果可能会有所不同。基于公开信息的定价估算和英特尔内部分析
主要关键词