Loading...
机构名称:
¥ 4.0

来源Intel测量的结果与H100数据源:https://github.com/nvidia/tensorrt-llm/blob/ain/ain/main/main/aind/courds/cource/perferct/perf-overview.md Input-uptup-output序列:128-2048tps on 2 Accelerators/gpus/gpus。Intel结果在2024年11月9日获得。硬件:两个Intel Gaudi 3 AI加速器(128 GB HBM)与两个NVIDIA H100 GPU(80 GB HBM); 。软件:Intel Gaudi软件版本1.18.0。有关H100软件详细信息,请参见NVIDIA链接。结果可能会有所不同。基于公开信息的定价估算和英特尔内部分析

以效率,可伸缩性,性能为Gen AI带来选择

以效率,可伸缩性,性能为Gen AI带来选择PDF文件第1页

以效率,可伸缩性,性能为Gen AI带来选择PDF文件第2页

以效率,可伸缩性,性能为Gen AI带来选择PDF文件第3页

以效率,可伸缩性,性能为Gen AI带来选择PDF文件第4页

以效率,可伸缩性,性能为Gen AI带来选择PDF文件第5页