The Next Chapter: Clarifai Compute Orchestration and Reasoning Engine Joins Nebius
对 Gemma-3-4B、MiniCPM-o 2.6 和 Qwen2.5-VL-7B-Instruct 的延迟、吞吐量和可扩展性进行基准测试。
NVIDIA Nemotron 3 Nano Omni on Clarifai Reasoning Engine: Zero Day Support at 400 Tokens Per Second
对 Gemma-3-4B、MiniCPM-o 2.6 和 Qwen2.5-VL-7B-Instruct 的延迟、吞吐量和可扩展性进行基准测试。
Accelerate Generative AI Inference on Amazon SageMaker AI with G7e Instances
今天,我们很高兴地宣布在 Amazon SageMaker AI 上推出由 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 提供支持的 G7e 实例。您可以为节点配置 1、2、4 和 8 个 RTX PRO 6000 GPU 实例,每个 GPU 提供 96 GB GDDR7 内存。此次发布提供了使用单节点 GPU、G7e.2xlarge 实例来托管强大的开源基础模型 (FM)(例如 GPT-OSS-120B、Nemotron-3-Super-120B-A12B(NVFP4 变体)和 Qwen3.5-35B-A3B)的功能,为组织提供了经济高效且高性能的选择。