CLALIFAI 11.8：GPT-OSS-1220B：基准测试速度，规模和成本效率 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

CLALIFAI 11.8：GPT-OSS-1220B：基准测试速度，规模和成本效率

2025年9月11日 13:34 33 Comments

人工分析验证了Clarifai的性能运行GPT-Oss-1220b，具有强大的基准。

来源:Clarifai博客 | 实际应用中的人工智能

本博客文章重点介绍了新功能和改进。有关综合列表，包括错误修复程序，请参阅发行说明。

人工分析通过GPT-Oss-1220b型号（当今可用的最先进的开源大型语言模型之一）对Clarifai的计算编排进行了基准测试。结果强调了Clarifai是AI工作负载的顶级硬件和GPU-AGNOSTIC发动机之一，其中速度，灵活性，效率和可靠性最重要。

人工分析计算编排 gpt-oss-1220b

基准显示的内容（P50，最后72H;单个查询，1K token提示）：

高吞吐量：每秒313个输出令牌 - 在此配置中测得的最快的延迟。低延迟：0.27s的第一次to st the（ttft），因此响应几乎立即开始流式传输。

高吞吐量：每秒313个输出令牌 - 在此配置中最快的最快。

高吞吐量

低潜伏期：0.27S的时间率（TTFT），因此响应几乎立即开始流式传输。

低延迟

引人注目的价格/性能：放置在基准的“最具吸引力的象限”（高速 +低价）中。

引人注目的价格/绩效 “最吸引人的象限”

Clarifai提供的GPT-Oss-1220b为每100万美元输入令牌，每100万美元输出令牌$ 0.36。人工分析显示的混合价格（3：1输入：输出）为每100万代币0.16美元，在匹配或超过其性能的同时，Clarifai大大低于$ 0.26- $ 0.28的竞争对手。

每1M $ 0.09输入令牌 每1m $ 0.36输出令牌 每1M代币$ 0.16

输出速度与价格

潜伏期与输出速度

计算管弦乐表演

在这里 - 模型名称

延迟可靠性价格基准的吞吐量为什么人工 1220b 先进的象限工作负载模型速度输入代币定价令牌灵活性流式 100 输出吸引力 Clarifai 分析潜伏期基准可用的 GPT 负载的发动机