CLALIFAI 11.8:GPT-OSS-1220B:基准测试速度,规模和成本效率

人工分析验证了Clarifai的性能运行GPT-Oss-1220b,具有强大的基准。

来源:Clarifai博客 | 实际应用中的人工智能

本博客文章重点介绍了新功能和改进。有关综合列表,包括错误修复程序,请参阅发行说明。

本博客文章重点介绍了新功能和改进。有关综合列表,包括错误修复程序,请参阅 发行说明。

GPT-OSS-1220b:基准测试速度,规模和成本效率

人工分析通过GPT-Oss-1220b型号(当今可用的最先进的开源大型语言模型之一)对Clarifai的计算编排进行了基准测试。结果强调了Clarifai是AI工作负载的顶级硬件和GPU-AGNOSTIC发动机之一,其中速度,灵活性,效率和可靠性最重要。

人工分析 计算编排 gpt-oss-1220b

基准显示的内容(P50,最后72H;单个查询,1K token提示):

    高吞吐量:每秒313个输出令牌 - 在此配置中测得的最快的延迟。低延迟:0.27s的第一次to st the(ttft),因此响应几乎立即开始流式传输。
  • 高吞吐量:每秒313个输出令牌 - 在此配置中最快的最快。
  • 高吞吐量
  • 低潜伏期:0.27S的时间率(TTFT),因此响应几乎立即开始流式传输。
  • 低延迟
  • 引人注目的价格/性能:放置在基准的“最具吸引力的象限”(高速 +低价)中。
  • 引人注目的价格/绩效 “最吸引人的象限”

    定价的定价:

    Clarifai提供的GPT-Oss-1220b为每100万美元输入令牌,每100万美元输出令牌$ 0.36。人工分析显示的混合价格(3:1输入:输出)为每100万代币0.16美元,在匹配或超过其性能的同时,Clarifai大大低于$ 0.26- $ 0.28的竞争对手。

    每1M $ 0.09输入令牌 每1m $ 0.36输出令牌 每1M代币$ 0.16

    输出速度与价格

    潜伏期与输出速度

    为什么gpt-oss-1220b重要

    计算管弦乐表演

    为什么此基准很重要

    在这里 - 模型名称