HumanEval关键词检索结果

SenseNova 5.5 – 中国首个实时法学硕士课程击败 GPT-4o

SenseNova 5.5 – China’s first real-time LLM beats GPT-4o

中国 AI 开发商 SenseTime 发布了其升级版多模态 SenseNova 5.5 模型,并声称它代表了最先进的技术。升级后的模型是在 SenseNova 5 发布几个月后推出的,SenseTime 表示 SenseNova 5 与 GPT-4 Turbo 不相上下。据报道,升级后的 600B 参数 SenseNova 5.5 整体性能提高了 30%。该公司发布的基准测试分数显示,其模型击败了 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 模型。SenseNova 5.5 擅长的基准测试是中国模型通常使用的基准测试。如果他们使用 GPQA、Humaneva