点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
1.人工分析质量指数:一系列语言模型智能和推理评估数据集的平均值。目前包括 MMLU、GPQA Diamond、MATH-500 和 HumanEval。根据实验室声称的某些非当前模型的评估结果进行估算。发布日期基于模型的首次公开发布。2.人工分析质量指数是根据实验室声称的某些模型(非当前或 API 尚不可用)的评估结果进行估算的。
主要关键词