统计模型关键词检索结果

新报告:利用统计模型扩展人工智能评估工具箱

New Report: Expanding the AI Evaluation Toolbox with Statistical Models

NIST AI 800-3 认为,LLM 评估的统计有效性得益于评估者明确采用模型来分析评估结果并披露相关假设。广义线性混合建模是一种有前途的方法,可以为更有原则的人工智能评估统计奠定基础。未来的 CAISI 和 NIST 出版物将进一步探讨统计模型在人工智能评估中的应用。

一流学位比例连续第三年下降,但近 40% 的顶级成绩无法用统计模型解释

Proportion of first class degrees falls for third consecutive year, but nearly 40 per cent of top grades cannot be explained by statistical modelling