获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
New Report: Expanding the AI Evaluation Toolbox with Statistical Models
NIST AI 800-3 认为,LLM 评估的统计有效性得益于评估者明确采用模型来分析评估结果并披露相关假设。广义线性混合建模是一种有前途的方法,可以为更有原则的人工智能评估统计奠定基础。未来的 CAISI 和 NIST 出版物将进一步探讨统计模型在人工智能评估中的应用。
Proportion of first class degrees falls for third consecutive year, but nearly 40 per cent of top grades cannot be explained by statistical modelling