FMEval关键词检索结果

使用 Amazon SageMaker 托管 MLflow 和 FMEval 跟踪 LLM 模型评估

Track LLM model evaluation using Amazon SageMaker managed MLflow and FMEval

在本文中,我们将展示如何使用 FMEval 和 Amazon SageMaker 以编程方式评估 LLM。FMEval 是一个开源 LLM 评估库,旨在为数据科学家和机器学习 (ML) 工程师提供代码优先体验,以评估 LLM 的各个方面,包括准确性、毒性、公平性、稳健性和效率。