FMEval领域信息情报检索---XiaoMi-AI

2025年1月28日 17:31

使用 Amazon SageMaker 托管 MLflow 和 FMEval 跟踪 LLM 模型评估

在本文中，我们将展示如何使用 FMEval 和 Amazon SageMaker 以编程方式评估 LLM。FMEval 是一个开源 LLM 评估库，旨在为数据科学家和机器学习 (ML) 工程师提供代码优先体验，以评估 LLM 的各个方面，包括准确性、毒性、公平性、稳健性和效率。