详细内容或原文请订阅后点击阅览
基准为亚马逊Nova:通过MT Bench和Arena-Hard-Auto
MT Bench和Arena-Hard的存储库最初是使用OpenAI的GPT API开发的,主要采用GPT-4作为法官。我们的团队通过将其与Amazon Bedrock API集成来扩大其功能,以便使用Anthropic的Claude Sonnet在Amazon上担任法官。在这篇文章中,我们使用MT-Bench和Arena-Hard同时将Amazon Nova模型与通过Amazon Bedrock提供的其他领先的LLM进行比较。
来源:亚马逊云科技 _机器学习