lmarena推出了新的Beta,用于AI战斗和用户投票

lmarena启动了其平台的新版本,新的网站beta.lmarena.ai允许用户比较不同的语言模型(LLM),并根据自己的提示来对哪些语言模型(LLM)进行投票。与其他专注于技术测量值的AI评估工具不同,LMARENA通过允许普通用户评估AI答案[…] LMARENA启动新的Beta进行AI战斗和用户投票首次出现在AI新闻上。

来源:AI新闻
lmarena启动了其平台的新版本,新的网站beta.lmarena.ai允许用户比较不同的语言模型(LLM),并根据自己的提示来对哪些语言模型(LLM)进行投票。与其他专注于技术测量值的AI评估工具不同,LMARENA通过允许普通用户根据主观标准(例如可用性,相关性和质量)评估AI响应来走不同的道路。新平台允许用户以两种不同的方式测试和比较AI模型:战斗用户可以同时比较两个匿名模型。这会产生“盲测”情况,在这种情况下,用户可以在不知道生成哪种模型的情况下评估答案。在这种情况下,用户可以直接将自己选择的两种模型进行比较,您可以清楚地看到哪种模型会生成什么答案。还有一个“直接聊天”选项,用户可以一次与单个模型聊天以探索其容量。超过。这种集体反馈用于改善AI模型,并帮助开发人员更好地了解用户如何与语言模型能力的不同方面进行交互和重视。该平台通过使用户能够确认或质疑有关LLM在实时方案中的有效性的主张,从而为实证研究和开发提供了机会:
beta.lmarena.ai 战斗 并排

更多信息: