详细内容或原文请订阅后点击阅览
新平台有助于评估复杂计算机使用的AI
由Xlang Lab开发的计算机代理Arena是一个开放评估平台,比较基于LLM/VLM的AI代理商的基于计算机的数据。一个国际研究团队开发了计算机代理竞技场,这是一个基于AI的计算机代理的评估平台。该平台可实现可以在多个应用程序上执行复杂的计算机任务的AI系统的测试和开发。这代表了[…]新平台迈出的重要一步,有助于评估AI的复杂计算机使用,首先出现在AI新闻中。
来源:AI新闻视频
- 计算机代理Arena是第一个用于计算机使用的交互式评估平台,该平台侧重于多个应用程序。 Excel。 。
由Xlang Lab开发的计算机代理Arena是一个开放评估平台,比较基于LLM/VLM的AI代理商的基于计算机的数据。
计算机代理竞技场什么是计算机代理竞技场?
计算机代理Arena是由滑铁卢大学,香港大学,Salesforce Research和Carnegie Mellon University的研究人员开发的平台。这种创新的系统是一种广泛的测试环境,在执行复杂的计算机任务时,可以评估和改进AI代理。
artha.xlang.ai