获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
Evaluating Multimodal Interactive Agents
在本文中,我们评估了这些现有评估指标的优点,并提出了一种称为标准化测试套件 (STS) 的新型评估方法。STS 使用从真实人机交互数据中挖掘的行为场景。