模态交互关键词检索结果

评估多模态交互式代理

Evaluating Multimodal Interactive Agents

在本文中,我们评估了这些现有评估指标的优点,并提出了一种称为标准化测试套件 (STS) 的新型评估方法。STS 使用从真实人机交互数据中挖掘的行为场景。