详细内容或原文请订阅后点击阅览
无需更多训练数据即可让 AI 变得更智能
UCR 研究人员开发了一种称为“测试时间匹配”的方法,这种方法可以显着改善人工智能系统解释文本和图像之间关系的方式,尤其是在呈现不熟悉的组合时。
来源:加州大学河滨分校加州大学河滨分校研究人员领导的一项研究为人工智能最严峻的挑战之一提供了切实可行的解决方案,使人工智能系统能够更像人类一样进行推理,而无需测试问题之外的新训练数据。
在题为“测试时间匹配:解锁多模态模型中的组合推理”的预印本论文中,助理教授朱英伦和学生介绍了一种称为测试时间匹配(TTM)的新颖方法。该方法显着改善了人工智能系统解释文本和图像之间关系的方式,尤其是在呈现不熟悉的组合时。
“组合推理是按照人类的方式进行概括,并根据已知部分理解新的组合,”该研究的领导者、伯恩斯工程学院电气与计算机工程系的朱教授说。 “这对于开发能够理解世界而不仅仅是记住模式的人工智能至关重要。”
当今领先的人工智能模型在许多任务上表现良好,但当被要求在构图压力下将视觉场景与语言保持一致时,例如当熟悉的物体和关系被重新排列和以新的方式描述时,它们可能会表现不佳。
研究人员使用专门的测试来评估人工智能模型是否可以像人类一样整合概念。然而,模型的表现通常并不比机会更好,这表明他们在把握文字和图像之间的微妙关系方面遇到了困难。
朱的团队发现现有的评估可能会不公平地惩罚模型。
Zhu 说,广泛使用的评估指标现在依赖于孤立的成对比较,施加额外的约束,可能会模糊图像和标题之间的最佳整体匹配。
为了解决这个问题,团队创建了一个新的评估指标,用于识别一组图像标题对的最佳整体匹配。该指标提高了分数并揭示了以前未见过的模型功能。
“有时,问题不在于模型。而在于我们如何使用它,”他说。
