呼吁在过去几年中参与参与,我们看到了多模式和大语言模型的推理能力的显着改善。在这个Smart-101 CVPR 2024挑战中,我们试图通过解决需要基本数学和算法技能的视觉语言难题来理解大型模型的这些能力;这些技能甚至年幼的孩子似乎都拥有,并且可以毫无困难地解决难题。对多模式LLM的这种能力的彻底经验分析是我们CVPR 2023纸的基本前提,标题为“深度神经网络相比,更深层的神经网络比二年级学生都聪明?本文介绍了简单的多模式算法推理任务(SMART)和SMART-101数据集。基于论文的努力,这种Smart-101 CVPR-2024挑战是将研究兴趣带入这个重要主题的尝试,以了解我们在竞赛中的立场,以实现真正的人工通用情报(AGI)。具体来说,这项竞赛的目标是三倍,要理解:(i)最先进的多模式LLMS摘要数据,关注关键细节并概括他们的知识以解决新问题?(ii)他们在获取新技能方面有多流动?和(iii)它们在使用语言的视觉推理方面有多有效?通过这项挑战的参与者提交的最新AI模型,我们希望学习并了解我们在实际AGI能力上的立场,更重要的是,清楚地回答了当前的AI至少比数学/algorithmic能力的二年级学生更好。智能挑战涉及解决专为6-8岁年龄段儿童设计的视觉语言难题。这些难题取自数学袋鼠奥林匹克(Olympiad) - 一种流行的国际儿童奥林匹克运动会,使用多项选择答案选择形式。大多数难题都有图像和文本问题,还有五个答案选项,其中一个选项是拼图的正确答案。将根据私人测试集对挑战的参与者提交。每个难题的解决方案需要各种基本的数学和算法推理技能,涉及
主要关键词