VSI关键词检索结果

从事物所在到用途:多模式法学硕士的空间功能智能基准测试

From Where Things Are to What They’re For: Benchmarking Spatial–Functional Intelligence for Multimodal LLMs

多模式代理的真正空间智能超越了低级几何感知,从了解事物的位置发展到理解它们的用途。虽然 VSI-Bench 等现有基准可以有效评估这一基础几何阶段,但它们未能探索基础智能所必需的高阶认知能力。为了弥补这一差距,我们引入了空间功能智能基准 (SFI-Bench),这是一个基于视频的基准,包含来自多样化、以自我为中心的室内视频扫描的 1700 多个问题。 SFI-Bench 旨在...