人类对世界的看法是由多种观点和方式塑造的。许多现有数据集从某个角度专注于场景理解(例如以中心的或第三人称的视图),我们的数据集提供了一个全景视角(即具有多种数据模式的多个观点)。具体而言,我们封装了第三人称全景和前视图,以及以富裕方式,包括视频,多频道音频,定向双耳延迟,位置数据数据和文本场景描述,在每个场景中,呈现世界的全面实现,呈现了全世界的全面实现。据我们所知,这是第一个涵盖具有多种数据模式的多个观点的数据库,以模仿现实世界中如何访问每日信息。 通过我们的基准分析,我们在建议的360+x数据集上介绍了5个不同的场景理解任务,以评估综合场景理解中每种数据模式和观点的影响和好处。 我们希望这个独特的数据集能够扩大理解场景的范围,并鼓励社区从更多样化的角度解决这些问题。据我们所知,这是第一个涵盖具有多种数据模式的多个观点的数据库,以模仿现实世界中如何访问每日信息。通过我们的基准分析,我们在建议的360+x数据集上介绍了5个不同的场景理解任务,以评估综合场景理解中每种数据模式和观点的影响和好处。我们希望这个独特的数据集能够扩大理解场景的范围,并鼓励社区从更多样化的角度解决这些问题。