深度学习的最新进展主要基于“大数据用于小任务”范式,在该范式下,大量数据用于训练单个狭窄任务的分类器。在本文中,我们呼吁进行一次彻底颠覆这一范式的转变。具体而言,我们提出了“小数据用于大任务”范式,其中单个人工智能 (AI) 系统面临发展“常识”的挑战,使其能够用很少的训练数据解决各种任务。我们通过回顾综合了机器和人类视觉方面的最新突破的常识模型来说明这一新范式的潜在力量。我们将功能性、物理性、意图、因果关系和效用 (FPICU) 确定为具有类似人类常识的认知 AI 的五个核心领域。当将 FPICU 视为一个统一的概念时,它关注的是“为什么”和“如何”的问题,超越了理解视觉的主流“什么”和“哪里”框架。它们在像素方面是不可见的,但却推动了视觉场景的创建、维护和发展。因此,我们将它们称为视觉的“暗物质”。正如我们的宇宙不能仅通过研究可观测物质来理解一样,我们认为,如果不研究 FPICU,就无法理解视觉。我们展示了如何观察和应用 FPICU 来解决各种具有挑战性的任务,包括工具使用、规划、效用推理和社会学习,从而展示了这种观点在开发具有人类常识的认知 AI 系统方面的强大作用。总之,我们认为下一代 AI 必须采用“暗”的人类常识来解决新任务。