AI阅读模拟时钟的努力可能具有更深的意义

来自中国和西班牙研究人员的一份新论文发现,即使是高级多模式模型,例如GPT-4.1,也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小,可能会导致重大的解释错误,而微调仅有助于熟悉的示例。结果引起了人们对[…] AI努力阅读模拟时钟的可靠性的关注,这首先在Unite.AI上出现了更深的意义。

来源:Unite.AI

来自中国和西班牙研究人员的一份新论文发现,即使是高级多模式模型,例如GPT-4.1,也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小,可能会导致重大的解释错误,而微调仅有助于熟悉的示例。当面对现实世界任务中不熟悉的图像时,结果引起了人们对这些模型的可靠性的担忧。

当人类对重力或其他基本物理原理等领域有足够深的了解时,我们将超越特定的例子来掌握潜在的抽象。这使我们能够通过识别行动中的原则来创造性地应用这些知识,并识别新实例,甚至是我们从未见过的那些实例。

当一个域具有足够的重要性时,我们甚至可以开始对其不存在的地方感知它,就像pareidolia一样,这是由于未能识别真实实例的高成本而驱动。这种模式认可的生存机制是如此强大,以至于我们甚至可以在没有的情况下找到更广泛的模式。

它不存在 pareidolia 找到更广泛的模式

较早的和越来越重复的领域被灌输给我们,它的基础和终生的持久性越深;当孩子以教学方式的形式出现的最早的视觉数据集之一,印刷的材料或交互式模拟时钟用于教我们如何分辨时间:

更深层次

教学辅助帮助孩子学习时间。资料来源:https://www.youtube.com/watch?v=ibbqxbhsnus

教学辅助帮助孩子学习时间。

尽管在手表设计中改变时尚有时可能会挑战我们,但这种早期领域掌握的弹性令人印象深刻,即使面对复杂或“怪异”设计选择,我们也可以辨别模拟时钟面孔:

改变手表设计中的时尚 手表中的一些具有挑战性的面孔 不需要数千个示例

超越模仿游戏?