AI阅读模拟时钟的努力可能具有更深的意义 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

AI阅读模拟时钟的努力可能具有更深的意义

2025年5月19日 13:26 33 Comments

来自中国和西班牙研究人员的一份新论文发现，即使是高级多模式模型，例如GPT-4.1，也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小，可能会导致重大的解释错误，而微调仅有助于熟悉的示例。结果引起了人们对[…] AI努力阅读模拟时钟的可靠性的关注，这首先在Unite.AI上出现了更深的意义。

来源:Unite.AI

来自中国和西班牙研究人员的一份新论文发现，即使是高级多模式模型，例如GPT-4.1，也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小，可能会导致重大的解释错误，而微调仅有助于熟悉的示例。当面对现实世界任务中不熟悉的图像时，结果引起了人们对这些模型的可靠性的担忧。

当人类对重力或其他基本物理原理等领域有足够深的了解时，我们将超越特定的例子来掌握潜在的抽象。这使我们能够通过识别行动中的原则来创造性地应用这些知识，并识别新实例，甚至是我们从未见过的那些实例。

当一个域具有足够的重要性时，我们甚至可以开始对其不存在的地方感知它，就像pareidolia一样，这是由于未能识别真实实例的高成本而驱动。这种模式认可的生存机制是如此强大，以至于我们甚至可以在没有的情况下找到更广泛的模式。

它不存在 pareidolia 找到更广泛的模式

较早的和越来越重复的领域被灌输给我们，它的基础和终生的持久性越深；当孩子以教学方式的形式出现的最早的视觉数据集之一，印刷的材料或交互式模拟时钟用于教我们如何分辨时间：

更深层次

教学辅助帮助孩子学习时间。资料来源：https：//www.youtube.com/watch?v=ibbqxbhsnus

教学辅助帮助孩子学习时间。

尽管在手表设计中改变时尚有时可能会挑战我们，但这种早期领域掌握的弹性令人印象深刻，即使面对复杂或“怪异”设计选择，我们也可以辨别模拟时钟面孔：

改变手表设计中的时尚 手表中的一些具有挑战性的面孔 。不需要数千个示例

纸

重大的不存在设计选择模拟广泛的使面对模型的分辨时间时钟西班牙重复的特定的 pareidolia 示例多模式持久性重要性研究人员模式足够的孩子潜在的时间交互式可靠性高成本手表数据集实例领域识别印刷的掌握面孔