详细内容或原文请订阅后点击阅览
AI阅读模拟时钟的努力可能具有更深的意义
来自中国和西班牙研究人员的一份新论文发现,即使是高级多模式模型,例如GPT-4.1,也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小,可能会导致重大的解释错误,而微调仅有助于熟悉的示例。结果引起了人们对[…] AI努力阅读模拟时钟的可靠性的关注,这首先在Unite.AI上出现了更深的意义。
来源:Unite.AI来自中国和西班牙研究人员的一份新论文发现,即使是高级多模式模型,例如GPT-4.1,也很难从模拟时钟的图像中告诉时间。时钟的视觉变化很小,可能会导致重大的解释错误,而微调仅有助于熟悉的示例。当面对现实世界任务中不熟悉的图像时,结果引起了人们对这些模型的可靠性的担忧。
当人类对重力或其他基本物理原理等领域有足够深的了解时,我们将超越特定的例子来掌握潜在的抽象。这使我们能够通过识别行动中的原则来创造性地应用这些知识,并识别新实例,甚至是我们从未见过的那些实例。
当一个域具有足够的重要性时,我们甚至可以开始对其不存在的地方感知它,就像pareidolia一样,这是由于未能识别真实实例的高成本而驱动。这种模式认可的生存机制是如此强大,以至于我们甚至可以在没有的情况下找到更广泛的模式。
它不存在 pareidolia 找到更广泛的模式较早的和越来越重复的领域被灌输给我们,它的基础和终生的持久性越深;当孩子以教学方式的形式出现的最早的视觉数据集之一,印刷的材料或交互式模拟时钟用于教我们如何分辨时间:
更深层次教学辅助帮助孩子学习时间。资料来源:https://www.youtube.com/watch?v=ibbqxbhsnus
教学辅助帮助孩子学习时间。尽管在手表设计中改变时尚有时可能会挑战我们,但这种早期领域掌握的弹性令人印象深刻,即使面对复杂或“怪异”设计选择,我们也可以辨别模拟时钟面孔:
改变手表设计中的时尚 手表中的一些具有挑战性的面孔 。 不需要数千个示例