AI模型无法分辨时间或阅读日历,研究揭示了

在视觉和空间处理中的挑战以及训练数据的缺陷表明AI系统中缺乏计时能力

来源:LiveScience

新的研究揭示了大多数人可以轻松完成人工智能(AI)跌跌撞撞的另一组任务 - 阅读模拟时钟或弄清楚日期下降的一天。

人工智能

AI可能能够编写代码,生成栩栩如生的图像,创建听起来像人类的文本,甚至通过考试(在不同程度的成功程度上),但它通常会误解了日常时钟上手的位置,并且在日历日期所需的基本算术中失败。

在不同程度的成功

研究人员在2025年国际学习表现会议(ICLR)的演讲中揭示了这些意外的缺陷。他们还在3月18日在预印式服务器ARXIV上发布了他们的发现,因此尚未经过同行评审。

arxiv

“大多数人都可以从很小的时候开始告诉时间并使用日历。我们的发现突出了人工智能执行对人们的基本技能的能力的显着差距。”爱丁堡大学研究人员Rohit Saxena在一份声明中说。如果将AI系统成功集成到时间敏感的现实世界中,例如调度,自动化和辅助技术,则必须解决这些缺口。”

Rohit Saxena 在声明中说

为了调查AI的计时能力,研究人员将时钟和日历图像的自定义数据集喂入了各种多模式大型语言模型(MLLMS),这些模型可以处理视觉和文本信息。该研究中使用的模型包括Meta的Llama 3.2 Vision,Anthropic的Claude-3.5十四行诗,Google的Gemini 2.0和OpenAI的GPT-4O。

和结果很差,模型无法从时钟的图像或样本日期的一半以上的时间识别正确的时间。

相关:当前的AI模型为人类智能的“死胡同”,科学家同意

相关: 当前的AI为人类智能建模了一个“死胡同”,科学家同意 出现在我们的危险中