科学家刚刚开发了一种以人脑为模型的新AI - 在推理任务上,它胜过像chatgpt这样的LLM

层次推理模型(HRM)系统的建模是建立人类大脑处理复杂信息的方式,并且在臭名昭著的难以基础的基准中优于领先的LLM。

来源:LiveScience

科学家开发了一种新型的人工智能(AI)模型,该模型可以与大多数大型语言模型(LLM)等大多数的理论推理,从而在关键基准中提供了更好的性能。

人工智能

新的推理AI,称为层次推理模型(HRM),灵感来自人脑中的层次结构和多时间处理 - 不同的大脑区域将信息整合到不同持续时间(从毫秒到几分钟)中。

层次和多时间计算处理

新加坡AI公司Sapient的科学家说,这种推理模型可以取得更好的性能,并且可以更有效地工作。这要归功于需要更少的参数和培训示例的模型。

科学家在6月26日上传到Preprint ARXIV数据库(尚未经过同行评审)的一项研究中说,HRM模型在使用1,000个培训样本的同时具有2700万个参数。相比之下,大多数高级LLM具有数十亿甚至数万亿个参数。尽管尚未公开确切的数字,但一些估计表明,新发布的GPT-5具有3万亿至5万亿个参数。

arxiv 一些估计

AI

研究人员在ARC-AGI基准中测试了HRM时,该研究旨在测试模型与实现人工智能(AGI)的近距离检查,该系统取得了令人印象深刻的结果。

Arc-Agi基准 人工通用情报

HRM在Arc-Agi-1中得分40.3%,而Openai的O3-Mini-High为34.5%,Anthropic的Claude 3.7和15.8%的DeepSeek R1为21.2%。在更严格的ARC-AGI-2测试中,HRM得分为5%,而O3-Mini-High的3%,DeepSeek R1的1.3%和Claude 3.7的0.9%。

将世界上最有趣的发现直接传递到您的收件箱中。

相关:AI正在进入“前所未有的政权”。我们应该停止它 - 我们可以 - 在它破坏我们之前吗?

相关: 人脑 博客文章