人工智能解码视觉大脑活动并为其编写字幕

非侵入性成像技术可以将您头脑中的场景转化为句子。它可以帮助揭示大脑如何解释世界

来源:科学美国人

2025 年 11 月 6 日

3 分钟阅读

人工智能解码视觉大脑活动并为其编写字幕

非侵入性成像技术可以将您头脑中的场景转化为句子。它可以帮助揭示大脑如何解释世界

作者:Max Kozlov 和《自然》杂志

马克斯·科兹洛夫 自然杂志
功能性磁共振成像是一种探索大脑活动的非侵入性方法。 PBH 图片/Alamy Stock Photo

功能性磁共振成像是一种探索大脑活动的非侵入性方法。

PBH 图片/Alamy Stock Photo

使用大脑活动记录来读取一个人的想法听起来很未来,但现在它离现实又近了一步。一种名为“心灵字幕”的新技术通过读取人们的大脑活动来生成描述性句子,描述一个人在脑海中看到或想象的内容,其准确性令人印象深刻。

今天发表在《科学进展》上的一篇论文描述了这项技术,它还为大脑在思想被表达出来之前如何表征世界提供了线索。它或许能够帮助有语言障碍的人(例如中风引起的人)更好地沟通。

科学进步 帮助有语言障碍的人

加州大学伯克利分校的计算神经科学家 Alex Huth 表示,该模型可以“详细地”预测一个人正在看什么。 “这很难做到。令人惊讶的是你能获得这么多细节。”

关于支持科学新闻

如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻事业。通过购买订阅,您将有助于确保有关塑造当今世界的发现和想法的影响力故事的未来。

订阅

扫描和预测

十多年来,研究人员已经能够利用一个人的大脑活动准确预测他所看到或听到的内容。但事实证明,解码大脑对复杂内容(例如短视频或抽象形状)的解释更加困难。

利用他们的大脑活动 SciAm