详细内容或原文请订阅后点击阅览
科学家让AI玩战舰,帮助它更好地做科学
AI模型和人们“协作”玩战舰,测试高效解决问题的策略
来源:科学美国人科学家让AI玩战舰,帮助它更好地做科学
AI模型和人们“协作”玩战舰,测试高效解决问题的策略
作者:Peter Hall 编辑:Sarah Lewin Frasier
如果人工智能要像许多前沿人工智能实验室所希望的那样彻底改变科学研究的方式,它需要首先掌握棋盘游戏。这是最近一项针对人工智能模型决策技能的研究的教训,该研究通过《战舰》游戏进行了测试。目标是找到方法让模型在有限的资源下更加谨慎:正如研究科学家瓦莱里奥·佩佩(Valerio Pepe)所说,用于信息搜索的“廉价干预”。
科学需要大量决策——研究人员必须选择要追求哪些假设以及要运行哪些模拟。当实验资源有限时,这些选择将决定走哪条路。 “你只能获取有限的数据,因为获取数据要么昂贵,要么耗时,”加入 OpenAI 之前领导该项目工作的 Pepe 说道。今年 4 月,Pepe 和他的同事在国际学习表征会议(International Conference on Learning Representations)上展示了他们的发现,这是一次专门讨论人工智能深度学习的年度会议。
研究人员设计了一个可以由人类或人工智能玩的协作版本的战舰。在游戏中,一名团队成员提出有关船只位置地图的问题,而另一名团队成员则回答这些问题,共同努力查明船只隐藏的位置并击沉它们。通过计算击沉所有船只需要多少轮,研究人员可以测试大型语言模型 (LLM) 与其他 LLM 以及该团队招募的 42 名人类玩家相比的表现。最初,人类始终以比 Meta 注重效率的人工智能模型 Llama-4-Scout 更少的步数获胜。 OpenAI 的首要推理模型 GPT-5 的表现优于两者。
