详细内容或原文请订阅后点击阅览
模拟显示,人工智能战争游戏几乎总是升级为核打击
一项新研究表明,人工智能在冲突期间的决策自然容易升级。
来源:LiveScience国防和情报机构越来越依赖人工智能 (AI) 系统来增强其能力,包括情报收集中的模式识别和应急行动的场景规划。然而,科学家表示,人工智能和大型语言模型的核心问题之一是我们从未真正理解支撑它们的逻辑。这些系统被比作一个黑匣子,它提供答案,但没有显示支持结果的推理。
为了理解 AI 系统的逻辑,伦敦国王学院战略学教授 Kenneth Payne 设计了两个相互竞争的 AI 之间的一系列兵棋模拟,发现几乎在每种情况下,核升级都是不可避免的。 2 月 16 日,他在 arXiv 预印本数据库中发表了未经同行评审的研究结果。
实验采用了可汗游戏的一系列双向锦标赛,其中 Claude Sonnet 4、GPT-5.2 和 Gemini 3 Flash 在一系列模拟核危机中进行竞争。
可汗博弈是两个核大国之间的人工智能对人工智能战略升级模拟,其国家概况大致基于冷战。一种是技术先进但军事较弱,另一种是军事较强但采取容忍风险的领导风格。一些模拟包括盟国,其中一种场景故意测试在冲突期间是否可以维持联盟的领导地位。
每个回合,AI 在采取任何行动之前都会同时发出信号,这意味着 AI 对手可以决定是否信任其他 AI 玩家的信号。
Payne 发现这些模型为他们的决策生成了大量书面理由,总共生成了 760,000 个单词——比《战争与和平》和《伊利亚特》的总和还要多。
将世界上最迷人的发现直接发送到您的收件箱。
