近年来,煽动性或误导性的“假”新闻内容泛滥已变得越来越普遍。同时,使用 AI 工具生成描绘任何可以想象到的场景的逼真图像也变得比以往任何时候都更容易。将这两者结合起来——AI 生成的假新闻内容——尤其有害且危险。为了打击 AI 生成的假新闻的传播,我们提出了 Mi-RAGeNews 数据集,这是一套包含 12,500 个高质量真实和 AI 生成的图像-字幕对的数据集,这些图像-字幕对均来自最先进的生成器。我们发现我们的数据集对人类(60% F-1)和最先进的多模态 LLM(< 24% F-1)都构成了重大挑战。使用我们的数据集,我们训练了一个多模态检测器(MiRAGe),与来自域外图像生成器和新闻发布商的图像-字幕对的最新基线相比,其 F-1 提高了 +5.1%。我们发布代码和数据以帮助未来检测人工智能生成的内容。1