生成的AI(Genai)技术,例如语言模型(LMS)和扩散模型,具有令人印象深刻的功能。这些功能包括文本学习,代码完成,文本到图像生成以及文档和代码聊天。然而,Genai技术也用于邪恶目的(例如,产生伪造的推文,产生攻击和有害散文)。To protect against such use cases, a large body of work has focused on detecting AI-generated content (Lavergne et al., 2008; Beresneva, 2016; Gehrmann et al., 2019; Zellers et al., 2019; Mitchell et al., 2023; GPTZero, 2023; Hendrik Kirchner et al., 2023).问题是:给定内容C,C是由特定的Genai工具生成的,例如GPT-4(OpenAI,2023),Gemini(Google DeepMind,2024)或稳定的扩散(Rombach等,2022)?非正式地,我们想要“ Genai Turing测试”。目前,试图检测任意AI生成的文本的主要方法是训练另一个AI模型以执行检测(Zellers等,2019; Mitchell等,2023; Gptzero,2023; Hendrik Kirchner等人,2023年,2023年)。此方法提出了一个关键的假设:AI生成的文本具有可通过AI识别的嵌入功能。这个假设的关键问题是,生成模型是明确设计的,以产生很难与自然内容(由人类或自然产生的)区分的现实内容。结果,随着生成模型的改善,任何“黑盒”检测方案都将遭受高误报和/或假阴性率。这些水印技术改变了生成过程,将“信号”嵌入生成的内容中。可用的探测器,例如Gptzero(Gptzero,2023)无法保证正确性 - 例如,作者直接指出,不应使用其工具引起的检测来谴责学生。为了避免这个基本问题,最近的一项工作(Aaronson,2023; Kirchenbauer等,2023; Christ等,2024; Kuditipudi等,2024)采取了另一种方法来检测AI含量。检测过程衡量信号:如果信号足够强,则可能是水标水标的。特别是Christ等人的加密方法。(2024)实现正式的完整概念(将检测到任何水印的文本),健全性(一个人不知道秘密而不能在文本上加水印)和失真(水印不会改变输出分布)。最后,这些水印
主要关键词