语言模型的公共可检测水印___XiaoMi-AI 助力科研平台

语言模型的公共可检测水印

可下载资源数量

已经购买

下载数量：1

单价	0 3.0
Coupon	100% 0%
Total	0 3.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

语言模型的公共可检测水印

¥ 3.0

热度

生成的AI（Genai）技术，例如语言模型（LMS）和扩散模型，具有令人印象深刻的功能。这些功能包括文本学习，代码完成，文本到图像生成以及文档和代码聊天。然而，Genai技术也用于邪恶目的（例如，产生伪造的推文，产生攻击和有害散文）。To protect against such use cases, a large body of work has focused on detecting AI-generated content (Lavergne et al., 2008; Beresneva, 2016; Gehrmann et al., 2019; Zellers et al., 2019; Mitchell et al., 2023; GPTZero, 2023; Hendrik Kirchner et al., 2023).问题是：给定内容C，C是由特定的Genai工具生成的，例如GPT-4（OpenAI，2023），Gemini（Google DeepMind，2024）或稳定的扩散（Rombach等，2022）？非正式地，我们想要“ Genai Turing测试”。目前，试图检测任意AI生成的文本的主要方法是训练另一个AI模型以执行检测（Zellers等，2019; Mitchell等，2023; Gptzero，2023; Hendrik Kirchner等人，2023年，2023年）。此方法提出了一个关键的假设：AI生成的文本具有可通过AI识别的嵌入功能。这个假设的关键问题是，生成模型是明确设计的，以产生很难与自然内容（由人类或自然产生的）区分的现实内容。结果，随着生成模型的改善，任何“黑盒”检测方案都将遭受高误报和/或假阴性率。这些水印技术改变了生成过程，将“信号”嵌入生成的内容中。可用的探测器，例如Gptzero（Gptzero，2023）无法保证正确性 - 例如，作者直接指出，不应使用其工具引起的检测来谴责学生。为了避免这个基本问题，最近的一项工作（Aaronson，2023; Kirchenbauer等，2023; Christ等，2024; Kuditipudi等，2024）采取了另一种方法来检测AI含量。检测过程衡量信号：如果信号足够强，则可能是水标水标的。特别是Christ等人的加密方法。（2024）实现正式的完整概念（将检测到任何水印的文本），健全性（一个人不知道秘密而不能在文本上加水印）和失真（水印不会改变输出分布）。最后，这些水印

添加pdf代下载 VIP点击下载文件