加密信息关键词检索结果

LLM 水印中没有免费的午餐:水印设计选择的权衡

No free lunch in LLM watermarking: Trade-offs in watermarking design choices

生成模型的进步使得 AI 生成的文本、代码和图像能够在许多应用中反映人类生成的内容。水印是一种将信息嵌入模型输出以验证其来源的技术,旨在减轻对此类 AI 生成内容的滥用。当前最先进的水印方案通过稍微扰动 LLM 输出标记的概率来嵌入水印,这可以在验证过程中通过统计测试检测到。不幸的是,我们的工作表明,LLM 水印方案中的常见设计选择使生成的系统出人意料地容易受到水印删除或欺骗攻击——导致在稳健性、实用性和可用性方面做出根本性的权衡。为了解决这些权衡问题,我们严格研究了一组针对常见水印系统的简单但有效的攻击,并提出了 LLM 水印实践中的指导方针和防御措施。提示艾伦图灵出生于... Unwate