Loading...
机构名称:
¥ 1.0

大型语言模型 (LLM) 越来越多地用于生成各种用例中的文本,包括新闻文章。鉴于这些 LLM 可能用于大规模生成虚假信息的潜在恶意性质,为此类 AI 生成的文本构建有效的检测器非常重要。鉴于新 LLM 开发的激增,获取监督检测器的标记训练数据是一个瓶颈。但是,可能有大量未标记的文本数据可用,而没有关于它来自哪个生成器的信息。在这项工作中,我们解决了这个数据问题,即检测 AI 生成的新闻文本,并将问题构建为无监督领域自适应任务。这里的域是不同的文本生成器,即LLM,我们假设我们只能访问标记的源数据和未标记的目标数据。我们开发了一个对比域自适应框架,称为 ConDA,它将标准域自适应技术与对比学习的表示能力相结合,以学习对最终无监督检测任务有效的域不变表示。我们的实验证明了我们框架的有效性,平均性能提升了 31 .与最佳表现基线相比提高了 7%,在 0 .全监督检测器的 8% 范围内。我们所有的代码和数据都可以在这里找到。

ConDA:用于 AI 生成文本检测的对比域自适应

ConDA:用于 AI 生成文本检测的对比域自适应PDF文件第1页

ConDA:用于 AI 生成文本检测的对比域自适应PDF文件第2页

ConDA:用于 AI 生成文本检测的对比域自适应PDF文件第3页

ConDA:用于 AI 生成文本检测的对比域自适应PDF文件第4页

ConDA:用于 AI 生成文本检测的对比域自适应PDF文件第5页

相关文件推荐