随着人工智能生成的文本越来越像人类书写的内容,检测机器生成文本的能力变得至关重要。为了应对这一挑战,我们提出了 GPTWatermark,这是一种强大而高质量的解决方案,旨在确定一段文本是否源自特定模型。我们的方法扩展了现有的水印策略,并采用固定组设计来增强对编辑和释义攻击的鲁棒性。我们表明,我们的带水印的语言模型在生成质量、检测正确性和针对规避攻击的安全性方面享有强有力的可证明保证。在各种大型语言模型 (LLM) 和不同数据集上的实验结果表明,我们的方法实现了卓越的检测准确率和可比的复杂度生成质量,从而促进了 LLM 的负责任使用。代码可在 https://github. com/XuandongZhao/GPTWatermark 获得。
- 电子邮件地址:net_david@pbss.hk - 邮寄地址:香港柴湾新厦街338号宝血中学 利益声明 无。致谢 C.H.Y. 的作品。得到中国香港特别行政区研究资助局的支持(项目编号EdUHK GRF 18301119)。
© 作者 2023。开放存取 本文根据知识共享署名 4.0 国际许可协议进行授权,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可协议的链接,并指明是否做了更改。 本文中的图片或其他第三方资料包含在文章的知识共享许可协议中,除非在资料的致谢中另有说明。 如果资料未包含在文章的知识共享许可协议中,且您的预期用途不被法定规定允许或超出了允许的用途,则需要直接从版权所有者处获得许可。 要查看此许可证的副本,请访问 http://creativecommons.org/licenses/by/4.0/。知识共享公共领域贡献豁免(http://creativecommons.org/publicdo‑main/zero/1.0/)适用于本文中提供的数据,除非数据来源中另有说明。
生成式预训练 Transformer 大型语言模型的最新进展强调了在学术环境中不公平使用人工智能 (AI) 生成内容的潜在风险,并加大了寻找检测此类内容的解决方案的力度。本文研究了人工智能生成文本检测工具的一般功能,并根据准确性和错误类型分析对其进行了评估。具体来说,该研究试图回答以下研究问题:现有检测工具是否能够可靠地区分人类书写的文本和 ChatGPT 生成的文本,以及机器翻译和内容混淆技术是否会影响对人工智能生成文本的检测。该研究涵盖了 12 种公开可用的工具和两种在学术环境中广泛使用的商业系统(Turnitin 和 PlagiarismCheck)。研究人员得出结论,现有的检测工具既不准确也不可靠,主要偏向于将输出归类为人类书写的文本,而不是检测人工智能生成的文本。此外,内容混淆技术会显著降低工具的性能。该研究做出了几项重要贡献。首先,它总结了该领域最新的类似科学和非科学成果。其次,它展示了迄今为止最全面的测试之一的结果,该测试基于严格的研究方法、原始文档集和广泛的工具覆盖范围。第三,它讨论了在学术环境中使用检测工具检测人工智能生成的文本的含义和缺点。
1.1. 鉴别 适当的鉴别试验应能够区分可能存在的结构密切相关的化合物。可以通过从含有分析物的样品中获得阳性结果(可能通过与已知参考材料进行比较)以及从不含分析物的样品中获得阴性结果来确认程序的鉴别。此外,鉴别试验可应用于结构与分析物相似或密切相关的材料,以确认未获得阳性响应。选择此类潜在干扰材料应基于合理的科学判断,并考虑可能发生的干扰。
研讨会借鉴了他们的个人经验,他们有时会引用特定的供应商和商业产品。包含或遗漏某个特定公司或产品并不意味着 NIST 的认可或批评。
应用程序。本计划应符合伊利诺伊州农业部标准太阳能农业影响缓解协议(AIMA),版本8.19.19或其继任者的标准和要求,并且与伊利诺伊州农业部执行的AIMA设施相同。退役计划中确定的金额中的债券减去救助价值应在LaSalle县土地使用部门提交,以在签发该项目的建筑许可证之前,将拉萨尔县作为受益人。该债券应按照AIMA9。遵守所有联邦,州和其他适用要求的证明。10。所有商业太阳能设施申请应伴随着初步地图
自2011年以来,包括加拿大在内的所有主要国际采矿司法管辖区都协调了其对矿产资源,矿产储量和矿业研究的定义,以与代表全球辖区的85%以上的矿产计划报告标准的国际组织(CRIRSCO)保持一致。加拿大采矿,冶金和石油研究所(CIM)是加拿大的Crirsco成员,在加拿大的情况下保持了定义。当前的仪器通过参考将CIM CIM定义标准(CIM定义标准)合并,该标准将CSA的采矿披露要求与CRIRSCO标准保持一致。当前的工具还允许外国发行人参考其管辖区标准中的类似定义,类似于CIM定义标准。