随着大型语言模型越来越嵌入到不同的面向用户的服务中,因此能够区分人类编写和机器生成的文本以验证新闻文章的真实性,产品评论等。因此,在本文中,我们着手探索是否可以使用一种语言模型来以零声明的方式识别由另一种语言模型所作的机器生成的文本,即使两者具有不同的体系结构并接受了不同的数据培训。我们发现,总体而言,较小的模型是更好的通用机器生成的文本探测器:它们可以更精确地检测出从较小和大型模型生成的文本,而无需任何其他培训/数据。有趣的是,我们发现在相同数据上对检测器和发电机模型进行培训,对检测成功并不重要。ec.forgess Opt-125m模型的AUC为0.90,在DECTIND GPT4代中为0.90,而GPT家族GPTJ-6B的较大模型的AUC为0.65。