获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
最近的大型语言模型(LLMS)表明能够生成难以区分的内容与Human写作。我们调查了不同大小的LLM在淋浴思想的范围内简短,创意文本复制人类撰写风格的能力,这些思想可能会在平凡的活动中发生。我们将gpt-2和gpt-neo在reddit数据以及以零射击方式调用的gpt-3.5上进行了比较,与人为撰写的文本进行了比较。我们衡量在特定维度上的文本上的偏好,这些文本说明了Cretive,机智的文本的质量。此外,我们比较了人类与微调的罗伯塔分类器检测AI生成的文本的能力。我们得出的结论是,人类评估者的遗传文本平均将其创作质量稍差一些,但他们无法可靠地区分人文和AI生成的文本。我们进一步提供了一个基于Reddit淋浴帖子的创意,机智的文本生成的数据集。