摘要“ voight-kampff”生成的AI作者验证任务旨在确定文本是由人工智能生成还是由人写的。在虚构的灵感中,voight-kampff任务结构AI的检测为建造者 - 破坏者挑战:建筑商,Pan Lab的参与者,提交软件,以检测AI写的文本,而Breakers,exterress of the Breakers,Eloquent Lab的参与者,提交AI写的文本,并以欺骗建筑商的目标。我们以一种让人联想到传统作者身份验证问题的方式制定了任务,在给定两条文本的情况下,应推断其人类或机器作者身份。对于第一个任务分期付款,我们进一步限制了问题,以确保每对包含一个人和一个机器文本。因此,任务描述读取:给定两个文本,一个由人类创作,一本由一台机器撰写:挑选人。总共评估了43个检测系统(30个参与者提交和13个基线),从线性分类器到基于困惑的零摄像系统。我们在14个基本集合中组织的70个单独的测试集变体上对它们进行了测试,每个变体都以不同的约束(例如短文,Unicode混淆或语言切换)设计。顶级系统的得分很高,证明自己并不完美,但在各种专业测试方案中都足够健壮。用于创建数据集并评估系统,基准和数据的代码可在GitHub上获得。2