生成式预训练 Transformer 大型语言模型的最新进展强调了在学术环境中不公平使用人工智能 (AI) 生成内容的潜在风险,并加大了寻找检测此类内容的解决方案的力度。本文研究了人工智能生成文本检测工具的一般功能,并根据准确性和错误类型分析对其进行了评估。具体来说,该研究试图回答以下研究问题:现有检测工具是否能够可靠地区分人类书写的文本和 ChatGPT 生成的文本,以及机器翻译和内容混淆技术是否会影响对人工智能生成文本的检测。该研究涵盖了 12 种公开可用的工具和两种在学术环境中广泛使用的商业系统(Turnitin 和 PlagiarismCheck)。研究人员得出结论,现有的检测工具既不准确也不可靠,主要偏向于将输出归类为人类书写的文本,而不是检测人工智能生成的文本。此外,内容混淆技术会显著降低工具的性能。该研究做出了几项重要贡献。首先,它总结了该领域最新的类似科学和非科学成果。其次,它展示了迄今为止最全面的测试之一的结果,该测试基于严格的研究方法、原始文档集和广泛的工具覆盖范围。第三,它讨论了在学术环境中使用检测工具检测人工智能生成的文本的含义和缺点。
摘要 - 本文着重于评估所选工具以检测DeepFake视频,该视频对数字信息的完整性和在线媒体的可信度构成了日益严重的威胁。随着人工智能越来越多地创建高度逼真的操纵内容,对健壮检测系统的需求不仅在数字取证中很重要,而且在更广泛的信息安全和媒体验证领域也很重要。这项研究提供了对五种DeepFake检测工具的比较分析,其中包括三种开源工具(SBI,LSDA,LIPINC)和两种商业解决方案(Bio-ID,Deepware),这些数据集在Celeb-DF(V2)的300个操纵视频的数据集上进行了测试。结果表明,商业工具的性能更好,生物ID的检测准确性为98.00%,而Deepware 93.47%的检测准确性优于开源替代方案。
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。它是此预印本版本的版权持有人,该版本发布于2025年2月7日。 https://doi.org/10.1101/2025.02.07.636955 doi:Biorxiv Preprint
预印本(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此版本的版权持有人于2025年2月2日发布。 https://doi.org/10.1101/2023.09.09.03.556087 doi:Biorxiv Preprint
预印本(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。该版本的版权持有人于2025年1月19日发布。 https://doi.org/10.1101/2025.01.15.633177 doi:biorxiv preprint
© 作者 2023。开放存取 本文根据知识共享署名 4.0 国际许可协议进行授权,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可协议的链接,并指明是否做了更改。 本文中的图片或其他第三方资料包含在文章的知识共享许可协议中,除非在资料的致谢中另有说明。 如果资料未包含在文章的知识共享许可协议中,且您的预期用途不被法定规定允许或超出了允许的用途,则需要直接从版权所有者处获得许可。 要查看此许可证的副本,请访问 http://creativecommons.org/licenses/by/4.0/。知识共享公共领域贡献豁免(http://creativecommons.org/publicdo‑main/zero/1.0/)适用于本文中提供的数据,除非数据来源中另有说明。
已移动 ( / ) T&LPC 向参议院建议,大学不支持使用 AI 检测工具来处理学生课程,以识别学术诚信问题。背景 GPT4 和其他类似技术的出现引发了高等教育内部关于人工智能对一系列学术活动(包括教学、学习和学术研究)的影响的激烈辩论。为了确保布鲁克的运营决策受益于我们重要的内部专业知识,教务长和学术副校长于今年早些时候成立了一个人工智能咨询小组。这个跨学科小组的成员名单列在本备忘录的末尾,其中包括 14 名在与人工智能相关的不同领域拥有专业知识的教职员工。根据该小组最初关注的生成式人工智能对教学实践的影响,咨询小组成员帮助制定了教学创新中心向布鲁克大学教师和学习者发布的指导意见。然而,咨询小组内部最近的讨论涉及旨在检测学生课程中人工智能使用情况的工具和技术(“人工智能检测工具”)。这是一个新出现的问题,已被确定需要澄清,特别是为了帮助那些试图评估学生课程中可能未经授权使用生成式人工智能的教师,以维护学术诚信。在教务长顾问小组讨论 AI 检测工具后,顾问小组成员参加了 2023 年 9 月 21 日的教学与学习政策委员会会议,他们在会上概述了他们向教务长强烈建议布鲁克大学不支持使用 AI 检测工具处理学生课程以识别学术诚信问题的一些理由。在上个月的教学与学习政策委员会讨论之后(以及其他相关论坛,如教务长的学术诚信顾问小组的讨论),教务长希望将该小组的建议作为正式动议进行审议(如上所述)。顾问小组成员阐述的这项动议的理由如下:
摘要:由于 ChatGPT 已成为一种主要的 AIGC 模型,可在广泛的应用(包括软件开发和维护)中提供高质量的响应,因此它吸引了许多人的兴趣。ChatGPT 前景广阔,但滥用可能会引发严重问题,尤其是在教育和公共安全领域。目前有几种 AIGC 检测器可用,并且都已在真实文本上进行了测试。但是,还需要进行更多研究才能了解它们对多域 ChatGPT 材料的有效性。本研究旨在通过创建一个多域数据集来测试大学和其他研究机构使用的用于检测人工生成信息的最先进的 API 和工具,从而满足这一需求。本研究创建了一个由文章、摘要、故事、新闻和产品评论组成的大型数据集。第二步是使用新创建的数据集对六种工具进行测试。包括“GPTkit”、“GPTZero”、“Originality”、“Sapling”、“Writer”和“Zylalab”在内的六种不同的人工智能文本识别系统准确率在55.29%至97.0%之间。虽然所有工具在评估中都表现良好,但Originality在各方面都表现得尤为出色。
为了实现这一目标,GRASE 结合了专业知识(通过参与反歧视专家和从事性别、种族和移民研究的研究人员)和实践知识(通过在意大利、西班牙和葡萄牙启动三个实践社区,与职业咨询专业人员合作),这三个国家的妇女和移民在进入劳动力市场时面临不同的障碍。该项目的最终目标是帮助减少移民妇女在劳动力市场参与方面的性别和种族差距,以期全面实施非歧视原则,该原则被誉为欧洲立法框架的核心要素之一,也载入了意大利、西班牙和葡萄牙(该项目实施的三个国家)的宪法和法律。
摘要 建筑供暖、通风和空调 (HVAC) 设备经常无法满足设计时所设想的性能预期。此类故障通常会在很长一段时间内被忽视。此外,人们对各种不同且往往相互冲突的性能指标的组合寄予了更高的期望,例如能源效率、室内空气质量、舒适度、可靠性、限制公用设施的峰值需求等。为了满足这些期望,商业和住宅建筑中使用的流程、系统和设备正变得越来越复杂。这一发展既需要使用自动诊断来确保无故障运行,又通过提供强大且足够灵活的分布式平台来执行故障检测和诊断 (FDD),从而为各种建筑系统提供诊断功能。本报告中描述的研究工作的目的是开发、测试和演示可以检测空气处理单元 (AHU) 和变风量 (VAV) 箱中常见机械故障和控制错误的 FDD 方法。这些工具的设计足够简单,可以嵌入到商业楼宇自动化和控制系统中,并且仅依赖于这些系统中常见的传感器数据和控制信号。AHU 性能评估规则 (APAR) 是一种诊断工具,它使用一组源自质量和能量平衡的专家规则来检测 f