最近的大型语言模型 (LLM),例如 ChatGPT,在提供特定指令时已经能够生成类似人类的流畅响应。在承认技术进步带来的便利的同时,教育工作者也担心学生可能会利用 LLM 完成写作作业并将其冒充为原创作品。尽管许多 AI 内容检测研究都是由于这种担忧而开展的,但大多数先前研究将 AI 内容检测建模为分类问题,假设文本要么完全由人类编写,要么完全由 AI 生成。在这项研究中,我们在一个很少探索但现实的环境中调查了 AI 内容检测,其中要检测的文本由人类和生成性 LLM 协作编写(为简单起见称为混合文本)。我们首先将检测任务形式化为从给定的混合文本中识别人类编写的内容和 AI 生成的内容之间的过渡点(边界检测)。我们通过从学生写的原始文章中随机删除部分句子,然后指示 ChatGPT 填写不完整的文章,构建了一个混合文章数据集。然后我们提出了一种两步检测方法,其中(1)在编码器训练过程中将 AI 生成的内容与人类编写的内容分开;(2)计算每两个相邻原型之间的距离(原型是嵌入空间中混合文本中一组连续句子的平均值),并假设两个相邻原型之间存在边界,这些原型彼此距离最远。通过大量实验,我们观察到以下主要发现:(1)所提出的方法在不同的实验设置中始终优于基线方法;(2)编码器训练过程(即上述两步方法的第一步)可以显着提高所提出方法的性能; (3)在检测单边界混合型文章的边界时,通过采用相对较大的原型大小(即计算原型所需的句子数量),可以增强所提出的方法,从而使域内评估的结果提高了 22%(相对于最佳基线方法),域外评估的结果提高了 18%。
从一组线段中自动识别结构是一项挑战,因为并非所有定义建筑结构的线都能被低级图像处理完美检测到。使问题进一步复杂化的是,额外的边缘可能会位于墙壁表面或不属于目标结构的物体上。因此,大多数现有方法依赖于中级区域特征,如几何上下文和方向图 [7],作为布局估计的中间步骤。给定一张图像,我们确定其信息边缘图,然后用它来预测该图像的最佳拟合 3D 框。由于图像是现实世界的投影,因此最好以能够满足现实世界的方式来解释它们。大多数室内环境符合曼哈顿世界假设 [2],即大多数平面位于三个相互正交的方向之一。寻找建筑结构分三步完成;找到线段和消失点,创建许多合理的建筑模型假设,并根据方向图(区域方向的局部信念图)对每个假设进行测试,以