Loading...
机构名称:
¥ 1.0

复杂的大语言模型的出现,例如Chatgpt和其他AI驱动的平台,导致了近距离模仿人类写作的文本的产生,这使得识别它是人类生成还是AI生成的内容非常具有挑战性。这对内容验证,学术完整性和检测误导性信息构成了重大挑战。为了解决这些问题,我们开发了一个分类系统,以使用多样化的HC3英语数据集区分人体编写的文本和a-ager of a-aged文本。此数据集利用语言肛门和结构特征,包括一部分语音标签,词汇大小,单词密度,词密度,具有被动的语音用法以及可读性指标,例如验收的读数,验阅读便捷,引起式和爆发性。我们采用了基于变压器和深入学习的模型来完成策略任务,例如CNN_BILSTM,RNN,BERT,GPT-2和ROBERTA。其中,罗伯塔模型表现出了优越的表现,其出色的精度为99.73。这些结果表明了尖端深度学习方法如何在数字领域中提出信息完整性。

使用语言特征检测具有预训练模型的AI生成的文本

使用语言特征检测具有预训练模型的AI生成的文本PDF文件第1页

使用语言特征检测具有预训练模型的AI生成的文本PDF文件第2页

使用语言特征检测具有预训练模型的AI生成的文本PDF文件第3页

使用语言特征检测具有预训练模型的AI生成的文本PDF文件第4页

使用语言特征检测具有预训练模型的AI生成的文本PDF文件第5页

相关文件推荐

2024 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2024 年
¥8.0
2024 年
¥1.0
2025 年
¥1.0