Loading...
机构名称:
¥ 1.0

摘要随着我们越来越多地将人工智能整合到我们的日常任务中,至关重要的是要确保这些系统可靠且可靠地抵抗对抗性攻击。在本文中,我们介绍了Clef Checkthat任务6的参与!2024实验室。在我们的工作中,我们探索了几种方法,可以将其分为两类。第一组专注于使用遗传算法来检测单词并通过多种方法(例如添加/删除单词和使用同义)进行更改。在第二组方法中,我们使用大型语言模型来产生对抗性攻击。基于我们的综合实验,我们选择了基于遗传算法的模型,该模型利用分裂单词和同质同源物作为文本操纵方法的组合,作为我们的主要模型。我们根据Bodega度量和手动评估排名第三。

使用遗传算法创建对抗性示例

使用遗传算法创建对抗性示例PDF文件第1页

使用遗传算法创建对抗性示例PDF文件第2页

使用遗传算法创建对抗性示例PDF文件第3页

使用遗传算法创建对抗性示例PDF文件第4页

使用遗传算法创建对抗性示例PDF文件第5页

相关文件推荐

2008 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0