Loading...
机构名称:
¥ 2.0

摘要:社交媒体平台已经超过了文化和语言界限,因此在全球范围内实现了1个在线通信。但是,各种语言的扩展使用加剧了2在线检测仇恨言论内容的挑战。尽管发布了多种天然3语言处理(NLP)解决方案,该解决方案实施了尖端的机器学习技术,但数据的4个稀缺性,尤其是标记的数据,仍然是一个相当大的障碍,这进一步需要5使用半佩顿的方法以及生成的人工智能(Generative AI)6技术。本文介绍了一种创新的方法,这是一种多语种半佩斯特的模型7,将生成对抗网络(GAN)和审计的语言模型(PLMS)组合在一起,更多8个精确的Mbert和XLM-Roberta。我们的方法证明了它在仇恨9语言和以印度语言(用英语,德语和印度语中)的仇恨检测中的有效性,当时只有10个仅采用20%的Hesoc2019数据集中的20%注释数据,从而在每种多种语言,零刺激的杂种式跨语言和单声道培训场景中都表现出11个高表现。12我们的研究提供了一个强大的基于MBERT的半纯GAN模型(SS-GAN-MBERT),该模型的表现优于基于XLM-ROBERTA的模型(SS-GAN-XLM),并达到平均F1得分14增长9.23%,准确率提高了9.23%,而准确性增加了5.75%的SemiSuline SemiSupersupervers Mbert模型。15

多语言仇恨语音检测:半监督的生成对抗方法

多语言仇恨语音检测:半监督的生成对抗方法PDF文件第1页

多语言仇恨语音检测:半监督的生成对抗方法PDF文件第2页

多语言仇恨语音检测:半监督的生成对抗方法PDF文件第3页

多语言仇恨语音检测:半监督的生成对抗方法PDF文件第4页

多语言仇恨语音检测:半监督的生成对抗方法PDF文件第5页

相关文件推荐

2025 年
¥7.0
2025 年
¥59.0