详细内容或原文请订阅后点击阅览
MuTox:Meta 的新工具,用于调节 100 多种语言的语音通话
本文重点介绍了一项开创性的研究,介绍了由 FAIR、Meta 的研究人员开发的通用多语言音频毒性数据集和检测分类器 MuTox。这种创新工具超越了语言界限,改变了……
来源:英语研究MuTox:Meta 的新工具,用于调节 100 多种语言的语音通话
发布于 2024 年 2 月 27 日星期二 Shout。| Martin Fisch 在 Flickr 上 Martin Fisch 在 Flickr 上在互联网将我们所有人联系在一起的世界中,确保安全和尊重的在线互动变得比以往任何时候都更加重要。由于有毒通信的范围从冒犯性到威胁性和非法性,公司和个人可能出于多种原因想要检测毒性。为了满足这一需求,Meta 的 AI 实验室 FAIR 的研究人员推出了 MuTox——一种通用的多语言基于音频的毒性数据集和检测分类器。这种新颖的工具不仅超越了语言的界限,还将重点从文本转移到音频,这是检测和遏制在线有毒行为的重大飞跃。与以前严重依赖文本分析且以英语为中心的方法不同,MuTox 因拥抱全球通信的复杂性和多样性而脱颖而出。
MuTox 数据集是一个庞大的带注释音频话语集合,涵盖 21 种语言,重点关注非英语语言,从而为更具包容性和有效性的毒性检测工具铺平了道路。 MuTox 分类器巧妙地补充了该数据集,该模型通过将覆盖范围扩大到 100 多种语言并大幅提高检测精度和召回率,显著优于现有的基于文本的毒性检测工具。 性能和范围的飞跃表明,在不同的语言社区中,让在线空间变得更安全、更受欢迎是有希望的。
然而,旅程并未就此结束。 研究人员准备深入研究基于音频的毒性检测的细微差别,并希望进一步完善他们的模型并扩展其语言库。当我们探索不断发展的数字通信领域时,MuTox 就像一座希望的灯塔,引导我们走向一个更加尊重和理解的全球社会。
计算机科学