使用 Amazon Nova 自定义文本内容审核

在这篇文章中,我们介绍了通过 Amazon SageMaker AI 进行文本内容审核的 Amazon Nova 定制,使组织能够根据其特定的审核需求微调模型。三个基准测试的评估结果显示,与基准 Nova Lite 相比,定制的 Nova 模型的 F1 分数平均提高了 7.3%,在不同的内容审核任务中,个别改进范围为 4.2% 到 9.2%。

来源:亚马逊云科技 _机器学习
考虑一个不断发展的社交媒体平台,每天处理数百万用户帖子。他们的内容审核团队面临着一个熟悉的挑战:他们基于规则的系统将讨论“刀法”的烹饪视频标记为暴力内容,让用户感到沮丧,同时错过了伪装成餐厅评论的隐蔽威胁。当他们尝试通用人工智能审核服务时,它与社区的游戏术语相矛盾,标记了策略游戏中有关“消除对手”的讨论,同时忽略了使用特定于其平台的编码语言的实际骚扰。审核团队发现自己陷入了用户对过度审核的抱怨和广告商对有害内容溜走的担忧之间——这个问题随着用户群的增长而呈指数级增长。这种情况说明了大规模的内容审核给各行业的客户带来了更广泛的挑战。传统的基于规则的方法和关键字过滤器通常难以捕获细微的政策违规行为、新出现的有害内容模式或需要更深入语义理解的上下文违规行为。与此同时,用户生成内容的数量持续增长,使得手动审核变得越来越不切实际且成本高昂。客户需要适应性强的解决方案,能够根据其内容需求进行扩展,同时保持准确性并反映其特定的审核策略。虽然通用人工智能内容审核服务提供广泛的功能,但它们通常实施可能不符合客户独特要求的标准化策略。这些方法通常会遇到特定领域的术语、复杂的政策边缘案例或特定文化的内容评估。此外,不同的客户可能具有不同的内容注释分类法以及相同策略类别的不同阈值或边界。因此,许多客户发现自己需要在检测功能之间进行权衡