我们如何使用 AI 自动化 100,000 多个产品标签以实现合规性

人工智能如何准确处理 100,000 多个快速消费品质量文档《我们如何使用人工智能自动化 100,000 多个产品标签以实现合规性》一文首先出现在 Spritle 软件上。

来源:Spritle 博客

以下是我们如何帮助全球快速消费品品牌处理 100,000 多个产品标签,以确保在不损失准确性的情况下符合人工智能要求

当一家全球快速消费品制造商找到我们时,问题并不是缺乏数据。内容太多了,而且格式错误。

每一批离开生产工厂的产品都附有产品标签、包含成分列表、营养信息、监管合规数据和认证签字的 PDF。乘以多条生产线和多年的运营,这个数字就超过了 100,000 份文档。每一项都需要经过审查、提取关键字段并根据监管标准进行验证,然后才能存档或输入下游合规系统。

这是由监管和合规团队手动完成的,他们会阅读每个 PDF,将值复制到电子表格或记录系统中,并交叉检查错误。它有效,但没有扩展。每一条新产品线、每一个审核周期、每一个新市场都在已经太长的队列中添加了更多标签。

客户的简介很直接:使用人工智能文档处理自动提取和验证这些产品标签,而不影响其全球合规流程所依赖的准确性。

为什么这不是一个简单的 OCR 问题

从表面上看,该解决方案看起来很简单 - 通过 AI 提取管道运行 PDF,检查置信度分数并进行批准。我们以前已经见过这种假设,但它在接触真实的制造文件后就无法生存。

因此,在编写一行提取逻辑之前,我们花了一些时间与客户的监管团队一起了解这些标签在实践中的实际外观,而不仅仅是它们在最佳情况下的外观。

文档 AI 中的置信度分数陷阱

任何文档 AI 管道的第一个版本都倾向于对每个文档使用单个置信度分数:如果模型总体上有 90% 的置信度,则批准它;如果模型总体上有 90% 的置信度,则批准它;如果没有,请将其发送给人类。