Amazon.com Catalog 团队如何使用 Amazon Bedrock 大规模构建自学生成式 AI

在这篇文章中,我们演示了 Amazon Catalog 团队如何使用 Amazon Bedrock 构建一个自学习系统,该系统不断提高准确性,同时大规模降低成本。

来源:亚马逊云科技 _机器学习

Amazon.com 目录是每个客户购物体验的基础,是产品信息的权威来源,具有支持搜索、推荐和发现的属性。当卖家列出新产品时,目录系统必须提取结构化属性(尺寸、材料、兼容性和技术规格),同时生成与客户搜索方式相匹配的标题等内容。标题不是颜色或大小等简单的枚举;它必须平衡卖家意图、客户搜索行为和可发现性。这种复杂性,加上每天数以百万计的提交量,使得目录丰富成为自学习人工智能的理想试验场。

在这篇文章中,我们演示了 Amazon Catalog 团队如何使用 Amazon Bedrock 构建一个自学习系统,该系统不断提高准确性,同时大规模降低成本。

挑战

在生成式 AI 部署环境中,提高模型性能需要持续关注。由于模型处理数百万种产品,因此它们不可避免地会遇到边缘情况、不断发展的术语以及准确性可能会降低的特定领域模式。传统的方法——应用科学家分析故障、更新提示、测试更改和重新部署——虽然有效,但资源密集型,并且难以跟上现实世界的数量和多样性。挑战不在于我们是否可以改进这些系统,而在于如何使改进可扩展且自动,而不是依赖于人工干预。在 Amazon Catalog,我们直面这一挑战。这种权衡似乎是不可能的:大型模型可以提供准确性,但无法有效地扩展到我们的数量,而较小的模型则难以应对卖家最需要帮助的复杂、模糊的情况。

解决方案概述

但是我们是如何得到这个架构的呢?关键的见解来自一个意想不到的地方。

见解:化分歧为机遇

深入探讨:它是如何工作的

知识库:使学习具有可扩展性