优化 AWS 上生成式 AI 应用程序的成本

优化 AWS 上生成式 AI 应用程序的成本对于充分发挥这项变革性技术的潜力至关重要。本文概述了关键的成本优化支柱,包括模型选择和定制、代币使用、推理定价计划和矢量数据库注意事项。

来源:亚马逊云科技 _机器学习

麦肯锡公司发布的报告《生成式人工智能的经济潜力:下一个生产力前沿》估计,生成式人工智能可以为全球经济增加 2.6 万亿至 4.4 万亿美元的价值。最大的价值将来自四个领域:客户运营、营销和销售、软件工程和研发。

生成式人工智能的经济潜力:下一个生产力前沿 生成式人工智能

如此巨大的商业价值潜力正在激励成千上万的企业在 AWS 中构建他们的生成式人工智能应用程序。然而,许多产品经理和企业架构师领导希望更好地了解成本、成本优化杠杆和敏感性分析。

这篇文章解决了这些成本考虑因素,以便您可以优化 AWS 中的生成式人工智能成本。

本文假设读者对 AWS 中的基础模型 (FM) 和大型语言模型 (LLM)、标记、向量嵌入和向量数据库有基本的了解。检索增强生成 (RAG) 是生成式 AI 解决方案中最常用的框架之一,本文在 RAG 解决方案的背景下解释了成本以及 Amazon Bedrock 上相应的优化支柱。

Amazon Bedrock

在本系列的第 2 部分中,我们将介绍如何估算业务价值及其影响因素。

成本和性能优化支柱

设计高性能且具有成本效益的生成式 AI 应用程序对于充分发挥这项变革性技术的潜力并推动组织内的广泛采用至关重要。

预测和管理生成式 AI 应用程序中的成本和性能由以下优化支柱驱动:

  • 模型选择 - 此过程涉及确定满足各种用例的最佳模型,然后进行模型验证,在此过程中,您将根据高质量数据集和提示进行基准测试,以确定成功的模型竞争者。
  • 检索增强生成

    知识库 。 小