使用应用推理配置文件

本文探讨了如何使用Amazon Bedrock的功能称为应用推理配置文件,以实现多租户AI部署的强大监视解决方案。我们演示了如何创建一个可以在复杂的多租户环境中启用颗粒状使用跟踪,准确的成本分配以及动态资源管理的系统。

来源:亚马逊云科技 _机器学习
成功的生成AI软件作为服务(SaaS)系统需要在服务可伸缩性和成本管理之间保持平衡。当构建旨在为大型,多样化的客户群服务的同时,在维持严格的成本控制和全面用法监控的同时,建立多租户生成的AI服务时,这将变得至关重要。对此类系统的传统成本管理方法通常会揭示限制。运营团队在准确地归因于各个租户的成本方面遇到挑战,尤其是当使用模式表现出极端可变性时。企业客户可能具有不同的消费行为 - 有些在高峰期经历突然使用峰值,而其他人则保持一致的资源消耗模式。强大的解决方案需要一个以上下文驱动的,多层的警报系统来超过常规监视标准。通过实施从绿色(正常操作)到红色(关键干预措施)的渐变警报级别,系统可以发展出智能的自动化响应,以动态适应不断发展的用法模式。这种方法可实现积极的资源管理,精确的成本分配以及快速,有针对性的干预措施,有助于防止潜在的财务超支。当您经历大量成本超支时,破裂点通常会出现。这些超支不是归因于一个因素,而是多个企业租户的组合增加了其使用情况,而您的监视系统无法尽早抓住趋势。您现有的警报系统可能只提供二进制通知(一切都很好或有问题)缺乏主动成本管理所需的细微,多层次方法。分层的定价模型使情况更加复杂,在该模型中,不同的客户具有不同的SLA承诺和使用配额。如果没有一个可以区分正常使用峰值和真正问题的复杂警报系统,您的操作团队可能会发现ITSE