aws

在构建生成AI应用程序时,组织越来越多地使用多种大型语言模型(LLM)。尽管单独的LLM可以具有很高的能力,但它可能无法最佳地解决广泛的用例或满足各种性能要求。多LLM方法使组织能够有效地为每个任务选择正确的模型,并适应不同的[…]

来源:亚马逊云科技 _机器学习
在构建生成AI应用程序时,组织越来越多地使用多种大型语言模型(LLM)。尽管单独的LLM可以具有很高的能力,但它可能无法最佳地解决广泛的用例或满足各种性能要求。多LLM方法使组织能够有效地为每个任务选择正确的模型,并适应不同的域,并针对特定的成本,延迟或质量需求进行优化。这种策略会产生更强大,多功能和高效的应用程序,可以更好地满足各种用户需求和业务目标。驱逐多个LLLM应用程序会带来挑战,即挑战将每个用户提示路由到适当的LLM来完成预期的任务。路由逻辑必须准确地将提示解释为预定义的任务之一,然后将其引导到该任务的分配的LLM。在这篇文章中,我们概述了常见的多LLM应用程序。然后,我们探索在这些应用程序中实施有效的多LLM路由的策略,讨论影响选择和实施此类策略的关键因素。最后,我们提供示例实现,您可以将其用作自己的多LLLM路由部署的起点。浏览常见的多数LLM应用程序以下是您可能选择在应用程序中使用多LLLM方法的常见方案:多个任务类型:许多任务类型 - 许多用途案例需要在同一应用程序中处理不同的任务类型。例如,营销内容创建应用程序可能需要执行任务类型,例如文本生成,文本摘要,情感分析和信息提取,作为生产高质量的个性化内容的一部分。每种不同的任务类型都可能需要单独的LLM,也可能对自定义数据进行微调。多名任务复杂度级别 - 某些应用程序旨在处理单个任务类型,例如文本摘要或问题答案