详细内容或原文请订阅后点击阅览
如何选择合适的开源 LLM 进行生产
根据工作负载类型、基础设施限制、成本和实际性能为生产选择合适的开源 LLM 的实用指南。
来源:Clarifai博客 | 实际应用中的人工智能开源法学硕士和多模式模型稳步发布。许多人报告在推理、编码和文档理解的基准测试中取得了强劲的结果。
基准性能提供了有用的信号,但它并不能决定生产可行性。延迟上限、GPU 可用性、许可条款、数据隐私要求以及持续负载下的推理成本决定了模型是否适合您的环境。
在本文中,我们将概述一种结构化方法,用于根据工作负载类型、基础设施限制和可衡量的部署要求来选择正确的开源模型。
TL;DR
有效的模型选择从定义约束开始,然后再查看基准图表或发行说明。
在查看单个模型之前
大多数团队通过扫描发布公告或基准排行榜来开始模型选择。实际上,一旦定义了操作边界,决策空间就会显着缩小。
在评估单个基准之前,三个问题可以消除最不合适的选项。
