在 Amazon SageMaker AI 上部署 Mistral AI 的 Voxtral XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

在 Amazon SageMaker AI 上部署 Mistral AI 的 Voxtral

2025年12月22日 18:32 33 Comments

在本文中，我们演示了使用 vLLM 和自带容器 (BYOC) 方法在 Amazon SageMaker AI 终端节点上托管 Voxtral 模型。 vLLM 是一个用于服务大型语言模型 (LLM) 的高性能库，具有分页注意力以改进内存管理和张量并行性，以便跨多个 GPU 分发模型。

来源:亚马逊云科技 _机器学习

在 code/serving.properties 中配置您的模型：

要部署 Voxtral-Mini，请使用以下代码：

option.model_id=mistralai/Voxtral-Mini-3B-2507

option.tensor_parallel_ Degree = 1

要部署 Voxtral-Small，请使用以下代码：

option.model_id=mistralai/Voxtral-Small-24B-2507

打开并运行 Voxtral-vLLM-BYOC-SageMaker.ipynb 以部署端点并测试文本、音频和函数调用功能。

Docker 容器配置

GitHub 存储库包含完整的 Dockerfile。以下代码片段突出显示了关键部分：

FROM --platform=linux/amd64 vllm/vllm-openai:最新

图书馆代码配置音频必要的处理 properties 容器 model 模型的部署显示适当的服务器 serving 通用性突出 SageMaker 环境变量处理程序文件夹模型文本基础设施动态完整的不同的 Voxtral