5个用于建造优化拥抱面孔管道的技巧 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

5个用于建造优化拥抱面孔管道的技巧

2025年9月12日 12:00 33 Comments

查看这五个简单而强大的技巧，可以为您的拥抱面部工作。

来源:KDnuggets

编辑图片| chatgpt

＃简介

＃

拥抱面已经成为许多AI开发人员和数据科学家的标准，因为它大大降低了与高级AI合作的障碍。开发人员可以不用从头开始使用AI模型，而是可以访问毫无麻烦的广泛鉴定模型。用户还可以通过自定义数据集对这些模型进行调整并快速部署它们。

拥抱脸

拥抱面框架API包装器之一是Transformers Pipelines，这是一系列由验证的模型组成的软件包，其令牌，其令牌，预处理和后处理以及相关组件以及与AI用例工作的相关组件。这些管道抽象复杂代码，并提供了一个简单的无缝API。

变形金刚管道

但是，使用变压器管道可能会变得凌乱，并且可能不会产生最佳管道。这就是为什么我们将探索五种不同的方式来优化变形金刚管道的方式。

让我们进入它。

＃1。批次推理请求

通常，使用变压器管道时，我们不会完全利用图形处理单元（GPU）。多个输入的批处理处理可以显着提高GPU利用率并提高推理效率。

您可以使用管道的batch_size参数或传递输入列表，而不是一次处理一个样本，以便模型在一个正向通过中处理多个输入。这是一个代码示例：

batch_size

来自变形金刚的导入管道

管道=管道（管道
    任务=“文本分类”，
    型号=“ distilbert-base-based-fineTuned-sst-2-英语”，
    device_map =“自动”
）

文字= [
    “很棒的产品和快速交货！”，
    “ UI令人困惑且缓慢。”，
    “支持很快解决了我的问题。”
    “不值得。”
这是给出的

结果=管道（文本，batch_size = 16，截断= true，padding = true）
对于结果，结果：
    打印（r）

通过批处理请求，您可以实现更高的吞吐量，而对延迟的影响只有最小的影响。

＃2。使用较低的精度和量化

＃3。选择有效的模型体系结构

pytorch

合作的延迟的输入提高较低的快速部署 API size 一系列图形处理变压器预处理解决 batch 软件包组件不同的验证的吞吐量体系结构科学家后处理拥抱有效的使用开发人员为什么方式工作的变形金刚简单的数据集管道 GPU 最小的 AI 模型组成的鉴定模型利用率输入的