详细内容或原文请订阅后点击阅览
10 Python单线以优化您的拥抱脸部变压器管道
在本文中,我们提出了10个功能强大的Python单线,可帮助您优化拥抱的Face Pipeline()工作流程。
来源:KDnuggets#简介
#拥抱面孔变压器库已成为自然语言处理(NLP)和(大型)语言模型(LLM)任务的首选工具包。它的管道()函数是一个重要的抽象,使数据科学家和开发人员能够执行复杂的任务,例如文本分类,摘要和命名的实体识别,并以最少的代码行识别。
拥抱面孔变压器pipeline()
虽然默认设置非常适合入门,但是一些小的调整可以显着提高性能,改善内存使用情况并使您的代码更强大。在本文中,我们介绍了10个强大的Python单线,可帮助您优化拥抱的Face Pipeline()工作流程。
#1。用GPU加速加速推理
最简单但最有效的优化之一是将模型及其计算移至GPU。如果您有一个启用了CUDA的GPU,则指定设备是一个参数更改,可以通过数量级加速推断。
classifier = pipeline(“情感 - 分析”,模型=“ distilbert-base-based-fineTuned-sst-2-英语”,设备= 0)
这个单线告诉管道将模型加载到第一个可用的GPU上(设备= 0)。对于仅CPU推断,您可以设置设备= -1。
设备= 0
设备= -1
#2。用批处理处理多个输入
您可以一次处理文本列表,而不是将单个输入迭代和馈送到管道中,然后完全传递它们。使用批处理可以显着改善吞吐量,通过允许模型在GPU上执行并行计算。
结果= text_generator(list_of_texts,batch_size = 8)
在这里,list_of_texts是字符串的标准python列表。您可以根据GPU的内存能力来调整批次_size,以获得最佳性能。
list_of_texts
batch_size
#3。使用HalfEcision
张量核心float16
火炬
pytorch
导入火炬
#4。将子字与聚合策略分组
gentregation_strategy