详细内容或原文请订阅后点击阅览
学习如何将变压器与拥抱面和Spacy
用Spacy掌握NLP:第4部分帖子学习如何使用HuggingFace和Spacy的变压器首先出现在数据科学方面。
来源:走向数据科学简介
NLP的艺术体系结构的状态不仅是。 Chatgpt,Llama和Gemma之类的现代模型是基于2017年引入的这种架构,这是Vaswani等人所需的论文。
在上一篇文章中,我们看到了如何使用Spacy完成多个任务,您可能已经注意到我们从来没有训练任何东西,但是我们利用了Spacy功能,这主要是基于规则的方法。
上一篇文章Spacy还提供了在NLP管道可训练的组件中插入的,或使用🤗huggingface Hub的架子上的型号,该组件是一个在线平台,它为AI开发人员提供了开源模型。
🤗因此,让我们学习如何将Spacy与Hugging Face的模型一起使用!
为什么要变压器?
在变压器之前,SOTA架构创建单词的向量表示是单词矢量技术。单词向量是一个单词的密集表示,我们可以用它来对其进行一些数学计算。
字向量例如,我们可以观察到具有相似含义的两个单词也具有相似的向量。这种最著名的技术是手套和fastText。
手套 fastText这些方法引入了一个大问题,一个词总是由同一向量表示。但是一个词并不总是具有相同的含义。
例如:
- “她去银行撤回了一些钱。”“他坐在河岸坐在河岸,看着水流。”
在这两个句子中,银行一词假定了两个不同的含义,因此总是用相同的向量表示单词是没有意义的。
使用基于变压器的体系结构,我们今天能够创建模型,以考虑整个上下文以生成单词的矢量表示。
考虑整个上下文的模型