5 个适合初学者的有趣 NLP 项目

帮助初学者了解机器如何阅读、理解、生成和翻译人类语言的实践项目。

来源:KDnuggets
作者图片 |画布

# 简介

#

就我个人而言,我觉得计算机能够处理语言真是太神奇了。这就像看着婴儿学习说话,但是是用代码和算法。有时感觉很奇怪,但这正是自然语言处理(NLP)如此有趣的原因。你真的能让计算机理解你的语言吗?这是有趣的部分。如果这是您第一次阅读我的有趣项目系列,我只想澄清一下,这里的目标是通过突出显示一些您可以尝试的最佳实践项目(从简单到稍微高级的项目)来促进基于项目的学习。在本文中,我从主要 NLP 领域挑选了 5 个项目,以便您可以全面了解事物的工作原理,从基础知识到更多应用概念。其中一些项目使用特定的架构或模型,如果您了解它们的结构将会有所帮助。因此,如果您觉得需要先温习某些概念,请不要担心,我在结论部分添加了一些额外的学习资源:)

来自主要 NLP 领域的五个项目,以便您可以全面了解事物的运作方式

# 1. 从头开始构建分词器

项目 1:如何使用 Python 和 HuggingFace 构建 Bert WordPiece Tokenizer 项目 2:让我们构建 GPT Tokenizer

项目 1: 如何使用 Python 和 HuggingFace 构建 Bert WordPiece Tokenizer 项目 2: 让我们构建 GPT Tokenizer 拥抱脸 “让我们构建 GPT Tokenizer”,作者:Andrej Karpathy 黄金

# 2. NER 实际应用:识别姓名、日期和组织

项目 1:Python 中的命名实体识别 (NER):预训练和自定义模型项目 2:使用 BERT 构建实体提取模型

Python 中的命名实体识别 (NER):预训练和自定义模型 使用 BERT 构建实体提取模型 spaCy 拥抱脸部变形金刚 PyTorch TensorFlow

# 3. 文本分类:使用 BERT 预测情感

项目:文本分类 |使用 Huggingface、PyTorch 和 Python 进行 BERT 情感分析教程

项目:

# 结论