这是自然语言处理 (NLP) 的第一门课程,完成本课程后,学生可以继续学习更高级的材料。在本课程中,我们将回顾机器学习 (ML) 的基础知识,例如回归与分类、预处理、ML 模型、过度拟合、欠拟合和评估。此外,我们还将学习自然语言处理的基础知识,例如词性、词形还原、词干提取、命名实体识别、停用词、依存关系解析、单词和句子相似性、标记化、预处理功能、词云、文本摘要、关键字搜索、词袋、TF-IDF(词频 - 逆文档频率)和余弦相似性。此外,我们将运用机器学习和自然语言处理 (NLP) 的知识,使用 ML 模型、NLTK、spaCy 和其他 Python 库来实现该领域的一些热门项目。
InterPARES 2 术语定义:未发布的注册簿和已发布的超文本链接的词汇表、词典和同义词库目的:解释和映射 InterPARES 2 概念以供检索,并将它们与 InterPARES 2 注册簿之外使用的档案学术语联系起来定义:由机械计算机索引从 InterPARES 2 文档集合中生成的按字母顺序排列的单词列表,减去停用词加上研究人员创建的建议术语模型:索引软件程序的输出方法:由工作人员根据网站上的文档和共同研究人员的在线建议箱提交的内容创建发布为:仅为工作文件,不是最终术语词汇表的一部分定义:InterPARES 2 中使用的技术词汇和短语的字母顺序概念词汇表,其中每个单独的单词条目都有一个带有括号中的限定词信息的词条、词性、单个定义或含义,以及一个来自 InterPARES 2 文档的说明性引文,或从词条到 InterPARES 2 来源的超链接文档 el:Sue Elle mod n Wright 的 Web-Glossary FAQ rts 和研究以及附加的必需术语