课程描述 理学硕士 - 数据科学 CISC7201 数据科学编程简介 本课程涵盖自然语言处理 (NLP) 中的基础和高级主题,涉及将计算模型应用于文本数据。在本课程中,将研究自然语言处理中的核心任务,包括最小编辑距离、语言建模、Nävie Bayes、最大熵、文本分类、序列标记、POS 标记、语法分析和计算词汇语义。将探索现代 NLP 应用,例如信息检索和统计机器翻译。学生将学习如何制定和调查相关主题的研究问题。先决条件:无 CISC7204 数据科学与数据可视化 本课程旨在使学生了解数据可视化在数据科学和大数据分析中的重要性,并培养使用数据可视化工具呈现定量数据的知识和技能。本课程强调数据科学的实践方面,重点是使用 R 或 Python 编程语言来处理数据、生成可视化效果并解释这些可视化效果。学生将学习数据清理、数据重塑、基本制表、聚合和可视化表示的实践,以增加对复杂数据和模型的理解。先决条件:无 CISC7203 数据库和数据挖掘技术本课程旨在让学生学习数据库和数据挖掘概念和技术,用于不同领域的大数据分析和开发。本课程专注于解决大数据问题的数据库和数据挖掘的实际问题。内容包括数据库和数据仓库中的数据建模、SQL、数据库的 Python 编程、数据挖掘应用的 Python 编程和 R 编程。学生将学习数据库建模、查询和编程的技能,以及数据挖掘的编程技术。先决条件:无 CISC7202 机器学习工具 本课程介绍机器学习 (ML) 基础知识、方法和算法,并使用现代软件工具(例如 Scikit-learn 和 PyTorch)进行大量实践。在第一次关于机器学习的入门讲座之后,该课程涵盖了 ML 的四个关键主题:1)回归技术,包括线性回归、岭和套索回归、最近邻和核回归;2)分类技术,包括逻辑回归决策树、提升和装袋、SVM 和朴素贝叶斯;3)聚类技术,包括 k 均值、层次聚类、DBScan 和混合模型;4)深度学习技术,包括神经网络基础、卷积神经网络和生成神经网络。 先决条件:数据科学编程专业化 A 简介:人工智能应用 CISC7013 人工智能原理 传统人工智能原理概述:问题解决和逻辑代理。 现代人工智能原理概述:机器学习、决策树、神经网络、支持向量机和深度学习简介。 先决条件:无
主要关键词