GN 428生物学中的机器学习简介(3个学时)基因组学的新技术彻底改变了生物学,但是产生了大量数据,这些数据在从噪声中提取信号时提出了挑战。本课程将为学生提供操纵和整合不同类型的生物数据集的基本技能,并使用从基本到最新状态的数据分析工具来学习如何挖掘它们。机器学习方法提供了一个框架来分析大量的生物学信息并提取有意义的信号。在学期结束时,学生将接触过各种现代机器学习工具进行分类和预测。我们将重点介绍DNA数据(具有数百万种变体),表达数据(> 20,000个基因)和微生物组数据(数千个特征),并结合各种疾病/实验测量结果。该课程将使用可视化涵盖加载和探索数据集的基础知识,然后是基本的机器学习基本方法,包括分类和回归算法。