计算生物学和生物信息学深度学习教程:从 DNA 到蛋白质折叠和 alphafold2

一本自学指南,用于理解将深度学习应用于生物学和生物信息学所必需的生物学概念,重点关注蛋白质折叠和 alphafold2 相关内容

来源:AI夏令营

AlphaFold 2 论文和代码终于发布了。这篇文章旨在激励新一代机器学习 (ML) 工程师专注于基础生物学问题。

这篇文章收集了核心概念,以便最终掌握 AlphaFold2 之类的东西。我们的目标是让这篇博文在生物学方面尽可能地自我完善。因此,在本文中,您将了解:

    生物学的中心法则蛋白质和蛋白质水平氨基酸、核苷酸和密码子蛋白质结构特征,如域、基序、残基和转角分布图表型和基因型多序列比对可以用 MLA 处理的生物学任务生物学与 ML 模型设计的关联
  • 生物学的中心法则
  • 生物学的中心法则

  • 蛋白质和蛋白质水平
  • 蛋白质和蛋白质水平

  • 氨基酸、核苷酸和密码子
  • 氨基酸、核苷酸和密码子

  • 蛋白质结构特征,如域、基序、残基和转角
  • 蛋白质结构特征,如域、基序、残基和转角

  • 距离图
  • 距离图

  • 表型和基因型
  • 表型和基因型

  • 多序列比对
  • 多序列比对

  • 可以用 ML 处理的生物学任务
  • 可以用 ML 处理的生物学任务

  • 生物学与 ML 模型设计的关联
  • 生物学与 ML 模型设计的关联

    我们假设您没有生物学背景,但有一点 ML 背景。

    我们假设您没有生物学背景,但有一点 ML 背景。

    没有

    首先,让我们将自己置于更广泛的背景中。我选择的精彩介绍是 Ken Dill 在 TEDx 上的演讲:

    这几乎就是 2013 年科学界的现状。谁能想到深度学习会渗透到如此小众的领域!甚至更进一步,创建最大的蛋白质公共数据库:

    数据库 AlphaFold 的蛋白质结构数据库

    如果这激发了你的好奇心,那就来尝试一些完全不同的东西吧!

    最低生物学先决条件

    DNA

    互补

    RNA

    mRNA