蛋白质是构成生命并介导其内部机制的小成分。它们由氨基酸链组成,这些分子依次定义蛋白质序列。该序列的组成决定了蛋白质的三维结构。在这条线中,蛋白质的功能与其三维结构密切相关。通过实验实验确定蛋白质序列比确定其结构或功能更便宜,更容易。这就是为什么,可用序列的数量高于已知蛋白质结构和功能的数量。深度学习最近允许像实验室实验一样准确地从其序列中快速预测蛋白质结构。最近,蛋白质结构比较工具也提高了速度,从而可以进行大规模分析。蛋白质结构通常比其序列更相似,因此比较结构可以帮助检测远处的进化关系。蛋白质已从共同祖先改编成不同物种,以及它们重复并专门从事单个生物体,以实现相似的功能。是因为这个,如果两种蛋白质在进化上相关,则它们可能会共享诸如其一般功能之类的共同特征。结合了所有这些概念,我们可以从生物体的序列中预测所有未知的蛋白质结构,寻找具有相似结构和已知功能的蛋白质,并推断可能的功能,从而获得许多功能信息。通过结合这些高级方法并与大型数据集合作,研究人员可以从现有数据有价值的信息中提取以了解进化过程。这突出了如何将有关蛋白质结构预测和比较工具的最新进步结合起来,以解锁全新的方法并从笔记本电脑中启发进化机制。
主要关键词