摘要:我将提供有关FoldSeek的更新,该更新可以通过Uniprot50进行结构相似性搜索和对齐方式,并在几秒钟内以与Tmalign相似的灵敏度(search.foldseek.com),在几秒钟内,在几秒钟内,在几秒钟内,在几秒钟内通过Uniprot50进行结构相似性搜索和对齐。的核心是我们使用离散的变异自动编码器学到的3I结构字母。i还将提出SpaceDust,这是一种基于基因组和企鹅之间“位置直系同源物”簇的快速序列和基于结构的搜索工具,这是我们新的应变分辨的病毒元组汇编器。
CATH(https://www.cathdb.info)从PDB中的实验蛋白结构和Alphafold数据库(AFDB)中预测的结构中分类的域结构。为了应对预测数据的规模,已经开发出一种新的NextFlow工作流量(Cath-Alphaflow),以将高质量的域分类为CATA超家族,并识别新颖的折叠组和超家族。Cath-Alphaflow使用一种新型的基于结构的结构域边界预测方法(Chainsaw)来识别多域蛋白质中的域。我们将CATA-AlphaFlow应用于未在21种模型生物体中的CATH和AFDB结构中分类的PDB结构,使CATH扩大了100%以上。域用于播种新颖的折叠,从PDB结构(2023年9月发行)中提供253个新折叠,而来自21个模型器官的蛋白质组织的AFDB结构中有96个。在可能的情况下,使用(i)从AFDB/uniprot50中的结构亲戚的注释中获得(i)预测(i)预测功能注释。我们还预测了功能部位和高度保守的残基。有些折叠与重要功能有关,例如光合作用的适应(感染植物),铁粘酶活性(在真菌中)和产后精子发生(在小鼠中)。Cath-Alphaflow将使我们能够在AFDB中识别更多的天主关系,从而进一步构成蛋白质结构景观。2024作者。由Elsevier Ltd.这是CC下的开放式访问文章(http://creativecom- mons.org/licenses/4.0/)。
