摘要:Type-v-f cas12f蛋白,也称为Cas14,由于其紧凑的大小,在不同的CRISPR-CAS核中引起了显着的兴趣。这项研究涉及通过采矿,序列比较,系统发育分析和阵列/重复分析来分析和比较原核生物基因组中的Cas14-词素蛋白。在我们的分析中,我们识别并挖掘了总共93种CAS14-学蛋白,大小从344 AA到843 AA不等。在该分析中发现的大多数CAS14-词素蛋白都在Firmicutes组中发现,其中包含37种,占所有CAS14-词素蛋白的42%。在古细菌中,DPANN组的物种数量最多,其中包含CAS14-同源蛋白,总共三种。系统发育分析结果表明,Cas14-词素蛋白分为三个进化枝:Cas14-A,Cas14-B和Cas14-U。通过三个进化枝的域比较在C末端(CTD)上观察到广泛的相似性,这表明由于该区域中切割域的存在,可能存在潜在共享的作用机理。此外,对所有识别的CAS14序列的序列相似性分析表明,蛋白质变体之间的相似性水平较低(18%)。对认同的Cas14-学蛋白的扩展核苷酸序列中重复/阵列的分析强调,在总开采蛋白中具有CRISPR相关的重复序列中有44个,其中20个是CAS14。我们的研究有助于增加对原核生物基因组Cas14蛋白的了解。这些同源蛋白具有将来在CAS14蛋白的采矿和工程中应用的潜力。