MultiTox: A sequence-based stacked ensemble model for multiclass protein toxin classification
多毒素:一种基于序列的堆叠集合模型,用于多类蛋白毒素分类,以示意毒素蛋白的结构和功能多样性对于阐明大分子分子行为,机械变异性和结构驱动的生物活性至关重要。传统方法主要集中于二进制毒性预测,从而有限地解决了不同的毒素作用模式。在这里,我们提出了基于分子的作用模式:神经毒素,细胞毒素,血状毒素和肠毒素的分类的多毒素,用于分类毒素蛋白的合奏堆叠框架。我们策划了24,756种蛋白质(20,361毒素和4395个非毒素)的综合数据集,并提取了编码进化,结构和生物化学特征的高维ESM-2嵌入。两层堆叠框架集成了LGBM,MLP,ET,KNN和QDA作为基本分类器,XGBoost作为元分类器。 Multit
c末端修饰从蝎子葡萄球菌捕获了杂体-1的葡萄球菌样区域的抗菌活性,抗多药耐药病原体的兴起已成为严重的健康问题,从而迫切需要新型治疗方法。在探索的化合物中,由于其广谱活动和耐药性发展的倾向低,AMP已成为有前途的候选者。但是,它们的临床实施受到不当规模,体内不稳定性和毒性的限制。在这里,我们通过(1)完整的CEHS-1,(2)氨基酸取代,(3)末端标记和(4)C末端障碍的CEHS-1简短类似物。结果表明,与RWW拉伸融合的短类似物比母体类似物表现出更强的抗菌活性,而没有诱导人类红细胞溶血。在测试的AMP中,机械研究揭示了某些肽对金黄色葡萄球菌的膜 - 消失活性。在计算机分析中还表明,类似物通过平