(How to) Make Paris' Arachnids collections great again?
(如何)使巴黎的Arachnids系列再次出色?法国自然历史博物馆的Arachnid系列是世界上最大的。 It includes a total of about 3 million specimens from the twelve orders of arachnids: spiders (2 million specimens), scorpions (10,000), parasitiforms and acariforms (together as acari, 30,000), pseudoscorpions (7,000), opilions (4,500), amblypygi
MultiTox: A sequence-based stacked ensemble model for multiclass protein toxin classification
多毒素:一种基于序列的堆叠集合模型,用于多类蛋白毒素分类,以示意毒素蛋白的结构和功能多样性对于阐明大分子分子行为,机械变异性和结构驱动的生物活性至关重要。传统方法主要集中于二进制毒性预测,从而有限地解决了不同的毒素作用模式。在这里,我们提出了基于分子的作用模式:神经毒素,细胞毒素,血状毒素和肠毒素的分类的多毒素,用于分类毒素蛋白的合奏堆叠框架。我们策划了24,756种蛋白质(20,361毒素和4395个非毒素)的综合数据集,并提取了编码进化,结构和生物化学特征的高维ESM-2嵌入。两层堆叠框架集成了LGBM,MLP,ET,KNN和QDA作为基本分类器,XGBoost作为元分类器。 Multit