详细内容或原文请订阅后点击阅览
ProVenTL:用于预测源自蛇毒的肽-蛋白质相互作用的迁移学习框架,用于癌症治疗
ProVenTL:用于预测来自蛇毒的肽-蛋白质相互作用用于癌症治疗的迁移学习框架摘要肽-蛋白质相互作用(PepPI)的准确预测对于推进基于肽的抗癌药物设计至关重要。在本研究中,我们介绍了 ProVenTL,这是一种计算机辅助分子设计框架,它利用迁移学习和蛋白质语言模型嵌入来增强 PepPI 预测的准确性和可解释性。探索了两种互补策略:(i) 使用 Calloselasma rhodostoma 毒液肽和癌症相关蛋白的精选数据集对来自蛋白质数据库 (PDB) 的大规模 PepPI 数据进行预训练的 CAMP 模型,以及 (ii) 将 ProtT5 嵌入与堆叠自动编码器深度神经网络 (SAE-DNN) 和 TabNet 分类器集成。使用标准分类指标针对基线配置和代表性深度学习方法对模型进行全面基准测试,同时通过功能丰富和顶级预测的路径分析来评估生物相关性。与基线配置和传统的深度学习方法相比,基于 ProtT5 的 SAE-DNN 模型取得了最佳性能(准确度 = 0.78;ROC-AUC = 0.86),证明了在小型、特定领域的毒液肽数据集上改进的泛化能力。该模型确定了 TRBC2、CD274、HIF1AN、PCSK9 和 PLAU 等与通路 i 相关的关键靶点
来源:Arácnido准确预测肽-蛋白质相互作用 (PepPI) 对于推进基于肽的抗癌药物设计至关重要。在本研究中,我们介绍了 ProVenTL,这是一种计算机辅助分子设计框架,它利用迁移学习和蛋白质语言模型嵌入来增强 PepPI 预测的准确性和可解释性。探索了两种互补策略:(i) 使用 Calloselasma rhodostoma 毒液肽和癌症相关蛋白的精选数据集对来自蛋白质数据库 (PDB) 的大规模 PepPI 数据进行预训练的 CAMP 模型,以及 (ii) 将 ProtT5 嵌入与堆叠自动编码器深度神经网络 (SAE-DNN) 和 TabNet 分类器集成。使用标准分类指标针对基线配置和代表性深度学习方法对模型进行全面基准测试,同时通过功能丰富和顶级预测的路径分析来评估生物相关性。与基线配置和传统深度学习方法相比,基于 ProtT5 的 SAE-DNN 模型取得了最佳性能(准确度 = 0.78;ROC-AUC = 0.86),展示了在小型、特定领域的毒液肽数据集上改进的泛化能力。该模型确定了 TRBC2、CD274、HIF1AN、PCSK9 和 PLAU 等关键靶标,这些靶标与免疫抑制、缺氧调节、脂质代谢和转移等途径相关。这项研究强调了迁移学习和蛋白质语言模型在数据有限的情况下用于 PepPI 预测的实用性,并建立了一个计算框架,用于优先考虑蛇毒衍生肽,以用于抗癌药物发现和未来的实验验证。
Adhiva, J., Pradana, H.A., Kusuma, W.A.et al.ProVenTL:用于预测蛇毒衍生的肽-蛋白质相互作用用于癌症治疗的迁移学习框架。J Comput Aided Mol Des 40, 90 (2026).https://doi.org/10.1007/s10822-026-00801-w
