抽象动机:人类基因组学的最新进展表明,单个蛋白质中的错义突变会导致明显不同的表型。尤其是,RAS,MEK,PI3K,PTEN和SHP2等癌蛋白中的某些突变与各种癌症和神经发育障碍(NDDS)相连。虽然存在许多用于预测错义突变的致病性的工具,但将这些变体与某些表型联系起来仍然是一个主要挑战,尤其是在个性化医学的背景下。结果:为了填补这一空白,我们开发了质量(蛋白质表型突变分析仪),利用多种可预修建的机器学习方法并整合了多样化的生物物理学和基于网络动态的特征,以预测同一蛋白质突变的范围,可以促进癌症或NDD。我们通过对PI3Kα和PTEN的两种蛋白质病例的突变分析来说明质量在Phe-Notypes(癌/NDDS)预测中的效用。与其他七种预测工具相比,质子表现出了与癌症和考登综合征相关的PI3Kα突变的AUROC 0.8501的预测表型效应方面具有非凡的精度。对于与癌症,PHT和HCP相关的PTEN突变的多型预测,质子可以通过微观触觉实现0.9349的AUC。使用Shap模型的解释,我们对驱动表型形成的机制获得了见解。还提供了一个用户友好的网站部署。可用性:源代码和数据可在https://github.com/spencer-jrwang/protphemut上找到。我们还提供一个用户友好的网站,网址为http://netprotlab.com/protphemut。补充信息:可以在线生物信息学上获得补充数据。图形摘要:
主要关键词