肽与主要组织相容性复合物(MHC)分子之间的相互作用在自身免疫,病原体识别和肿瘤免疫方面是关键的。癌症免疫疗法的最新进展需求需要更准确的MHC结合肽计算预测。我们解决了与MHC结合的肽预测的普遍性挑战,从而揭示了当前基于序列的方法的局限性。我们利用几何深度学习(GDL)的基于结构的方法表明,在看不见的MHC等位基因的普遍性方面有望提高。此外,我们通过在结构(3D-SSL)上引入一种自我监督的学习方法来解决数据效率。在不暴露于任何绑定亲和力数据的情况下,我们的3D-SSL优于基于序列的方法,该方法在〜90倍的数据点上训练。最后,我们证明了基于结构的GDL方法对乙型肝炎病毒疫苗免疫肽疗法案例研究的结合数据的偏见。这项概念验证研究强调了基于结构的方法增强通用性和数据效率的潜力,对数据密集型领域(如T细胞受体特异性预测预测)具有重要意义,为增强对免疫反应的理解和操纵铺平了道路。
主要关键词