详细内容或原文请订阅后点击阅览
研究人员瞥见蛋白质语言模型的内部工作
一种新方法可以揭示AI模型用于预测可能制造出好的药物或疫苗靶标的蛋白质的特征。
来源:MIT新闻 - 人工智能在过去的几年中,可以预测蛋白质的结构或功能的模型已被广泛用于多种生物应用,例如识别药物靶标和设计新的治疗抗体。
这些基于大语言模型(LLM)的模型可以非常准确地预测蛋白质对给定应用的适用性。但是,无法确定这些模型如何做出预测或哪些蛋白质特征在这些决策中起着最重要的作用。
在一项新的研究中,麻省理工学院的研究人员使用了一种新技术来打开“黑匣子”,并允许他们确定蛋白质语言模型在做出预测时要考虑的特征。了解黑匣子内部发生的事情可以帮助研究人员为特定任务选择更好的模型,从而简化识别新药或疫苗目标的过程。
“我们的工作对依赖这些表示形式的下游任务中的解释性具有广泛的影响,” MIT计算机科学和人工智能实验室计算机和生物学小组的Simons Mathematics教授Bonnie Berger说。 “此外,识别蛋白质语言模型的特征有可能揭示这些表现形式的新生物学见解。”
MIT研究生 Onkar Gujral是该研究的主要作者,该研究本周出现在美国国家科学院会议录中。 MIT研究生Mihir Bafna和MIT生物工程学教授Eric Alm也是该论文的作者。 国家科学院的会议记录。 打开黑匣子 引入 2021研究 但是,在所有这些研究中,不可能知道模型是如何做出预测的。 可解释的模型 该研究由美国国立卫生研究院资助。
Onkar Gujral是该研究的主要作者,该研究本周出现在美国国家科学院会议录中。 MIT研究生Mihir Bafna和MIT生物工程学教授Eric Alm也是该论文的作者。国家科学院的会议记录。
打开黑匣子 引入2021研究
但是,在所有这些研究中,不可能知道模型是如何做出预测的。
可解释的模型该研究由美国国立卫生研究院资助。