Loading...
机构名称:
¥ 1.0

质谱法在阐明未知分子的结构和随后的科学发现中起着基本作用。结构阐明任务的一种结构是给定质量谱的分子结构的有条件生成。朝着针对小分子的更有效和有效的科学发现管道,我们提出Diffms,这是一个由公式限制的编码码头生成网络,可在此任务上实现最先进的性能。编码器利用变压器档位,并模型质谱域知识,例如峰值公式和中性损耗,而解码器是一个离散的图形扩散模型,该模型受已知化学公式的重原子组成限制。为了开发一个桥梁解码器,它可以弥合潜在的嵌入和分子结构,我们用指纹结构对预处理扩散解码器,这些解码器几乎以无限的量为单位,与结构 - 光谱对相对,以数千的数量为单位。在已建立的基准上进行的广泛实验表明,DIFFMS在从头分子上构成现有模型。我们提供了几种消融,以揭示我们扩散和预训练方法的有效性,并随着预训练的数据集尺寸的增加而显示出一致的穿孔缩放。DIFFMS代码可在https://github.com/coleygroup/diffms上公开获得。

diffms:以质谱为条件的分子的扩散产生

diffms:以质谱为条件的分子的扩散产生PDF文件第1页

diffms:以质谱为条件的分子的扩散产生PDF文件第2页

diffms:以质谱为条件的分子的扩散产生PDF文件第3页

diffms:以质谱为条件的分子的扩散产生PDF文件第4页

diffms:以质谱为条件的分子的扩散产生PDF文件第5页