摘要 在药物发现中,生成具有所需生物活性的分子引起了越来越多的关注。先前的分子生成模型被设计为以化学为中心的方法,几乎不考虑药物-靶标相互作用,从而限制了它们的实际应用。在本文中,我们旨在以靶标感知的方式生成分子药物,以将生物活性和分子设计联系起来。为了解决这个问题,我们从几个公开可用的数据集中编制了一个基准数据集,并在统一的框架中构建基线。基于基于流的分子生成模型的最新优势,我们提出了 SiamFlow,它强制流适应潜在空间中目标序列嵌入的分布。具体而言,我们采用对齐损失和均匀损失来使目标序列嵌入和药物图嵌入达成一致,同时避免崩溃。此外,我们通过学习目标序列嵌入的空间将对齐形式化为一对多问题。实验定量表明,我们提出的方法可以在潜在空间中学习有意义的表示,从而生成目标感知的分子图,并为药物发现中连接生物学和化学提供了一种替代方法。
主要关键词