Loading...
机构名称:
¥ 2.0

以扩散模型的出现作为生成模型的前线,许多研究人员提出了通过条件扩散模型的分子产生技术。但是,分子的不可避免的离散性使扩散模型很难将原始数据与自然语言等高度复杂的条件连接起来。为了解决这个问题,我们提出了一种新型潜在扩散模型,称为文本条件分子的生成。ldmol构建了一种分子自动编码器,该自动编码器可产生可学习且结构上的特征空间,并具有自然语言条件的潜在扩散模型。特别是认识到多个微笑符号可以代表相同的分子,我们采用对比度学习策略来提取特征空间,以了解分子结构的独特特征。ldmol优于文本到整体生成基准的现有基准,建议扩散模型可以在文本数据生成中胜过自回旋模型,而潜在的潜在域则更好。此外,我们表明LDMOL可以应用于下游任务,例如分子到文本检索和文本引导的分子编辑,表明其作为扩散模型的多功能性。

ldmol:文本到 - 分子扩散模型

ldmol:文本到 - 分子扩散模型PDF文件第1页

ldmol:文本到 - 分子扩散模型PDF文件第2页

ldmol:文本到 - 分子扩散模型PDF文件第3页

ldmol:文本到 - 分子扩散模型PDF文件第4页

ldmol:文本到 - 分子扩散模型PDF文件第5页