机器学习,尤其是深度学习对分子和材料设计的影响越来越大。,鉴于越来越多地获得了用于药物降低的生成建模的高质量小分子数据,因此有望进行药物发现的结果。然而,对于许多重要的材料类别,例如催化剂,抗氧化剂和金属有机框架 - 不可用。这些样品有限和结构相似性的分子家族在工业应用中尤其普遍。众所周知,在如此小的数据集中进行了重新培训甚至微调。新颖的,实际上适用的分子通常是众所周知的分子的衍生物,提出了解决数据稀缺性的方法。为了解决这个问题,我们引入了大步,这是一种生成分子的工作流程,它以无条件的生成模型产生了新的分子,该模型由已知分子而没有任何重新培训。我们从一组高度专业的抗氧化剂分子中生成训练数据之外的分子。我们的发电分子平均降低了合成可及性评分的21.7%,并且通过指南将电离潜力降低了5.9%的产生分子。
主要关键词