我们提出了一种用于使用反应微笑来计算化学反应的原子经济算法的实施。Python编程用于连接RDKIT库来解析和解释化学结构,从而提供准确有效的化学可持续性计算。通过实施强大的算法来处理化学计量系数和多种反应,该方法对原子经济进行了全面的分析,这是绿色化学实践必不可少的指标。此外,这种计算方法可以轻松地集成到产生大量化学反应的AI应用中,作为筛选和优化步骤,进一步增强了可持续化学过程设计的潜力。我们通过几个案例研究证明了它的应用,强调了其有助于设计更可持续的化学过程的潜力。我们使用阿司匹林及其多个合成路线证明了这种方法。
在人类与疾病的长期斗争中,药物发挥着越来越重要的作用。药物发现是识别潜在的新治疗实体的过程,而药物设计是基于对生物靶标的了解寻找新药物的过程,涉及分子的设计(Zhou and Zhong,2017)。药物发现和设计一直面临障碍,因为需要大量的人力、物力和财力。随着人工智能在图像处理、模式识别和自然语言处理等领域的成功(Xie et al.,2022),深度生成模型在药物发现领域引起了广泛关注,同时在分子设计优化领域也展现出良好的应用前景。当使用生成模型生成分子时,其实质是学习训练集中分子的分布,然后生成与训练集中分子相似但不同的分子。结合进化算法或强化学习,可以进一步优化生成分子的性质(Tong et al.,2021;Tan et al.,2022a)。生成模型中的分子表示可以有多种形式,包括简化的分子输入行输入系统(SMILES)、分子图等。生成模型大致可分为五类,包括循环神经网络(RNN)、自编码器(AE)、生成攻击网络(GAN)、Transformer和结合强化学习(RL)的生成模型(Bhisetti and Fang,2022),如图1A所示。其中基于文本序列的分子生成模型(SMILES)应用最为广泛。本文简单介绍基于最新的文本序列分子设计(SMILES)的深度生成模型的基本原理及应用,以便读者了解深度生成模型并将其更好地运用在药物分子设计中。