单步反向合成旨在预测一组导致靶分子创建的反应,这在分子发现中是至关重要的任务。尽管靶分子通常可以通过多种不同的反应合成,但尚不清楚如何验证反应的可行性,因为可用的数据集仅覆盖了可能的溶液的一小部分。因此,不鼓励现有模型充分探索可能的反应空间。为了解决这些问题,我们首先提出了可行性阈值计数(FTC)度量,以估计与机器学习模型的反应可行性。sec- ond,我们开发了一种新型的逆合合成模型RetroGFN,它可以探索有限的数据集并返回一组可行的反应。我们表明,RetrogFN在FTC指标上的现有方法的幅度很大,同时在广泛使用的TOP-K精度度量上保持竞争性结果。
Reaxys Predictive Retrosynthesis 是与 Pending.AI 的 Mark Waller 博士合作开发的,它利用尖端的深度学习技术和来自最大化学反应数据库的高质量反应数据来生成科学上可靠的预测。
摘要:计算机辅助合成规划 (CASP) 旨在帮助化学家利用他们的实验、直觉和知识进行逆合成分析。机器学习 (ML) 技术(包括深度神经网络)的最新突破显著改善了无需人工干预的数据驱动合成路线设计。然而,通过 ML 学习化学知识进行实际合成规划尚未充分实现,仍然是一个具有挑战性的问题。在本研究中,我们开发了一个集成了各种逆合成知识的数据驱动 CASP 应用程序“ReTReK”,该应用程序将知识作为可调参数引入有希望的搜索方向的评估中。实验结果表明,ReTReK 成功地根据指定的逆合成知识搜索了合成路线,表明使用该知识搜索的合成路线比没有该知识的合成路线更受欢迎。将逆合成知识作为可调参数集成到数据驱动的 CASP 应用程序中的概念有望提高现有数据驱动的 CASP 应用程序和正在开发中的应用程序的性能。 ■ 引言自20世纪60年代以来,各种计算机辅助合成规划(CASP)应用程序被开发出来以模拟化学家的思维并帮助有机合成化学家开展工作。1 − 9 CASP 应用程序在合成的可定义部分(例如化学结构的特征和逆合成树的大小)中发挥了重要作用,而合成的不可定义部分(例如化学家的直觉)和在逆合成分析中贡献创造力的机会则留给了化学家。1作为化学家的直觉,Corey 形式化了逆合成的概念(逆合成知识)和主要类型的策略(例如基于变换和拓扑的策略)。他指出,通过同时使用尽可能多的不同的独立策略可以最有效地进行逆合成分析。 10 对于最优策略的选择,化学家的化学知识和他们的实验至关重要;特定合成问题的最优策略取决于所涉及的分子、人员和情况(例如,先导化合物的优化和候选药物的大规模合成)。11
对于一些合成化学家来说,在有机化学和酶化学界面处挖掘优势是一项挑战。化学酶合成规划工具可以有效地帮助识别小分子制造中的生物催化机会。计算机辅助合成规划 (CASP) 中的逆合成技术通过从目标开始并递归选择适当的断开连接,提出了从可用起始材料到目标的可行多步合成路线。从 50 多年前提出的有机化学早期 CASP 工具开始,7,8 这些方法已经得到改进,可以使用基于规则的方法和机器学习来概括已知反应,从而预测达到所需目标的实际有机合成路线。9 – 11 酶逆合成的最新发展显示出为酶开发类似的 CASP 工具的巨大潜力。12 – 15 Finnigan 等人最近整理了一小组经过专业编码的反应规则来描述用于生物催化的酶工具箱。 13 这些反应规则隐含地反映了不同酶类已确定的底物混杂性。这些规则所代表的酶已被证明在许多情况下适合酶工程,以接受新的底物。13 此外,它们还被成功地用于规划针对目标分子的生物催化级联。尽管 RetroBioCat 成功地规划了多步酶促途径,但它无法提出针对所需目标的化学酶促途径,该途径协同涉及有机和酶促方法。
HIV-1或人类免疫缺陷病毒1型,是一种全球大流行,影响了全球数百万个个体。作为该病毒生命周期的多功能酶,逆转录酶(RT)是药物发现的重要靶标。rt抑制剂主要分为两种类型:非核苷逆转录酶抑制剂(NNRTIS)和核苷逆转录酶抑制剂(NRTIS),尽管其他类别,例如核苷酸逆转录酶抑制剂(NRTIS),也存在。分子对接和药效团建模方法和DFT(密度功能理论)计算是HIV-1药物发现中的重要一步。在当前的研究中,我们在计算机方法中使用了探索新型苯咪唑唑酮(1,3-二氢-2H-2H-Benzimidazol-2-one)衍生物的结合模式。因此,对HIV-1 RT的野生型和突变形式进行了苯甲酰唑酮化合物,包括K103N,Y181C和双突变体K103N/Y181C。分子对接的结果使我们能够选择两种苯甲酰唑酮化合物(L15和L17)作为促进具有良好结合亲和力的抑制剂,不仅与野生型HIV -1(L15:-11.5:-11.5 kcal/mol/mol和L17:-11.4:11.4 kcal/mol),而且还针对Mol Y181和2 Kc/Mol Y181和2 lt Y181。 L17:-10.1 kcal/mol),K103N(L15:-11.5 kcal/mol和L17:-11.6 kcal/mol)和双突变体K103N/Y181C(L15:-11.1 kcal/mol/mol和L17:-9.9 kcal/mol)。此外,设计的配体的特征是基于ADMET(吸收,分布,代谢,排泄和毒性)的理想药代动力学特性。在这项工作结束时,对候选药物(L15和L17)进行了返回研究,以简化其合成。
问题 1,化学逆合成:化学逆合成试图提供可通过化学反应组合以合成所需分子的反应物。该过程定义了农业、医疗、材料发现等无数其他领域。图 1a 举例说明了逆合成过程,其中左侧的化学物质可以通过右侧的化学物质通过化学反应组合形成。在实验室中使用反复试验进行逆合成需要数年时间,甚至可能花费数十亿美元才能解决一种化学物质的问题。这导致人们对基于机器学习 (ML) 的解决方案产生了极大的兴趣。以前的工作已经能够产生有希望的结果,但也存在局限性。例如,专家定义的逆合成规则 [ 25 ] 依赖于人类对逆合成的不完全了解,并且随着更多规则的增加,其扩展性较差
我们基于蒙特卡洛树搜索形式主义引入了一种多目标搜索算法,以进行反归结计划。多目标搜索允许将各种目标组合起来,而无需考虑其规模或加权因素。为基于这种新型算法进行基准测试,我们在八个反曲面实验中采用了四个目标。目标范围从基于起始材料和步骤计数的简单目标到基于综合复杂性和路线相似性的复杂范围。我们表明,通过仔细的复杂目标,多目标算法可以优于单目标搜索,并提供更多样化的解决方案。但是,对于许多靶标化合物,单目标设置是等效的。尽管如此,我们的算法为合成计划中的特定应用程序纳入了新的目标。
天然产品的总合成可以追溯到1828年Wöhler的尿素合成,并达到了惊人的高度,可访问诸如奎宁,斯特雷宁,脊髓氧蛋白,紫杉醇和许多其他人作为合成策略的武器库和化学家的方法继续扩展的复杂天然产物。一种强大而统一的策略,用于实现复杂天然产物的整体合成的优雅而简洁的解决方案,这是递归合成的分析。首先是由科里(Corey)在化学合成逻辑中表达的,2又合成的分析已成为现代合成努力的基石,允许将复杂的天然产物对越来越简化的中间体进行反卷积,并最终可商业地使用。通过逆合合成实现的能力的增加促进了涵盖“理想综合”的想法的产生,亨德里克森3(Hendrickson 3
1 活动详情 ........................................1 2 欢迎和介绍 ........。。。。。。。。。。。。。。。。。。。。。。。。.1 3 复杂有机合成的计算机辅助设计,50 年后 .........1 4 收集分子:使用最少数据的表示和机器学习 ...4 5 用于学习异常值的 ML 和结构化矩阵方法简介 ......7 6 将AI应用于荒野中的逆向合成 ...................11 7 化学中的可重复性 ..............................13 8 在近期量子计算机上进行精确的激发态计算 ........14 9 理解预测路线:在 SciFinder 中使用数据作为预测的证据 .。。。。。。。。。。。。。。。。。。。。。。。。。...... div>..........16 10 假反应对于有效的数据驱动逆合成的重要性是什么分析?.....。。。。。。。。。。。。。。。。。。。。。。。。...... div>........17 11 将人工智能与化学中的结构化高质量数据相结合:提供出色的预测化学应用 ............. div>...17 12 从数据中获取情报:迈向有机金属催化预测 .. < /div>......18 13 化学本体与人工智能 .......... div>............21 14 UDM:社区-驱动的数据格式,用于交换全面的反应信息。.....。。。。。。。。。。。。。。。。。。。。。。.........24 15 通过机器学习进行逆合成 ..........................26 16 从机制到反应选择性 ..........................29 17 使用混合机械和机器学习模型进行过程化学中的反应预测 ........。。。。。。。。。。。。。。。。。。。。。。。。......31 18 从专利文献中自动挖掘 930 万个反应的数据库,并将其应用于合成规划 ................33 19 语义实验室 ................................37 20 ASKCOS:数据驱动的化学合成 .........。。..............38 21 将人工智能与强大的自动化化学相结合:人工智能驱动的路线设计和自动化反应和路线验证 .........。。。。。。。。。。。。。。。42 22 用于运行化学程序的非确定性化学计算机。。。。。。。.....45 23 数据驱动的催化还原胺化反应探索 ........48 24 用于有机合成的机器辅助流动化学 ................50 25 编码溶剂和产品结果以改进反应预测系统 ..51 26 用于定向执行和优化化学反应的进化计算策略和反馈控制 ..............................54 27 通过金属驱动的自组装进行计算设计:从分子构建块到新兴功能材料。。。。。。。。。。。。。。。。。。。。。。。。。56 28 评估加氢反应条件的预测模型 ..........59 29 面向执业化学家的逆合成软件:在实验室中验证的新颖高效的计算机途径设计 。....................。。。61 30 结论。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。63 参考文献。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。63