在材料设计中,目标是确定可以在某些起始材料或物质上执行的化学和物理操作的途径,以将其转换为所需的目标材料。这项研究的目的是证明在自动实验室中基于目标的增强学习(RL)的潜力。我们的实验表明,当给出一个目标(例如目标材料)和一组初始材料时,RL可以学习实现该目标的一般途径。我们假设训练有素的RL化学家可以通过学习完成重复性,劳动密集型和/或需要高度精确度的任务来帮助减少这些及相关ELDS的实验时间和成本。随着模拟复杂性的增加,训练有素的RL化学师可能会在该系统中发现新材料和/或反应途径。为了支持这一点,我们共享允许科学家和
本文提供了一个模拟实验室,用于利用化学疾病的增强学习(RL)。由于RL是相当数据密集型的,因此在现实世界中采取行动是“现场”的培训代理人,这是可能的,而且可能很危险。此外,化学过程和发现涉及挑战,这些挑战在RL基准测试中并不常见,因此提供了丰富的工作空间。我们推出了一组高度可定制的开源RL环境,Chem-Gymrl,实施了标准的体育馆API。ChemGyMRL支持一系列相互连接的虚拟化学台,RL代理可以在其中操作和训练。本文使用众所周知的化学反应作为说明性示例介绍和详细信息,并在每个台下训练一组标准的RL算法。最后,除了将未来工作的方向列表列表以外,还提供了几种标准RL方法的性能的讨论和比较,以此作为进一步开发和使用ChemGyMRL的愿景。