基于结构的药物设计 (SBDD) 旨在生成与特定蛋白质靶点结合的 3D 配体分子。现有的 3D 深度生成模型(包括扩散模型)已显示出对 SBDD 的巨大潜力。然而,在 3D 空间中精确捕捉分子生成所必需的蛋白质-配体相互作用非常复杂。为了解决这个问题,我们提出了一个新颖的框架,即结合自适应扩散模型 (BIND DM)。在 BIND DM 中,我们自适应地提取子复合物,即负责蛋白质-配体相互作用的结合位点的基本部分。然后,使用 SE(3) 等变神经网络处理选定的蛋白质-配体子复合物,并将其传输回复合物的每个原子,以通过结合相互作用信息增强靶标感知的 3D 分子扩散生成。我们利用跨层级相互作用节点迭代此层级复合物-子复合物过程,以充分融合复合物与其相应子复合物之间的全局结合上下文。在 Cross-Docked2020 数据集上进行的实证研究表明,B IND DM 可以生成具有更逼真三维结构和更高蛋白靶标结合亲和力的分子,平均 Vina 评分最高可达 -5.92,同时保持适当的分子特性。我们的代码可在 https://github.com/YangLing0818/BindDM 获取。
我们建立了一个机器学习模型,使用以无监督方式在随机生成的状态上训练的神经网络来检测三量子比特系统中的相关性。网络被迫识别可分离状态,并将相关状态检测为异常。令人惊讶的是,我们发现所提出的检测器在区分较弱形式的量子相关性(即量子不和谐)方面的表现比纠缠要好得多。事实上,即使在纠缠检测的最佳阈值下,它也倾向于严重高估纠缠状态集,而低估不和谐状态集的程度要小得多。为了说明被归类为量子相关的状态的性质,我们构建了一个包含各种类型状态的图表——纠缠、可分离、不和谐和非不和谐。我们发现,识别损失的接近零值可以高精度地再现非不和谐可分离状态的形状,尤其是考虑到该集合在图上的非平凡形状。网络架构经过精心设计:它保留了可分离性,并且其输出相对于量子比特排列是等变的。我们表明,架构的选择对于获得最高的检测准确率非常重要,比仅使用部分跟踪操作的基线模型要好得多。
传统的药物设计方法是昂贵的,并且由于其对试验过程的依赖而耗时。因此,为分子生成任务设计的计算方法,包括扩散模型,已获得显着的牵引力。尽管有潜力,但他们仍面临着批评性能令人难以置信的产出。我们通过有条件训练一个能够产生不同结构合理水平的分子的扩散模型来减轻此问题。这是通过在训练数据集中添加畸变的分子,然后用标签来注释每个分子的标签来实现,从而代表其变形的程度,从而及其质量。通过训练模型,以区分有利和不利的分子构象与阶数分子生成训练过程,我们可以选择性地从学习空间的高质量区域采样分子,从而改善产生分子的有效性。除了分子生成方法(QM9和GEOM)使用的标准两个数据集外,我们还在衍生自锌的药物样数据集上测试我们的方法。我们将条件方法与EDM一起使用,这是分子生成的第一个E(3)e(3)等效扩散模型,以及两个较新的扩散模型和一个流动匹配模型,是由EDM构建的。我们证明了通过RD-KIT可低估和PoseBusters测试套件评估的有效性改善。但是,更广泛地说,我们的发现突出了调节方法对低质量数据的有效性,以改善高质量数据的采样。
作为我们上一篇社论的后续,本研究主题进一步深入探讨了对称性如何影响生物和人工神经网络中的信息处理。虽然上一篇研究主题侧重于对称性在感官输入及其在神经系统中的组织中的基础作用,但这篇社论除了继续该主题之外,还介绍了对称驱动表示背后的机制及其鲁棒性的新研究,特别是在人工神经网络中。事实上,对称性在简化输入数据的复杂性和提高神经网络的鲁棒性方面起着关键作用。在人工系统和大脑中,对称性有助于创建有效的表示,可以很好地推广到看不见的数据并减轻从大数据集中学习的负担。通过利用感官数据的不变性和等变性,神经网络(包括生物和人工)可以增强其解释和响应周围世界的能力。本研究主题进一步探讨了人工和生物系统中对称性、学习动力学和神经表征的交集。第一篇贡献,DiTullio 等人深入研究了大脑如何利用时间作为监督信号来学习听觉特征。通过探索听觉领域的自然规律和对称性,作者提出时间一致性是学习听觉对象表征的关键,尤其是在混乱的环境中。该研究表明,在听觉辨别任务中,捕捉这些时间规律的模型优于传统的特征选择算法,例如主成分分析 (PCA) 和独立成分分析 (ICA)。这对神经科学和机器学习都有深远的影响,表明刺激的时间结构为有效的感官处理和泛化提供了重要基础。视觉是另一种感官方式,其中对称性起着关键作用。本文 (Lindeberg) 提出了一个理论框架来理解大脑视觉感受野的几何特性。协方差或等方差确保感官输入的变换会导致神经表征的相应变换。对这些特性的研究揭示了初级视觉皮层 (V1) 中的视觉感受野如何适应空间缩放和
Trupti Mohanty 1,Maitrey Mehta 2,Hasan M. Sayeed 1,Vivek Srikumar 2,Taylor D. Sparks 1 * 1材料科学与工程系,犹他大学,盐湖城,UT-84112,UT-84112。2 Kahlert计算学院,犹他大学,盐湖城,UT-84112,美国。 *通信:泰勒·D·斯帕克斯(Taylor D. Sparks),材料科学与工程系,犹他大学,盐湖城,UT-84112,美国,电子邮件:sparks@eng.utah.utah.utah.utah.utah.utah.utain摘要生成晶体结构,从文本描述中直接从文本描述中,标志着材料中的重要进步,可为您提供概念的流动路径。 将生成模型纳入晶体结构预测(CSP)为提高效率和创新提供了变革的机会。 虽然大型语言模型(LLM)在理解和生成文本方面表现出色,但它们在材料发现中的潜力仍然在很大程度上没有探索。 在这里,我们介绍了Crystext,这是一种从简单文本提示中生成晶体结构的高级方法,以材料组成和空间组编号为条件。 利用量化的低级别适应性(Qlora)进行微调,我们的方法可以直接从输入描述中直接从输入描述中产生有效且可扩展的CIF形成结构,从而消除了对后处理后的需求,从而确保了快速推理的有效微调。 对MP-20基准数据集的评估显示了高结构匹配速率和有效的RMSE指标,展示了该框架生成晶体结构的能力,这些晶体结构忠实地坚持指定的组成和晶体对称性。2 Kahlert计算学院,犹他大学,盐湖城,UT-84112,美国。*通信:泰勒·D·斯帕克斯(Taylor D. Sparks),材料科学与工程系,犹他大学,盐湖城,UT-84112,美国,电子邮件:sparks@eng.utah.utah.utah.utah.utah.utah.utain摘要生成晶体结构,从文本描述中直接从文本描述中,标志着材料中的重要进步,可为您提供概念的流动路径。将生成模型纳入晶体结构预测(CSP)为提高效率和创新提供了变革的机会。虽然大型语言模型(LLM)在理解和生成文本方面表现出色,但它们在材料发现中的潜力仍然在很大程度上没有探索。在这里,我们介绍了Crystext,这是一种从简单文本提示中生成晶体结构的高级方法,以材料组成和空间组编号为条件。利用量化的低级别适应性(Qlora)进行微调,我们的方法可以直接从输入描述中直接从输入描述中产生有效且可扩展的CIF形成结构,从而消除了对后处理后的需求,从而确保了快速推理的有效微调。对MP-20基准数据集的评估显示了高结构匹配速率和有效的RMSE指标,展示了该框架生成晶体结构的能力,这些晶体结构忠实地坚持指定的组成和晶体对称性。通过对船体上方的能量进行调节,我们进一步证明了水晶产生稳定的晶体结构的潜力。我们的工作强调了LLM在文本贡献的逆设计中的变革性作用,从而加速了新材料的发现。关键字:晶体结构预测(CSP),大语言模型(LLMS),量化低级适应性(Qlora)介绍传统方法,例如高通量筛选和第一原则计算在晶体结构预测(CSP)中一直是关键的[1-3] [1-3],但在计算上是昂贵的,并且是计算且具有时间量的范围,它们的化学范围跨越了范围,散布了范围的量表。利用变异自动编码器(VAE)[5-9]和生成对抗网络(GAN)[10-14]的生成方法加快了稳定的晶体结构的发现。然而,这些模型通常难以准确代表离散的原子类型及其连续的3D位置,同时结合了晶体对称性。基于扩散的模型[14-18]试图通过引入对称性的扩散过程[16]或整合诸如周期性,翻译和旋转诸如Equivariant denoising机制[17]之类的约束来解决这些局限性[17]。这些模型有效地生成具有对称约束的稳定结构,但它们在用户交互中的灵活性有限。他们对预定义的数值输入的依赖需要
对无定形石墨烯中热性质的研究提出了材料科学和工程的独特挑战和机会。传统上,对无定形碳材料的热性能的研究依赖于为原始石墨烯设计的经验潜能,将这些模型扩展到其预期的适用性领域之外[1]。这项研究旨在通过利用高效且高保真机器学习跨原子潜力(MLIP)来克服这些局限性。实现材料势能表面(PE)的准确但计算有效的表示非常重要。尽管密度功能理论(DFT)之类的方法通过明确考虑系统中的电子而提供了详细且可转移的见解,但它们的适用性受到较差的可扩展性随着系统大小的增加而阻碍,将其实际用途限制在相对较小的系统中,并限制了模拟的持续时间。对经典途径中现有方法论的批判性检查表明,尽管当前的碳材料MLIP具有高度的准确性,但它们在无定形石墨烯研究中的实用性受到大量计算需求的阻碍[2]。在处理计算费用可能变得过于刺激的大型,无序的系统时,这种限制特别明显。解决这一差距时,我们的工作试图使用具有出色可扩展性的非晶石墨烯的MLIP,例如基于Allegro框架的电势,Allegro框架是一种严格的局部局部含量的深层神经网络间原子势[3],可以使用GPU进行加速。在分子动力学领域(MD)中,GPU并行化的出现已经改变了游戏规则,可显着增强计算能力。可伸缩性对于我们的研究至关重要,该研究涉及非晶石墨烯结构的复杂热性能,该结构以由于无序引起的计算强度而闻名。通过通过蒙特卡洛算法掺入石 - 孔缺陷的无形石墨烯结构的产生将使对碳基材料中的疾病进行受控的探索。原子间电位将应用于大规模的无定形结构,其结果对从经验潜能衍生出的结果进行了标准。通过采用这种方法,我们的研究不仅熟练地导航了与非晶石墨烯的复杂性质相关的计算障碍,而且为无序碳材料中的热特性进行准确,有效地研究了一个新的先例。我们的发现旨在有助于更深入地了解无定形石墨烯中的传热机制,为开发具有量身定制的热特性的高级材料铺平了道路,可用于广泛的应用,从电子设备到储能。