分子动力学仿真是计算材料科学和化学的重要工具,在过去的十年中,它通过机器学习进行了革命。在过去的几年中,机器学习跨性别潜力的快速进步已经产生了许多新的体系结构。在其中特别值得注意的是原子聚类的扩展,它统一了围绕原子密度的描述符的许多早期思想和神经模式间影响(NEQuip),这是一个具有信息的神经网络,具有等效性特征,当时表现出了最先进的精度。在这里,我们构建了一个统一这些模型的数学框架:原子聚类的扩展是扩展的,并作为多层体系结构的一层重新铸造,而Nequip的线性化版本则被理解为对更大的多项式模型的特定稀疏。我们的框架还提供了一种实用的工具,用于系统地在此统一的设计空间中探索不同的选择。通过一系列实验进行了一组Nequip的消融研究,该实验远离域内和外部的精度和平滑的外推离训练数据很遥远,阐明了一些设计选择对于实现高精度至关重要。NEQuip的简化版本,我们称为Botnet(用于身体订购的张量网络),具有可解释的体系结构,并在基准数据集上保持其准确性。
1。灵活状态表示:节点可以表示带有特征的连续坐标2。 div>连续动作:图形可以扩展到新的2D位置3。连续的欧几里得对称性:2D上的几何图是(2) - 可转化
形状完成是3D计算机视觉中的至关重要的任务,涉及预测和填充扫描或部分观察到的对象的缺失区域。当前的方法通常遭受方向依赖性的不一致之处,尤其是在不同的旋转下,限制了其现实世界的适用性。我们介绍了逃生(通过锚点编码完成的模棱两可的形状完成),这是一个新型框架,旨在实现旋转等值的形状完成。我们的方法采用了独特的编码策略,通过选择锚点并将其在类似于D2形状分布的基于距离的编码器中代表对象。这使该模型能够捕获对对象几何形状的一致的,旋转等值的理解。逃生利用变压器体系结构来编码和解码距离变换,以确保在旋转转换下生成的形状完成保持准确和等效化。此外,我们进行优化以完善从锚点位置和预测编码的预测形状,实验评估表明,逃生实现了跨任意旋转和翻译的稳健,高质量的重建,展示了其在现实世界应用中的有效性。
具有扩展Hubbard功能(DFT + U + V)的密度功能理论提供了一个可靠的框架,可以准确描述包含过渡金属或稀有元素的复杂材料。它是通过减轻半本地功能固有的自我相互作用误差来做到的,该误差在具有部分填充D和F电子状态的系统中特别明显。但是,在这种方法中实现准确性取决于现场U和现场v哈伯德参数的准确确定。在实践中,这些是通过半经验调整,需要先验知识或更正确地通过使用预测但昂贵的第一原理计算来获得的。在这里,我们提出了一种基于模棱两可的神经网络的机器学习模型,该模型使用原子占用矩阵作为描述符,直接捕获了手头系统的电子结构,局部化学环境和氧化状态。我们在这里以迭代性线性响应计算为单位计算的哈伯德参数的预测,如密度功能性扰动理论(DFPT)和结构放松。值得注意的是,当对跨越各种晶体结构和组成的12个材料的数据进行培训时,我们的模型分别达到了Hubbard U和V参数的平均相对误差,分别为3%和5%。通过规避计算昂贵的DFT或DFPT自洽协议,我们的模型可以显着加快用可忽略的计算开销的哈伯德参数的预测,同时接近DFPT的准确性。此外,由于其可靠性的可传递性,该模型通过高通量计算促进了加速的材料发现和设计,与各种技术应用相关。
摘要 —我们提出了 SnCQA,这是一组硬件高效的等变分电路,分别针对置换对称性和空间格子对称性,量子比特数为 n。通过利用系统的置换对称性(例如许多量子多体和量子化学问题中常见的格子哈密顿量),我们的量子神经网络适用于解决存在置换对称性的机器学习问题,这可以大大节省计算成本。除了理论上的新颖性之外,我们发现我们的模拟在量子计算化学中学习基态的实际实例中表现良好,我们可以通过几十个参数实现与传统方法相当的性能。与其他传统变分量子电路(如纯硬件高效假设(pHEA))相比,我们表明 SnCQA 更具可扩展性、准确性和抗噪声能力(在 3 × 4 方格上的性能提高了 20 倍,在我们的案例中,在各种格子尺寸和关键标准(例如层数、参数和收敛时间)下节省了 200% - 1000% 的资源),这表明在近时间量子设备上进行实验可能是有利的。
基于碎片的药物发现(FBDD)通过类比经典的药物发现方法,FBDD中常见的策略之一是在与靶蛋白相互作用的碎片上运行。首先,定义和表征结合片段(使用高通量筛选,然后是X射线 / NMR,或虚拟筛选和对接)。结果,定义了与蛋白质口袋斑块相互作用的片段的确切位置和方向。下一步是在保留位置的片段之间设计一个接头,从而在片段的结合亲和力(最好是,链接器添加将增强最终分子的结合亲和力)[1]。已经报道了有关连接器的设计,从蛋白质晶体结构开始,从蛋白质晶体结构与结合片段[1] [1],例如:CK2 [2],LDH-A [3]和DOT1L [4]的抑制剂,它们在癌症中扮演至关重要的蛋白质在癌症中扮演至关重要的蛋白质,是通过实验性地链接到癌症中的片段来实验性地与一个链接的链接。
大规模序列建模引发了快速的进步,现在扩展到生物学和学位。但是,建模基因组序列引入了挑战,例如需要建模远程令牌相互作用,基因组的上流区域和下游区域的影响以及DNA的反向互补性(RC)。在这里,我们提出了一个以这些挑战为动机的建筑,这些挑战在远程Mamba区域建立,并将其扩展到支持双向性的Bimamba component,并将其扩展到支持RC等值的Mambadna块。我们使用amambadna作为caduceus的ba sis,这是第一个rc equivianiant双向远程DNA语言模型的第一个家族,我们引入了预训练和精细的调整策略,产生了caduceus dna fun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-dation模型。caduceus在下游基准测试上优于以前的远程模型;在具有挑战性的远程变体效果前字典任务上,caduceus超过了不利用双向方向性或均衡性的10倍较大模型的性能。代码重现我们的实验。