图1:提议的框架概述。该过程始于利用蛋白质氨基酸序列和配体微笑弦作为输入。构象采样过程包括迭代应用输入特征,更新残留特征并脱落等效,最终在其辅导的Cα蛋白质主链和配体配合物以及其辅导中产生了新型蛋白质序列。
大规模序列建模引发了快速的进步,现在扩展到生物学和学位。但是,建模基因组序列引入了挑战,例如需要建模远程令牌相互作用,基因组的上流区域和下游区域的影响以及DNA的反向互补性(RC)。在这里,我们提出了一个以这些挑战为动机的建筑,这些挑战在远程Mamba区域建立,并将其扩展到支持双向性的Bimamba component,并将其扩展到支持RC等值的Mambadna块。我们使用amambadna作为caduceus的ba sis,这是第一个rc equivianiant双向远程DNA语言模型的第一个家族,我们引入了预训练和精细的调整策略,产生了caduceus dna fun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-foun-dation模型。caduceus在下游基准测试上优于以前的远程模型;在具有挑战性的远程变体效果前字典任务上,caduceus超过了不利用双向方向性或均衡性的10倍较大模型的性能。代码重现我们的实验。
基于碎片的药物发现(FBDD)通过类比经典的药物发现方法,FBDD中常见的策略之一是在与靶蛋白相互作用的碎片上运行。首先,定义和表征结合片段(使用高通量筛选,然后是X射线 / NMR,或虚拟筛选和对接)。结果,定义了与蛋白质口袋斑块相互作用的片段的确切位置和方向。下一步是在保留位置的片段之间设计一个接头,从而在片段的结合亲和力(最好是,链接器添加将增强最终分子的结合亲和力)[1]。已经报道了有关连接器的设计,从蛋白质晶体结构开始,从蛋白质晶体结构与结合片段[1] [1],例如:CK2 [2],LDH-A [3]和DOT1L [4]的抑制剂,它们在癌症中扮演至关重要的蛋白质在癌症中扮演至关重要的蛋白质,是通过实验性地链接到癌症中的片段来实验性地与一个链接的链接。
在大规模模拟中,由于量子方法的数值成本很高,原子之间的相互作用通常不能从第一个原理计算。相反,它们通常是使用力ELDS(FFS)对势能的物理动机功能形式进行建模的,并进行参数化以匹配从头算能的能量和/或再现实验数据。最广泛的FF是所谓的经典力eLS(例如Amber 1或Charmm 2),它们结合了XED-Charge Colomb电位和Lennard-Jones的相互作用来模拟分子间电位。这些模型在数值上非常有效,可以在长期尺度上模拟非常大的系统。然而,它们的简单功能形式缺乏极化和多体效应,这对于正确描述某些系统至关重要(例如在极性溶剂,PI堆叠或复杂的蛋白质结构中溶剂化3)。更先进的力量eelds - 例如Amoeba,4 TTM,5
摘要 —我们提出了 SnCQA,这是一组硬件高效的等变分电路,分别针对置换对称性和空间格子对称性,量子比特数为 n。通过利用系统的置换对称性(例如许多量子多体和量子化学问题中常见的格子哈密顿量),我们的量子神经网络适用于解决存在置换对称性的机器学习问题,这可以大大节省计算成本。除了理论上的新颖性之外,我们发现我们的模拟在量子计算化学中学习基态的实际实例中表现良好,我们可以通过几十个参数实现与传统方法相当的性能。与其他传统变分量子电路(如纯硬件高效假设(pHEA))相比,我们表明 SnCQA 更具可扩展性、准确性和抗噪声能力(在 3 × 4 方格上的性能提高了 20 倍,在我们的案例中,在各种格子尺寸和关键标准(例如层数、参数和收敛时间)下节省了 200% - 1000% 的资源),这表明在近时间量子设备上进行实验可能是有利的。