摘要 基因组 DNA 的可弯曲性影响染色质包装和蛋白质-DNA 结合。然而,我们对影响 DNA 可弯曲性的基序尚无全面的了解。最近的高通量技术(例如 Loop-Seq)提供了解决这一差距的机会,但仍然缺乏准确且可解释的机器学习模型。在这里,我们介绍了 DeepBend,这是一个卷积神经网络模型,其卷积旨在直接捕捉 DNA 可弯曲性背后的基序及其调节可弯曲性的周期性出现或相对排列。DeepBend 的表现始终与其他模型相当,同时通过机械解释提供了额外的优势。除了证实已知的 DNA 可弯曲性基序之外,DeepBend 还揭示了几个新的基序,并展示了基序出现的空间模式如何影响可弯曲性。 DeepBend 的全基因组可弯曲性预测进一步展示了可弯曲性与染色质构象之间的关联,并揭示了控制拓扑相关域及其边界的可弯曲性的主题。
深度学习 (DL) 凭借其令人印象深刻的性能对遗传学研究产生了重大影响;然而,由于其复杂的性质,它通常被视为“黑匣子”。随着越来越多以低成本生成的数据和硬件的互补进步,新形式的人工智能 (AI) 正在实现各种预测任务,从调控基因组的注释到单细胞数据的分类 1 – 4 。通过了解作为此类成功预测基础的大规模数据属性,我们有望对正在研究的生物过程获得更深入的了解。在过去的几年中,可解释人工智能 (xAI) 领域迅速涌现出可提供此类见解的新型模型解释技术 5 。深度学习模型可以学习复杂的模式。例如,在确定人类基因组中的哪些 DNA 序列指导特定细胞类型中的基因转录时,模型可能正在学习序列组成(例如,GC 含量)、特定基序模式(转录因子 (TF) 结合位点)的存在或不存在、染色质的局部可及性、DNA 的生物物理特性(例如,可弯曲性)、序列特性之间的位置差异(即在区域边缘或中间发现的特征)、特征之间的正或负相互作用,或超出我们当前知识状态的属性。为了学习庞大而复杂的特征集,此类模型需要学习数百万个参数,这些参数共同决定模型预测,但不提供
基因组工程核酸酶必须接触染色质化的 DNA。在这里,我们研究了 AsCas12a 如何切割人类核小体和相浓缩核小体阵列内的 DNA。使用定量动力学方法,我们表明动态核小体解开调节靶标对 Cas12a 的可及性,并决定核小体抑制结合的两个步骤(PAM 识别和 R 环形成)的程度。通过降低 DNA 可弯曲性、添加组蛋白修饰或引入靶标近端 dCas9 来放松核小体内的 DNA 包裹,可将 DNA 切割率提高 10 倍以上。出乎意料的是,Cas12a 很容易切割染色质状、相分离的核小体阵列内的核小体间接头 DNA。由于相邻的核小体和染色质压缩,DNA 靶向仅减少了约 5 倍。这项研究解释了核小体中的靶向切割发生频率低于细胞中核小体耗尽的基因组区域内的脱靶切割的观察结果。我们得出结论,核小体解开调节 CRISPR-Cas 核酸酶的可及性,并提出增加核小体呼吸动力学将改善真核细胞中的 DNA 靶向性。
SPO11 二聚化控制减数分裂 DNA 双链断裂形成 Cédric Oger 1 和 Corentin Claeys Bouuaert 1,* 1 鲁汶生物分子科学与技术研究所,鲁汶天主教大学,1348 Louvain-La-Neuve,比利时。 * 通讯地址:corentin.claeys@uclouvain.be。SPO11 通过诱导程序性 DNA 双链断裂 (DSB) 来启动减数分裂重组,但这种催化活性从未在体外重建。在这里,我们使用小小鼠 SPO11 报告了一个重现减数分裂 DSB 形成所有特征的生化系统。我们表明,SPO11 在没有任何伴侣的情况下催化断裂形成,并保持与 5 ¢ 断裂链的共价连接。我们发现 SPO11 的靶位选择受 DNA 底物的序列、可弯曲性和拓扑结构的影响,并提供了 SPO11 可以重新修复单链 DNA 断裂的证据。此外,我们表明 SPO11 在溶液中是单体,而切割需要二聚化才能重建两个混合活性位点。SPO11 及其伴侣 TOP6BL 形成 1:1 复合物,该复合物催化 DNA 切割,其活性与单独的 SPO11 相似。然而,该复合物以更高的亲和力结合 DNA 末端,表明在切割后可能发挥作用。我们提出了一个模型,其中体内 DSB 形成所需的 SPO11 的其他伴侣组装生物分子凝聚物,招募 SPO11-TOP6BL,从而实现二聚化和切割。我们的工作确立了 SPO11 二聚化是控制减数分裂 DSB 诱导的基本机制。