摘要最常见的基因调节机制是当转录因子(TF)蛋白与调节序列结合以增加或减少RNA转录时。但是,在搜索这些序列时,TFS面临两个主要挑战。首先,相对于基因组长度,这些序列消失了。第二,散布在整个基因组上的几乎相同的序列,导致蛋白质暂停搜索。,但正如大肠杆菌中LACI调节的计算研究中所指出的那样,如果考虑DNA循环,这种几乎目标可能会较低。在本文中,我们探讨了这是否也发生在整个染色体的距离上。为此,我们开发了一个跨尺度的计算框架,该框架结合了建立的促进式扩散模型,用于基地级搜索和一个捕获全染色体范围的飞跃的网络模型。为了使我们的模型逼真,我们使用HI-C数据集作为超过100 TF的长期DNA片段和结合曲线之间3D接近的代理。使用我们的跨尺度模型,我们发现指向单个目标的中位数搜索时间严重取决于网络组合的结合节点强度(链接权重的总和)和局部分离率。另外,通过随机化这些速率,我们发现某些实际的3D目标配置比随机对应物更快或较慢。这一发现暗示染色体的3D结构漏斗对于相关的DNA区域必不可少。
主要关键词