DNA结合蛋白在不同的生物学过程中至关重要,包括DNA复制,转录,包装和染色质重塑。探索它们的特征和功能已与各种科学领域相关。计算生物学和生物信息学有助于研究DNA结合蛋白,补充了传统的分子生物学方法。虽然机器学习的最新进展使预测系统与生物信息学方法的整合在一起,但仍需要有可推广的管道来将未知蛋白识别为DNA结合,并评估他们识别的特定类型的DNA链。在这项工作中,我们介绍了Rudeus,这是一个python库,其具有层次分类模型,旨在识别DNA结合程序并评估特定的相互作用类型,无论是单链还是双链。Rudeus具有多功能管道,能够训练预测模型,通过监督学习算法协同蛋白质语言模型,并整合贝叶斯优化策略。训练有素的模型具有高性能,DNA结合识别的精确率为95%,单链和双链相互作用之间的辨别率为89%。Rudeus包括一个用于评估未知蛋白序列的探索工具,将其注释为DNA结合,并确定其识别的DNA链的类型。结构性生物信息学管道已被整合到Rudeus中,以通过DNA-蛋白质分子对接验证已鉴定的DNA链。这些全面的策略和直接实施表现出与高端模型的可比性,并增强了将其集成到蛋白质工程管道中的可用性。
工程大肠杆菌菌株用于生产长的单链DNA Konlin Shen 1,Jake J.洪水2,Zhuizi Zhang 1,Alvin HA 4,5,6,Brian R. Shy 4,5,6,John E.美国加利福尼亚州伯克利的国家实验室4美国加利福尼亚大学旧金山分校,美国加利福尼亚州旧金山的实验室医学系。5 Gladstone-UCSF基因组免疫学研究所,美国加利福尼亚州旧金山。6加利福尼亚大学旧金山分校的医学系,美国加利福尼亚州旧金山。 对应证:shawn.douglas@ucsf.edu抽象的长单链DNA(SSDNA)是一种多功能分子试剂,其应用包括RNA引导的基因组工程和DNA纳米技术,但其生产通常是资源密集的。 我们采用了一种新的方法,利用工程化的大肠杆菌“助手”菌株和吞噬系统,将长ssDNA的产生简化为直接转化和纯化程序。 我们的方法通过将M13MP18基因直接整合到大肠杆菌染色体中,从而消除了对辅助质粒及其相关污染的需求。 ,我们实现了504至20,724个核苷酸的ssDNA长度,碱性赖氨酸溶液纯化后滴度最高为250 µg/l。 通过将其在原代T细胞基因组修饰和DNA折纸折叠中的应用中,我们的系统的功效得到了证实。6加利福尼亚大学旧金山分校的医学系,美国加利福尼亚州旧金山。对应证:shawn.douglas@ucsf.edu抽象的长单链DNA(SSDNA)是一种多功能分子试剂,其应用包括RNA引导的基因组工程和DNA纳米技术,但其生产通常是资源密集的。我们采用了一种新的方法,利用工程化的大肠杆菌“助手”菌株和吞噬系统,将长ssDNA的产生简化为直接转化和纯化程序。我们的方法通过将M13MP18基因直接整合到大肠杆菌染色体中,从而消除了对辅助质粒及其相关污染的需求。,我们实现了504至20,724个核苷酸的ssDNA长度,碱性赖氨酸溶液纯化后滴度最高为250 µg/l。通过将其在原代T细胞基因组修饰和DNA折纸折叠中的应用中,我们的系统的功效得到了证实。我们的方法的可靠性,可伸缩性和易度性有望解锁需要大量长ssDNA的新实验应用。引言单链DNA(ssDNA)在生物技术中起着至关重要的作用,尤其是在DNA纳米技术和基因编辑1,2中。长ssDNA的合成超过5000个核苷酸(NT)是具有挑战性的,并且明显的障碍可以阻止可扩展产生。通过磷酰胺化学的直接化学合成仅限于由于掺入误差和脱尿3的长度300-400 nt。为了获得更长的ssDNA链,电流实践采用双链DNA(dsDNA)作为模板。例如,不对称PCR可以在长度4中产生高达15,000 nt的ssDNA。其他方法包括使用差异修饰的引物进行PCR扩增:用于lambda外核酶消化5的磷酸化和未磷酸化,或生物素基化和非生物素化和非生物素化,用于链霉亲和素珠分离6-在孤立的Ssdna strands隔离时进行抗性。然而,这些技术通常每50-微晶(µL)反应产生小于1微克(µg)的ssDNA,从而使毫克的生产量成本昂贵,并且由于广泛的劳动力和高度试剂的消耗而效率低下,因此强调了更多可扩展和经济的SSDNA生产方法的必要性。
(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印本版的版权持有人于2024年2月22日发布。 https://doi.org/10.1101/2024.02.20.581294 doi:Biorxiv Preprint