通过计算工具从参考数据库中检索进化相关的序列(HO-MOLOGS)已经实现了许多生物学的进步(1-4)。在基于序列的蛋白质同源性范式上构建这些工具(5,6),通过搜索类似的氨基酸性序列来检测数百万到数十亿参考条目中输入查询的同源物。在数十年中,同源性搜索对于推断蛋白质特性至关重要(7-9),例如二级结构预测(10),检测蛋白质残基对之间的直接耦合(11)和第三纪结构预测,长期以来对生物学的巨大挑战(12)。特定的远程同源物已被证明是对当代深度学习方法(如Alphafold2等)(13 - 15)(13-15)的输入,以预测准确的结构(16-18)。要检索远程同源物,需要在数据库中查询和参考序列之间检测对成对的相似性的敏感工具。从理论上讲,可以通过应用基于动态编程的,间隙的史密斯 - 水手-GotoH算法(19,20)来找到高灵敏度,以在每个查询参考对准时找到最佳路径(对准)(21)。但是,参考序列数据库的不断增长的大小(17)使这种详尽的方法不切实际。结果,基于启发式的方法,例如BLAST(1),PSI-BLAST(22),MMSEQS2(4)和DIAMOND(3),在执行计算价格昂贵的间隙计算之前,融合了预滤波技术,以修剪大多数不同的序列。这通常是通过采用种子和扩展策略来完成的,其中简短的k-mer单词(“种子”)被索引和匹配,然后将其扩展到间隙比对。敏感的对准器(2)和hhblits(23)都采用了简化的动态编程方法,该方法在序列对之间的对齐矩阵的所有无间隙路径(严格的对角线)中得分,以找到最高得分的未射程匹配。与基于k的方法不同,是较低的比对的较低结合的近似值,无间隙对准会导致所有对以计算效率为代价的分数。探索了几种方法以达到更高的执行速度,无论启发式如何,例如中央处理单元
同源重组(HR)是双链断裂和封闭复制叉的DNA修复机制,涉及同源搜索过程,从而导致形成突触中间体,以确保基因组完整性。Rad51重组酶在该机制中起着核心作用,并由其RAD52和BRCA2伙伴支持。如果BRCA2在RPA-SSDNA上加载RAD51的介体功能很好地确定了Rad52在HR中的作用尚未了解。我们使用了与生物化学结合的透射电子显微镜来表征RPA,RAD52和BRCA2在RAD51纤维膜组装中的顺序参与及其活性。尽管我们的结果证实了RAD52缺乏介体活性,但Rad52可以与RPA涂层的sdNA紧密结合,抑制BRCA2的介体活性,并形成较短的Rad51-Rad52混合材料,这些混合源在突触综合体和D型较大的情况下更加有效,从而更加有效。我们确定了双链断诱导的体内后rad51和rad52之间的原位相互作用。这项研究提供了对人HR期间BRCA2和RAD52对突触前和突触中间体的形成和调节的新分子见解。
摘要 近 90% 的人类致病突变是由微小的基因变异引起的,有效纠正这些错误的方法至关重要。进行微小 DNA 改变的一种方法是提供单链寡脱氧核苷酸 (ssODN),该单链寡脱氧核苷酸包含一个改变,并在基因组的目标位点处与靶向双链断裂 (DSB) 相结合。将 ssODN 供体与 CRISPR-Cas9 介导的 DSB 结合是引入微小改变的最简化方法之一。然而,在许多系统中,这种方法效率低下,并且会在基因连接处引入不精确的修复。我们在此报告一种使用 ssODN 和 CRISPR-Cas9 的时空定位来改进基因改变的技术。我们表明,通过将 ssODN 模板与反式激活 RNA (tracrRNA) 融合,我们可以恢复精确的基因改变,并且在体外和体内的整合度和精确度都有所提高。最后,我们表明该技术可用于与其他基因编辑工具(如转录激活因子如效应核酸酶)一起增强基因转换。
图3示意图(改编自Difrisco,Love and Wagner,2020)的“配对gnathostome附属物”。脊椎动物胚胎中肢体芽的发育先于配对附属物的发展(例如鳍和四肢)。双向箭头示意性地描述了组织类型之间的局部激素驱动的相互作用;肢体发育由四个肢体芽中的四个信号中心精心策划。此处包括两个最著名的信号中心,作为带有信号梯度的箭头。ZPA建立了肢体的前后组织组织,AER建立了近端组织。这些信号传导中心形成了一个复杂的,有因果关系的,共同决定肢体身份的必要机制。他们的活动是相互依存的,相互加强(Difrisco,Love and Wagner,2020)。CHIM的上游(其因果“输入”)是相对未分化的,宽松的中胚层胚胎组织; CHIM的下游(其因果“输出”)是具有可识别的组织类型和肢体组织的结构。然后通过进一步的过程来修改这种基本的肢体结构,以确定可能的肢体表型,例如上面讨论的五达乙酰基前肢表型。
给定一个闭二维流形或曲面上的大小为 L 的环或更一般的 1-循环 r(用三角网格表示),计算拓扑学中的一个问题是它是否与零同源。我们在量子环境中构建和解决这个问题。给定一个可以用来查询闭曲线上边的包含情况的 oracle,我们设计了一个用于这种同源性检测的量子算法,相对于环 r 上边的大小或边数,其运行时间为常数,只需要使用一次 oracle。相比之下,经典算法需要使用 Ω( L ) oracle,然后进行线性时间处理,并且可以通过使用并行算法将其改进为对数时间。我们的量子算法可以扩展以检查两个闭环是否属于同一个同源类。此外,它可以应用于同伦检测中的一个特定问题,即检查闭二维流形上的两条曲线是否不是同伦等价的。
摘要:高科技制造业中使用的逆变器、交流接触器等设备对电压暂降十分敏感,电压暂降可能造成设备故障、生产中断、数据丢失、敏感设备损坏、能源供应不稳定等。一次短路故障可能触发多个电能质量监测装置记录电压暂降波形,电压暂降数据冗余问题严重影响数据应用。因此识别电压暂降源对于科学合理评估区域电网电压暂降严重程度具有重要意义。因此本文提出了一种基于DBSCAN算法的电压暂降源识别算法。通过采用合适的特征工程,选取三维聚类特征,再通过迭代方法选取合适的聚类算法参数进行聚类,最后通过6个聚类评价指标评估算法效果。利用某省电力公司提供的数据在jupyter notebook编程平台上进行实验,最终结果证明了所提算法的有效性。关键词:电压暂降 聚类 DBSCAN 电压暂降同源性检测 1.引言 电压暂降造成微电子、智能控制等精密加工行业的生产中断,给用户带来巨大的经济损失,成为投诉最多的电能质量问题[1],[2]。一次短路故障可能触发多个电能质量监测装置记录电压暂降波形。电压暂降数据的冗余严重影响数据应用[3],[4],并可能导致对区域电网电压暂降严重程度的高估[5]。同时,对同一电压暂降源引起的多条数据进行重复分析会增加计算强度和复杂度。将多次电压暂降事件识别为同一电压暂降源是电能质量监测领域亟待解决的问题。识别出同一电压暂降源可以减少电网电能质量监测系统的数据冗余,避免对区域电能质量水平做出高估。它是明确区域电网电能质量水平的必要前提,对于科学合理评估区域电网电压暂降严重程度具有重要意义。电压暂降源识别就是对短时间内监测到的多个电压暂降数据进行分类,将同一电压暂降源引发的电压暂降监测数据归为一类。近年来,国内外对电压暂降源进行了大量研究,现有的研究主要包括特征提取与选择[6]、数据挖掘与机器学习算法[7],[8], [9], 算法融合与集成 [10]。综上所述, 本文提出了一种基于 DBSCAN 算法的同源性识别方法, 并使用某省电力公司提供的 10049 条临时掉电数据进行了聚类实验。最后对聚类结果进行了 6 个聚类评价指标的评估, 证明了该方法的准确性和有效性
基本的局部比对搜索工具(BLAST)是一个程序,该程序报告了数据库中查询序列和序列之间的局部相似性区域(在核苷酸或蛋白质水平上)。检测序列同源性的能力使我们能够确定基因或蛋白质是否与其他已知基因或蛋白质有关。检测序列同源性还促进了由多个基因共享的保守域和基因家族成员的鉴定。BLAST之所以流行,是因为它可以有效地识别两个序列之间局部相似性的区域。更重要的是,BLAST基于强大的统计框架。此框架允许BLAST确定两个序列之间的比对是否具有统计学意义(即,获得与该分数或更高偶然得分的比对的概率很低)。在进行注释之前,重要的是要了解我们在分析中使用爆炸时所做的推论。进化论的理论提出,所有生物体都通过共同祖先的形成降临。在分子水平上,祖先DNA序列随时间差异(通过点突变的积累,重复,缺失,转置,重组事件等)在
方法:ProSTRUC是一种基于Python的同源性建模工具,旨在通过直观的,自动化的管道来简化蛋白质结构的预测。集成了用于序列对齐的生物繁殖,用于模板识别的BLAST和promod3用于结构生成,ProStruc简化了复杂的工作流入到用户友好的界面中。该工具使研究人员能够输入蛋白质序列,从蛋白质数据库(PDB)等数据库中识别同源模板,并生成具有最小计算专业知识的高质量3D结构。ProStruc实现了两个阶段的Vsquarealidation过程:首先,它使用TM-Align进行结构比较,评估均平均偏差(RMSD)和针对参考模型的TM分数。第二,它通过qmeandisco评估模型质量,以确保高精度。
摘要:情绪识别是人类功能的重要组成部分。TextColorredit使个人能够对环境事件做出适当的反应并发展自我意识。大脑计算机接口(BCI)技术中的快节奏开发技术必须使未来的智能机器能够数字化和识别人类的情绪。为了实现这一目标,除其他视觉提示外,人类和机器都依赖面部表情。虽然面部表情有效地识别情绪,但它们可以人工复制,需要持续的监视。近年来,由于深度学习和机器学习技术的进步,脑电图(EEG)信号的使用已成为一种流行的情感识别方法。基于EEG识别情绪的系统涉及测量暴露于情绪刺激(例如图像,声音或视频)的受试者的大脑中的电活动。然后,使用机器学习算法来从与特定情绪状态相对应的电活动数据中提取特征。提取的脑电图信号的质量至关重要,因为它影响了系统的整体复杂性和机器学习算法的准确性。本文提出了一种方法,以提高基于脑电图的情绪识别系统的准确性,同时降低其复杂性。该方法涉及优化脑电图的数量,其放置在人头皮上以及测量信号的目标频带,以最大程度地提高高和低唤醒水平之间的差异。用于此目的的优化方法,称为简单同源性全局优化(SHGO)。实验结果表明,最佳地放置的六电极构造可以比14-电极构造获得更好的准确度,从而导致电极数量的复杂性降低了60%以上。这种方法会赋予有希望的结果,从而提高了基于脑电图的情感识别系统的效率和准确性,这可能会对各种领域产生影响,包括医疗保健,心理学和人类计算机接口。
OTOF 基因编码耳蜗内毛细胞中表达的耳蜗蛋白,其不同突变会诱发一种耳聋,而耳聋是人类无综合征隐性听觉神经病谱系障碍的主要原因。我们报告了使用与不同 Cas9 成分(mRNA 或蛋白质)相关的 CRISPR 系统,在单链寡脱氧核苷酸 (ssODN) 辅助下诱导同源定向修复 (HDR),生成了第一个 OTOF 突变大型动物模型。使用不同浓度的两个靶向外显子 5 和 6 的 sgRNA 与 Cas9 mRNA 或蛋白质 (RNP) 结合,并与靶向外显子 5 中 HDR 的 ssODN 模板混合,该模板包含两个 STOP 序列。共出生 73 只羔羊,其中 13 只出现插入/缺失突变(17.8%),其中 8 只(61.5%)通过 HDR 发生敲入突变。较高浓度的 Cas9-RNP 能更有效地诱导靶向突变,但对胚胎存活率和妊娠率有负面影响。本研究首次报道了 OTOF 破坏绵羊的产生,这可能有助于更好地理解和开发与遗传疾病相关的人类耳聋的新疗法。这些结果支持使用 ssODN 辅助的 CRISPR/Cas 系统作为牲畜基因编辑的有效工具。