单细胞测序技术,包括单细胞RNA测序(SCRNA-SEQ)和单细胞ATAC测序(SCATAC-SEQ),使研究人员能够量化细胞的OMIC PHE-NOTYPES。理想的单细胞数据分析有望帮助研究人员了解细胞上的异质性,提取感兴趣的细胞亚群,识别与细胞亚群相对应的特征基因集,并揭示细胞子源的关系。在这些分析任务中,识别特征基因集是一个关键步骤。特征基因集定义为在细胞亚群之间差异表达的基因集。它们通常用于注释细胞亚群并进行基因集富集分析。现有的特征基因鉴定方法经常采用两步方法(此后称为两步方法):首先将细胞聚集(例如Seurat [1-4],简单的Louvain [5],通过插入性和维度降低(CIDR)(CIDR)[6]和Scanpy [7]和差异表达基因(例如9)(例如9)[8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [14,15],limma-voom [16]和桅杆[17])随后在细胞簇上进行以识别特异性特异性特征基因。但是,这种方法对具有复杂或微妙的异质性的数据具有可疑的精度,因为不准确的初始聚类步骤可能会导致随后的错误特征基因鉴定[18]。但是,这些方法不会将特征基因分离为亚群特异性基因集,从而限制了它们的注释细胞的效用。这些基因集用于计算细胞基因集富集评分,然后注释细胞。另外,某些方法通过检测高度可变基因(HVG)的偏差来识别特征基因,这些基因与人群相对于模型拟合的偏差[19],辍学率[20]和UMI计数分布[21](此后称为HVG方法)。为了克服现有方法的局限性,我们提出了Sifinet,这是一种直接识别特征基因集的独特方法,可消除对先前细胞聚类的需求。源于关键观察,即在细胞亚群中共差异表达的基因也表现出共表达模式(供应。注1),Sifinet构建了一个基因共表达网络,并检查其拓扑以识别特征基因集。此外,这些基因集中的网络意味着细胞亚群之间的关系(图1)。此外,Sifinet可以选择地整合SCATAC-SEQ数据,因为它形成了基因合作 - 染色质网络,并探讨了其拓扑以确定表观基因组特征基因集。Sifinet分析SCRNA-SEQ和SCATAC-SEQ数据的能力使研究人员深入了解了细胞多瘤异质性。我们证明,在识别特征基因集和增强细胞注释精度时,Sifinet优于现有的两步方法和HVG方法。此外,我们认为Sifinet可以鉴定细胞之间的复杂异质性,并揭示细胞亚群中潜在的发育谱系。Sifinet也可以缩放以分析数百万个单元的数据集。我们将Sifinet应用于五个已发表的实验数据集,并发现了一些潜在的新发现,例如潜在的新细胞周期标记和衰老标记,衰老细胞富集的亚群,髓样祖细胞的发育效果以及CD8细胞的发育效果以及CD8细胞的构造以及可能的过渡路径。
。cc-by 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他已授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本于2024年4月25日发布。 https://doi.org/10.1101/2023.02.21.529387 doi:biorxiv preprint
社会。最重要的是,迄今为止,针对这一系列致残或限制生命的疾病,获得许可的治疗方法极其有限(Chinnery,2015;Viscomi 等人,2023)。线粒体疾病的治疗方法包括对症治疗以改善生活质量或延长寿命,以及基因治疗以减少异质体并治愈细胞生化缺陷。对症治疗包括操纵线粒体的细胞含量、通过雷帕霉素诱导线粒体周转、恢复 NAD + 水平、调节活性氧的产生和氧化应激等(Russell 等人,2020)。基因治疗包括直接编辑线粒体基因组、基因替代疗法(Silva-Pinheiro 等,2020;Ling 等,2021)和线粒体移植疗法(Green field 等,2017)。基因编辑技术作为一种潜在的治疗选择,在过去十年中已在核遗传疾病的治疗中得到广泛研究(Sharma 等,2015;Nelson 等,2016;De Ravin 等,2017;Zheng 等,2022),越来越多的临床试验正在进行中(Arabi 等,2022)。然而,由于缺乏有效的工具来操纵 mtDNA( Silva-Pinheiro 和 Minczuk,2022 年),其在由 mtDNA 突变引起的线粒体疾病中的意义受到阻碍,除非通过锌指融合( Minczuk et al., 2008; Gammage et al., 2014; Gammage et al., 2016a; Gammage et al., 2016b; Gammage et al., 2018b )或 TALE 融合的 fokI 核酸酶( Bacman et al., 2013; Reddy et al., 2015; Bacman et al., 2018; Pereira et al., 2018; Yang et al., 2019)或 TALE 融合的 fokI 核酸酶( Bacman et al., 2013; Reddy et al., 2015; Bacman et al., 2018; Pereira et al., 2018; Yang et al., 2019)切割和消除有害的 mtDNA 拷贝。线粒体DNA碱基编辑技术目前已发展成为生物技术中最常用的编辑技术之一(Pereira et al., 2018),以及基于TALE系统的单体酶(Pereira et al., 2018)。近年来,基于TALE的线粒体DNA碱基编辑工具陆续被引入,第一种是DddA衍生的胞嘧啶碱基编辑器(DdCBE)(Mok et al., 2020),它为按预期操纵线粒体DNA打开了大门。DddA系统来源于伯克霍尔德菌,DdCBE由两半无毒的TALE融合分裂DddA(DddA-N和DddA-C)组成,通过将这两半分裂的DddA重新组装成功能性脱氨酶,催化间隔区域内的胞嘧啶脱氨。目前,DdCBE 已成功应用于植物 (Kang et al., 2021)、哺乳动物细胞 (Mok et al., 2020)、斑马鱼 (Guo et al., 2021)、小鼠 (Lee et al., 2021; Lee et al., 2022a; Guo et al., 2022)、大鼠 (Qi et al., 2021) 甚至人类生殖细胞 (Wei et al., 2022a; Chen et al., 2022) 的线粒体 DNA 编辑。在我们的实验室中,它还已成功用于小鼠早期卵泡阶段的有效生殖系线粒体 DNA 编辑(已提交数据)。不幸的是,它在挽救线粒体疾病方面的应用极其罕见,无论是用于治疗研究(Silva-Pinheiro 等人,2022 年)还是用于临床试验(Chen 和 Yu-Wai-Man,2022 )。众所周知,潜在基因编辑结果的可预测性对于基因编辑技术在临床上用于基因治疗至关重要。为此,已经进行了大量的工作来了解CRISPR系统在核基因组编辑中对不同靶标的编辑规则,并且已经证明对于每个被CRISPR/Cas9编辑的原型间隔物来说,其结果是完全可预测的(van Overbeek et al., 2016 ; Shen et al., 2018 ; Shou et al., 2018 ; Allen et al., 2019 ; Chakrabarti et al., 2019 ; Chen et al., 2019 ; Long, 2019 ; Shi et al., 2019 ),这使我们能够提前知道每种策略在临床上应用的潜在结果。然而,对于线粒体基因组,由于缺乏 DNA 修复,CRISPR/Cas9 尚未参与 mtDNA 编辑
图 1 显示了垂直接口配置,其中两个 BQ79616 电池监视器引脚驱动南北方向的双绞线电缆。链的底部是控制器模块,其中 BQ79600-Q1 桥接集成电路用于高压隔离,并将电池数据从垂直接口转换为通用异步接收器发送器 (UART) 或串行外设接口 (SPI) 和主机处理器。链中每个设备的电流或电容耦合隔离都是可能的。可选地,环形配置可以在链发生故障或中断时用作冗余通信路径。
摘要近年来,新的基于混乱的加密算法激增,其中许多声称具有异常大的钥匙空间。尽管加密原语(例如对称键密码)应该具有足够大的秘密键空间以抵抗蛮力攻击,但仅增加秘密密钥的大小可能不会导致安全保障的提高。n -bit键不一定会由于密钥调度算法或如何使用密钥而具有2 n -1的密钥空间。在本文中,我们从其关键时间表的角度来看,加密基于混乱的算法。我们的数值分析基于Kerckhoff的原理,并考虑用于实数计算的数字表示。我们的分析表明,这些密码的实际安全保证金显着降低,其中有些比所声称的超过200倍以上。然后,我们为这些密码提供准确的键空间估计值。最后,我们重点介绍了如何在基于混乱的密码学背景下如何使用秘密密钥的替代解决方案,并提出了一个简单的密钥时间表作为概念证明。尽管简单起见,但提出的密钥时间表不仅可以确保钥匙空间匹配密钥长度,而且还通过NIST和ENT统计测试套件,也使其成为生成安全加密密钥的可行选择。我们的工作有助于解决基于混乱的密码学中基本问题之一,该问题限制了其在加密社区中的实际影响和声誉。
。cc-by-nc-nd 4.0国际许可证。是根据作者/资助者提供的预印本(未经同行评审认证)提供的,他已授予Biorxiv的许可证,以在2024年2月29日发布的此版本中在版权所有者中显示预印本。 https://doi.org/10.1101/2024.02.22.581503 doi:Biorxiv Preprint
摘要旨在开发一种算法,以准确可靠地从眼底照片中对多种视网膜病理进行分类,并验证其针对人类专家的绩效。方法,我们训练了一个深卷积合奏(DCE),这是五个卷积神经网络(CNN)的集合,将视网膜眼底照片分类为糖尿病性视网膜病(DR),青光眼,与年龄相关的黄斑变性(AMD)和正常眼睛。CNN体系结构基于InceptionV3模型,并且在Imagenet数据集上预估计了初始权重。我们使用了来自12个公共数据集的43 055底面图像。然后在100张图像的“看不见”集上测试了五个训练有素的合奏。要求七位认证的眼科医生对这些测试图像进行分类。结果认证的眼科医生在所有类别中达到72.7%的平均准确性,而DCE的平均准确性为79.2%(p = 0.03)。与眼科医生相比,DCE对DR分类的平均F1得分平均得分更高(76.8%vs 57.5%; P = 0.01),但在统计学上更高,但统计学上不显着的F1得分的F1得分(83.9%vs 75.7%; P = 0.10)和正常(85.9%vs; amd; 85.9%vs; (73.0%vs 70.5%; p = 0.39)。DCE在准确性和自信之间具有更大的平均一致性,而自信为81.6%vs 70.3%(p <0.001)。讨论我们开发了一个深度学习模型,发现与董事会认证的眼科医生相比,它可以更准确,可靠地对四类眼底图像进行分类。这项工作提供了算法能够仅使用眼底照片对多种视网膜疾病进行准确和可靠的识别的原则证明。
外染色体DNA(ECDNA)是癌症局灶性致癌基因扩增的中心机制,发生在大约15%的早期癌症和30%的晚期癌症中。ECDNA通过动态调节基因拷贝数并重新启动基因调节网络,驱动肿瘤形成,进化和耐药性。阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。 配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。 断点图的遍历已用于成功预测癌症样品中的ECDNA。 然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。 长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。 在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。 珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。 可用性:https://github.com/ampliconsuite/coral阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。断点图的遍历已用于成功预测癌症样品中的ECDNA。然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。可用性:https://github.com/ampliconsuite/coral与以前的基于简读的工具相比,珊瑚在广泛的模拟和9个数据集中的重建基本上改善了重建。随着长阅读的用法变得广泛,我们预计珊瑚将成为培养肿瘤中局灶性扩增的景观和演变的宝贵工具。
要了解系外行星和棕色矮人的高精度观察结果,我们需要详细且复杂的一般循环模型(GCM),这些模型(GCM)结合了水动力学,化学和辐射。在这项研究中,我们专门研究了GCMS中化学和辐射之间的耦合,并比较了相关化学中不同化学物种在相关性假设中混合的不同方法,当无法假设平衡化学时。我们提出了一种基于DeepSet(DS)的快速机器学习方法,该方法有效地结合了单个相关性-K的不相差(K-table)。我们与其他已发表的方法(例如自适应等效灭绝(AEE))以及与重新融资和求职(RORR)的随机重叠一起评估了DS方法。我们将这些混合方法集成到我们的GCM(Expert/MitGCM)中,并评估了它们的准确性和性能,以热木星HD 209458 b的示例。我们的发现表明,DS方法既适合GCM使用率准确又有效,而RORR太慢了。此外,我们观察到AEE的准确性取决于其特定的实现,并可能在实现辐射转移解决方案收敛时引入数值问题。然后,我们在简化的化学不平衡情况下应用了DS混合方法,在那里我们建模了Tio和Vo的雨水,并确认TIO和VO的雨水会阻碍平流层的形成。为了进一步加快GCM中一致的不平衡化学计算的发展,我们提供了文档和代码,用于将DS混合方法与相关-K辐射传递求解器耦合。DS方法已进行了广泛的测试,足以适合GCM。但是,可能需要加速大气检索的其他方法。
表1:GMCS计算基准测试研究中使用的宝石摘要。我们考虑了大肠杆菌核心(Orth等人,2010年); E. Coli,IML1515(Monk等人,2017年); P. Putida,IJN1463(Nogales等人,2020); S. cerevisiae,酵母-GEM V8.7.0(Lu等,2019);和人类细胞,人类v1.16.0(Robinson等人。,2020年)。在人类细胞的情况下,我们考虑了两种情况:在最普遍的生长培养基(人类GEM V1.16.0)和HAM的生长培养基(Human-Gem v1.16.0_culturemedia)下。根据反应数量,代谢产物和基因的数量,考虑的每种情况的维度。最后三列分析是否(是否)考虑了所考虑的不同方法,可以将考虑的方法应用于搜索相应的GEM的GMCS。