摘要 - 尽管与DNA降低相关的费用正在迅速降低,但目前的成本约为1.3k/tb,这比今天现有的档案存储解决方案从现有的档案存储解决方案中阅读起来昂贵。在这项工作中,我们旨在通过研究DNA覆盖深度问题来减少DNA存储的成本,还要减少DNA存储的潜伏期,该问题旨在减少所需数量的读取数量以从存储系统中检索信息。在此框架下,我们的主要目标是了解如何将错误纠正代码与给定检索算法配对以最大程度地减少测序覆盖范围的深度,同时确保具有很高概率的信息。此外,我们研究了随机访问设置下的DNA覆盖深度问题。I。由于其显着的密度和耐用性,DNA是一种有前途的存储介质。任何DNA存储系统[1],[8],[17],[23]中的主要组件之一是DNA Sequencer,它可以读回用户的预存储信息。如今,DNA测序仪相对于其他替代存储技术的吞吐量相对较慢,并且成本相对较高[19],[24],[25]。这些问题与所谓的DNA储存覆盖深度有关,DNA存储的覆盖深度定义为所述的读数数量与合成寡核的数量之间的比率[12]。减少覆盖范围的深度可以改善任何现有的DNA存储系统的延迟,并降低其成本。简单地说,DNA覆盖深度问题旨在最大程度地减少覆盖深度,同时保持系统可靠性。是由覆盖深度,潜伏期和成本之间的联系的动机,在这项工作中,我们启动了对新问题的研究,被称为DNA覆盖深度概率。在这项工作中,我们研究了所需的覆盖深度作为DNA存储通道,错误校正代码和重建算法的函数。此外,我们试图了解如何将错误纠正的代码与给定的重建算法配对,以最大程度地减少覆盖范围的深度。将在随机和非随机访问设置下研究此问题。DNA覆盖深度问题与优惠券收集器(CCP),Dixie Cup和URN问题[7],[9],[10],[16]有关。对于所有这些问题,假定n种不同类型的优惠券,感兴趣的问题是人们在拥有每种类型的一张优惠券之前应收集多少优惠券。众所周知,如果优惠券是随机统一绘制的(重复),则预期
CFB,补体因子 B;CFD,补体因子 D;MAC,膜攻击复合物;MASP-3,甘露聚糖结合凝集素相关丝氨酸蛋白酶-3;PNH,阵发性睡眠性血红蛋白尿;RBC,红细胞。1. Risitano AM 等人。Front Immunol。2019;10:1157。2. Notaro R 等人。N Engl J Med。2022;387:160-6。3. Risitano AM 等人。Immunol Rev。2023;313:262-78。4. Loschi M 等人。Am J Hematol。2016;91:366-70。5. Fattizzo B 等人。J Blood Med。2022;13:327-35。 6. Belcher JD 等人。翻译研究。2022;249:1-12。