覆盖度在外显子组测序中达到最高,从27.7X到33.6X不等。外显子组的中位覆盖度从14X到100X不等,而基因组测序则从27X到33X不等。从受试者的覆盖度来看,对于外显子组测序,超过58.8%的受试者对所有变异的覆盖度超过10X,对于许多变异,这个值达到了100%。对于15X和20X的覆盖度也是如此,拥有这种覆盖度的受试者比例最低分别为49.9%和35.7%,在很多情况下,这个值达到了100%。对于基因组测序,超过99.1%的受试者对所有变异的覆盖度超过10X,对于许多变异,这个值达到了100%。 15X 和 20X 以上的覆盖率也是如此,具有此类覆盖率的受试者的最低比例分别为 96.0% 和 82.9%,在许多情况下,该值达到 99.3% 和 95.1%。这些来自外显子组和基因组测序的覆盖率统计数据确保了变异调用的高可信度,并强调了我们
摘要:遥感 (RS) 目前被视为用于科学目的的入侵和扩张植物测绘的标准工具之一,并在自然保护管理中得到越来越广泛的应用。RS 方法的适用性由其局限性和要求决定。最重要的限制之一是物种覆盖率,在此覆盖率下分类结果是正确的并且对自然保护有用。2017 年在波兰三个地区开展的主要目标是确定可以通过 RS 方法识别目标物种的最小覆盖率。本研究的第二个目标与方法的要求有关,即根据多边形数量和目标物种的丰度百分比覆盖率优化目标物种的训练多边形集。我们的方法必须易于使用、有效且适用,因此使用基本栅格集(最小噪声分数 (MNF) 变换后的前 30 个通道(来自光谱范围为 0.4–2.5 µ m 的 HySpex 传感器的高光谱数据马赛克)和常用的随机森林算法进行分析。该分析使用空间分辨率为 1 m 的机载高光谱数据对一种入侵植物和三种扩张植物(两种草类和两种大型多年生植物)进行分类。地面训练和验证数据集与机载数据收集同时收集。在测试不同的分类场景时,仅更改目标物种的训练多边形集。分类结果基于三种方法进行评估:准确度测量(Kappa 和 F1)、具有不同物种覆盖度的子类中的真阳性像素以及与现场制图的兼容性。分类结果表明,要将目标植物物种分类到可接受的水平,训练数据集应包含物种覆盖度在 80-100% 之间的多边形。仅使用具有可变但较低覆盖度(20-70%)的物种的多边形进行训练,并在 80-100% 范围内缺失样本,导致地图不可接受,因为对目标物种的估计过高。考虑到生态系统是异质的,我们在物种覆盖度超过 50% 的地区实现了物种的有效识别。这些研究的结果开发了一种现场数据采集方法,以及在机载数据采集以及地面采样的训练和验证中同步的必要性。
戴胜八哥(Fregilupus varius)是鸮科的一种已灭绝物种,原产于印度洋的留尼汪岛。该物种在 19 世纪中叶迅速消失,主要原因是人类的过度开发。我们生成了一个覆盖度约为 11 9 的基因组来重建戴胜八哥的人口历史,并将这些结果与其他八哥和八哥物种的人口历史进行了比较。我们的分析证实了戴胜八哥与 Sturnia 属、Leucopsar 属和 Sturnornis 属的近亲关系,并揭示了它在进化史上经历了严重的种群瓶颈效应,但与其他灭绝或极度濒危的鸟类相比,其有效种群规模并不特别低。
抗生素治疗会对微生物群产生有害影响并导致抗生素耐药性。为了开发一种针对多种临床相关的大肠杆菌的噬菌体疗法,我们筛选了一个包含 162 种野生型 (WT) 噬菌体文库,确定了 8 种对大肠杆菌具有广泛覆盖度、与细菌表面受体互补结合并能稳定携带插入货物的噬菌体。选定的噬菌体经过尾纤维和 CRISPR-Cas 机制改造,以专门针对大肠杆菌。我们发现,工程噬菌体可以靶向生物膜中的细菌,减少噬菌体耐受性大肠杆菌的出现,并在共培养实验中胜过其祖先 WT 噬菌体。四种最具互补性的噬菌体的组合,称为 SNIPR001,在小鼠模型和小型猪中均具有良好的耐受性,并且比单独的组成部分更好地减少小鼠肠道中的大肠杆菌负荷。 SNIPR001 目前正在临床开发中,旨在选择性杀死大肠杆菌,大肠杆菌可能会导致血液癌症患者出现致命感染。
使用氯化锌沉淀法(7)从高滴度裂解物中提取 DNA,使用 NEBNext Ultra II 试剂盒(New England Biolabs,马萨诸塞州伊普斯威奇)制备用于测序,并使用匹兹堡噬菌体研究所(宾夕法尼亚州匹兹堡)的 Illumina MiSeq 仪器(v3 试剂)进行测序。对总共 1,056,847 个单端 150 bp 读数进行 9,214 倍覆盖度的测序。分别使用 Newbler v2.9 和 Consed v29.0 进行组装和质量控制检查(8, 9)。PineapplePizza 的基因组有 16,662 个碱基对,G + C 含量为 53.6%。没有测序读数超出基因组末端,基因组末端的 101 bp 反向重复与共价结合的末端蛋白一致,如 phi29(10)。使用 NCBI BLASTn (11) 进行全基因组比对,结果显示与其他 Microbacterium 噬菌体无显著的核苷酸序列相似性,PineapplePizza 被归类为单一基因。使用 Glimmer v3.02 (12) 和 GeneMark v2.5 (13) 自动注释 PineapplePizza 的基因组,然后使用 Phamerator (14)、DNA Master v5.23.6 ( http://phagesdb.org/DNAMaster/ )、PECAAN、BLAST (11) 和 HHPred (15) 手动细化。Aragorn v1.2.38 (16) 或 tRNAscan-SE v2.0 (17) 未鉴定出 tRNA 基因。所有分析均使用默认设置进行。
硬骨鱼类是研究性染色体和性别决定 (SD) 基因的重要模型,因为它们呈现出多种性别决定系统。在这里,我们使用 Nanopore 和 Hi-C 技术对 YY 南方鲶鱼 (Silurus meridionalis) 进行高连续性染色体水平基因组组装。组装长 750.0 Mb,其中重叠群 N50 为 15.96 Mb,支架 N50 为 27.22 Mb。我们还测序并组装了一个 XY 雄性基因组,其大小为 727.2 Mb,重叠群 N50 为 13.69 Mb。通过与我们之前组装的 XX 个体进行比较,我们确定了一个候选 SD 基因。通过对雄性和雌性池进行重新测序,我们在 Chr24 上鉴定了一个 2.38 Mb 的性别决定区 (SDR)。读取覆盖度分析和 X 和 Y 染色体序列比较表明,SDR 中有一个 Y 特异性插入(约 500 kb),其中包含 amhr2 的雄性特异性重复(名为 amhr2y)。amhr2y 和 amhr2 在编码区具有相同的核苷酸同一性(81.0%),但在启动子和内含子区域具有相同的核苷酸同一性,但较低。在雄性性腺原基中的独家表达和诱导雄性到雌性性别逆转的功能丧失证实了 amhr2y 在雄性性别决定中的作用。我们的研究为鱼类中 amhr2 作为 SD 基因提供了一个新的实例,并揭示了不同鱼类谱系中性别决定进化背后的 AMH/AMHR2 通路成员重复的趋同进化。
叶际代表一个独特的生态位,其中微生物获得了降解木质纤维素 (1) 的能力,以便在贫营养条件下生存。从叶际回收的微生物中,存在属于类芽孢杆菌科和糖芽孢杆菌属的细菌 (2)。糖芽孢杆菌属菌株 WB 17 是从 2018 年 1 月从法国香槟-阿登地区采集的小麦麸皮叶际培养物中回收的。培养在 30°C 的 1 M3 培养基 (3) 上进行,培养基中添加了小麦麸皮,有氧培养。糖芽孢杆菌属 WB 17 是根据其 16S rRNA 基因序列进行鉴定的,与糖芽孢杆菌属有关。为了进一步表征糖芽孢杆菌属的代谢潜力。 WB 17 及其分离木质纤维素的能力,对其整个基因组进行了测序。Saccharibacillus sp. WB 17 在 Luria-Bertani 培养基中在 30°C 下生长 48 小时,并使用 PureLink 基因组 DNA 迷你试剂盒(赛默飞世尔科技)提取其基因组 DNA。使用 Nextera DNA 样品制备试剂盒(Illumina,美国加利福尼亚州圣地亚哥)按照制造商的用户指南进行全基因组散弹枪测序(2 150 bp),并在 NovaSeq 系统(MR DNA [Molecular Research],美国德克萨斯州 Shallowater)上进行测序。总共获得了 30,007,734 个读数。使用 FastQC (4) 对序列数据文件进行质量过滤,然后通过 SOAPdenovo(版本 2.04)(5)进行从头组装;所有软件均使用默认参数。共检测到47个contig,测序覆盖度为409倍。N 50 值为205,341 bp。组装基因组大小为5,391,836 bp。该菌株的基因组大小介于两个最接近的Saccharibacillus亲属之间(Saccharibacillus sacchari GR21 T 为6.08 Mbp,Saccharibacillus kuerlensis HR1 T 为4.69 Mbp)。Saccharibacillus sp. WB 17的GC含量为58.82%。该值在Saccharibacillus基因组已知值范围内。事实上,之前测序的基因组记录的 GC 含量值如下:58.4 mol% ( Saccharibacillus qingshengii H6 T ) (6)、57.8 mol% ( S. sacchari GR21 T ) (7)、50.5 mol% ( S. kuerlensis HR1 T ) (8) 和 55.5 mol% ( Saccharibacillus deserti WLJ055 T ) (9)。Saccharibacillus sp. WB 17 的基因组草图由 NCBI 原核生物基因组注释流程 (PGAP) ( https://www.ncbi.nlm.nih.gov/genome/annotation_prok ) 注释;它包含 73 个 tRNA、4,826 个基因和 4,730 个编码序列 (CDS)。仅注释了 1,139 个 CDS,占基因组内容的 22%。根据碳水化合物活性酶数据库 (CAZy) 数据库 (10),基因组共编码 236 个碳水化合物活性酶,分为五类,即糖苷水解酶 (145 个 CDS)、糖基转移酶 (31 个 CDS)、多糖裂解酶 (3 个 CDS)、碳水化合物酯酶 (31 个 CDS) 和碳水化合物结合模块 (21 个 CDS);然而,