图 1:估计开放存储库中未知数量的“缺失”数据集。美国和加拿大最近发布的两个哺乳动物、鸟类、爬行动物和两栖动物宏观遗传数据库中重叠数据集的空间分布 (a) 和比例 (b):1) MACROPOPGEN 17,由从已发表文章中提取的地理参考微卫星得出的汇总统计数据组成;2) SDbG 18–20 由直接从开放存储库中提取的原始微卫星基因型数据集组成。经过交叉检查,只有 21.38% 的数据条目在两个数据库中都找到了(黑点),而 59.5% 的数据条目仅在 MACROPOPGEN 中找到(蓝点)。低重叠率表明 MACROPOPGEN 中包含的大部分遗传研究没有可查找的公开存档数据和/或足够的元数据,因此无法在 SDbG 中使用。
主要关键词