在两个个体之间共享的长DNA序列,称为下降(IBD)段相同,是识别亲密和遥远的生物学关系的强大信号,因为它们仅在两人共享一个最近的共同祖先时才会出现。由于通常较低的覆盖率和高基因分型错误率,因此无法直接应用于当今基因组之间的IBD段的现有方法。我们提出了ANCIBD,这是一种识别作为Python软件包实现的人类ADNA数据的IBD段的方法。我们的方法基于一个隐藏的马尔可夫模型,该模型使用基于现代参考物质变化的现代参考面板估算的输入基因型概率。通过模拟和下采样实验,我们证明了ANCIBD可牢固地识别IBD段的时间超过8厘米的aDNA数据,其中至少为0.25倍平均平均全基因组测序(WGS)覆盖率(WGS)覆盖率至少为1倍,或至少1倍的平均富集实验,以实现大量使用ADNA SNP'1240'1240。此应用程序范围使我们能够筛选IBD段的ADNA记录的很大一部分,并展示了两个下游应用程序。首先,我们利用以下事实:预计生物亲戚将共享多个长期IBD段,我们确定了10,156个古欧亚的个人之间的亲戚,并记录了长途迁移的证据,例如,通过确定一对约1410公里的五级亲戚,在中部中部是Asia中的1410公里。第二,通过应用ANCIBD,我们揭示了从5000年前开始与草原牧民有关的血统传播到欧洲的新细节。我们发现,中部和北欧的第一批人都携带大量的草原 - 经济学,与有线的商品文化相关,与长IBD(12-25厘米)的高速率与庞蒂式 - caspian steppe的Yamnaya牧民共享,这是一个强烈的瓶颈和近来的生物学连接,这是一定的生物学连接 - 饰有绳索的人。我们还检测到有绳的人与与球状两栖培养物(GAC)和乌克兰相关的人之间长长的IBD段的共享,这些人是尚未携带类似草原的血统的铜时代农民。这些IBD链接在我们的分析中出现在所有有线的商品组中,这表明与GAC背景有关的个人必须在遗传混合物的早期产生重大的人口影响,从而导致欧洲各种有线的Ware群体。这些结果表明,检测ADNA中的IBD段可以在小规模上产生新的见解,这与了解人们的生活故事以及与大规模文化历史事件有关的宏观相关。
主要关键词