Loading...
机构名称:
¥ 1.0

大生物多样性数据集具有较大的分类,地理和时间范围,具有监测和研究的巨大潜力。此类数据集对于评估物种种群和分布的时间变化尤为重要。可用数据中的差距,尤其是空间和时间差距,通常意味着数据不能代表目标人群。这阻碍了大规模推论,例如关于物种的趋势,并可能导致放错了保护作用。在这里,我们概念化了生物多样性监视数据的差距是缺少的数据问题,该数据为不同类型的生物学数据集的挑战和潜在解决方案提供了一个统一的框架。我们将典型的数据差距类型表征为不同类别的缺少数据类别,然后使用丢失的数据理论来探讨有关物种趋势和影响事件/丰富性的因素的含义。通过使用此框架,我们表明,当影响采样和/或数据可用性与影响物种的因素重叠时,可能会由于数据差距而产生的偏差。,但数据集本身没有偏见。结果取决于生态问题和统计方法,该方法确定了围绕哪些变异来源考虑的选择。我们认为,使用监视数据进行长期物种趋势建模的典型方法特别容易受到数据差距的影响,因为这种模型不倾向于说明驱动缺失的因素。为了确定解决此问题的一般解决方案,我们回顾了实证研究并使用仿真研究来比较一些最常使用的方法来处理数据差距,包括亚采样,加权和插补。所有这些方法具有减少偏差的潜力,但可能以增加参数估计的不确定性成本。加权技术可以说是迄今为止生态学中最不使用的,并且具有减少参数估计的偏差和方差的潜力。无论方法如何,降低偏见的能力都取决于对数据差距的知识和数据的可用性。在处理数据收集和分析工作流的不同阶段的数据差距时,我们使用此评论概述了必要的考虑。

将生物多样性数据中的差距和偏见视为缺失的数据问题

将生物多样性数据中的差距和偏见视为缺失的数据问题PDF文件第1页

将生物多样性数据中的差距和偏见视为缺失的数据问题PDF文件第2页

将生物多样性数据中的差距和偏见视为缺失的数据问题PDF文件第3页

将生物多样性数据中的差距和偏见视为缺失的数据问题PDF文件第4页

将生物多样性数据中的差距和偏见视为缺失的数据问题PDF文件第5页