进步的成像技术大大提高了海洋视频和图像数据收集的速度。通常不会分析这些数据集的全部潜力,因为为多种物种提取信息非常耗时。这项研究证明了开源交互式机器学习工具Rootpainter的能力,可以快速准确地分析大型海洋图像数据集。在两个数据集中测试了根蛋白酶提取冷水珊瑚礁关联物种mycale Lingua的存在和表面积的能力:18 346个延时图像和1420个远程操作的车辆视频框架。与rootpainter集成的新纠正注释指标允许对何时停止模型训练并减少对手动模型验证的需求进行客观评估。使用Rootpainter创建了三个高度精确的M. Lingua模型,平均骰子得分为0.94±0.06。转移学习有助于两个模型的产生,将分析效率从6倍提高到16倍,比手动注释的延时图像快6倍。从两个数据集中提取表面积测量值,从而将来研究海绵行为和分布。向前迈进,交互式机器学习工具和模型共享可以大大提高图像分析速度,协作研究以及我们对生物多样性中时空模式的理解。
摘要 研究中根系量化的规模通常受采样、测量和处理样本所需时间的限制。卷积神经网络 (CNN) 的最新发展使得更快、更准确的植物图像分析成为可能,这可能显著减少根系测量所需的时间,但在让不具备机器学习深度知识的研究人员使用这些方法方面仍然存在挑战。我们使用 RootPainter CNN 软件分析了从三个破坏性根系采样中获取的根系图像,该软件具有一个更易于使用的校正注释界面。带有和不带有非根系碎片的根系扫描用于测试训练模型(即从标记示例中学习)是否可以通过将最终结果与干净图像的测量值进行比较来有效排除碎片。从土壤剖面壁和土壤芯横截面获取的根系图像也用于训练,并将得出的测量值与人工测量值进行比较。在每个数据集上训练 200 分钟后,我们发现,对于整体结构(R 2 =0.99)、剖面壁(R 2 =0.76)和土芯断裂(R 2 =0.57),手动测量结果与 RootPainter 得出的数据之间存在显著关系。从带有碎片的图像得出的生根密度与用 RootPainter 处理后的干净图像得出的生根密度没有显著差异。还可以从剖面壁和土壤芯图像中成功计算出生根密度,并且在每种情况下,根密度随深度的梯度与手动计数没有显著差异。我们的结果表明,使用 CNN 的所提出方法可以大幅减少根样本处理工作量,从而增加未来根系研究的潜在规模。关键词:深度学习 | 分割 | 根量化 | 剖面壁 | 根清洗 | 土壤芯取样