数据科学在各种地球科学学科和应用中受到越来越多的关注。最近报道了许多成功的数据驱动地球科学发现,许多地球科学会议上的地理信息学和数据科学会议数量也开始增加。学术界、工业界和政府部门对了解当前进展以及数据科学对地球科学的潜力有着浓厚的兴趣。为了满足这一需求,本文从数据生命周期的角度进行了回顾。数据生命周期中的关键步骤包括概念、收集、预处理、分析、存档、分发、发现和重新利用。这些主题直观且易于理解,即使对于在网络基础设施、统计和机器学习方面经验非常有限的地球科学家也是如此。回顾包括两个关键部分。第一部分介绍数据科学的基本概念和理论基础,第二部分总结了现有出版物中围绕数据生命周期每个步骤的亮点和可分享的经验。最后,本文展望了地球科学领域数据科学应用的未来趋势,包括对开放科学、智能数据和团队科学的讨论。我们希望这篇评论对地球科学界的数据科学从业者有所帮助,并引发更多关于地球科学领域数据科学最佳实践和未来趋势的讨论
主要关键词