摘要。机器学习 (ML) 是人工智能系统背后的核心概念,它由数据驱动并生成 ML 模型。这些模型用于决策,因此,信任它们的输出至关重要,例如,了解它们导出的过程。解释 ML 模型导出的一种方法是跟踪整个 ML 生命周期,生成其数据沿袭,这可以通过来源数据管理技术来实现。在本文中,我们介绍了在油气勘探中必不可少的井顶采选的 ML 生命周期中使用 ProvLake 工具进行 ML 来源数据管理。我们展示了 ProvLake 如何支持 ML 模型的验证、对 ML 模型是否根据领域特征进行概括的理解及其导出。