数据沿袭:是风险还是创造价值的机会?您是否可以在本地和云中以信任的方式共享业务关键数据?• 数据使用是否得到理解并符合政策?• 数据如何从本地移出或移至云?• 数据转换期间会产生哪些影响?• 是否跟踪敏感数据移动以评估风险?• 数据传输是否符合监管合规法律?• 数据流是否透明,以便做出可靠的决策?• 数据源对于分析程序和 AI 而言是否可靠?
摘要。机器学习 (ML) 是人工智能系统背后的核心概念,它由数据驱动并生成 ML 模型。这些模型用于决策,因此,信任它们的输出至关重要,例如,了解它们导出的过程。解释 ML 模型导出的一种方法是跟踪整个 ML 生命周期,生成其数据沿袭,这可以通过来源数据管理技术来实现。在本文中,我们介绍了在油气勘探中必不可少的井顶采选的 ML 生命周期中使用 ProvLake 工具进行 ML 来源数据管理。我们展示了 ProvLake 如何支持 ML 模型的验证、对 ML 模型是否根据领域特征进行概括的理解及其导出。