为什么选择 ETL-Zero?初学者了解数据集成的转变

当我准备 Salesforce Data Cloud 认证时,我遇到了 Zero-ETL 这个术语。继续阅读 Towards Data Science »

来源:走向数据科学

为什么要使用 ETL-Zero?了解数据集成的转变

当我准备 Salesforce Data Cloud 认证时,我遇到了术语 Zero-ETL。数据云提供了直接从其他系统(例如数据仓库或数据湖)访问数据或与这些系统共享数据而无需复制数据的可能性。Salesforce 也将其描述为 Bring Your Own Lake (BYOL),指的是术语 Bring Your Own Device (BYOD)。我想更好地理解 Zero-ETL 的概念,并以一种易于理解的方式进行说明。

在本文中,我将向您展示如何使用 Python 创建简化的 ETL 流程,以更好地理解这个概念、Zero-ETL 或 Zero-Copy 的含义以及如何在 Salesforce Data Cloud 中实现这种新的数据集成方法。

目录1) 传统 ETL 流程:面向初学者的 Python 分步指南2) 那么什么是 Zero-ETL?3) 为什么要使用 Zero-ETL?优点和缺点4) Salesforce 数据云中的 Zero-ETL 是什么样的?5) 最后的想法

目录1) 传统 ETL 流程:面向初学者的 Python 分步指南2) 那么什么是 Zero-ETL?3) 为什么是 Zero-ETL?优点和缺点4) Salesforce 数据云中的 Zero-ETL 是什么样的?5) 最后的想法

目录 1) 传统 ETL 流程:面向初学者的 Python 分步指南 2) 那么什么是 Zero-ETL? 3) 为什么是 Zero-ETL?优点和缺点 4) Salesforce 数据云中的 Zero-ETL 是什么样的? 5) 最后的想法

1) 传统 ETL 流程:面向初学者的 Python 分步指南

如果您已经熟悉 ETL 和 ELT 流程,则可以跳过此部分。如果您是这个主题的新手,请查看超级简化的示例,以更好地理解提取 - 转换 - 加载过程。或者更好的是,自己构建它 - 通过应用它,您通常会更好地理解这些概念。