PySpark for Beginners: Mastering the Basics
理解分布式数据、惰性逻辑和您的第一个 DataFrame 的分步指南。面向初学者的 PySpark:掌握基础知识一文首先出现在 Towards Data Science 上。
4 YAML Files Instead of PySpark: How We Let Analysts Build Data Pipelines Without Engineers
我们如何用 dlt、dbt 和 Trino 取代 Python 管道,并将交付时间从几周缩短到一天。帖子 4 YAML 文件代替 PySpark:我们如何让分析师在没有工程师的情况下构建数据管道首先出现在走向数据科学上。