“磁铁”:多峰湖屋

Sergey Chernomyrdin,Againit Data Architecture的负责人,关于Lakehouse的引入,根据开源解决方案部署在Yandex.Trans中。在它的帮助下,它不仅计划替换所使用的数据平台,而且还计划显着提高数据服务质量。

来源:OSP网站大数据新闻

Magnit 正在实施 Lakehouse,基于开源解决方案部署在 Yandex.Cloud 中。该项目旨在替代所使用的数据平台,是进口替代计划的重要组成部分。此外,在其帮助下,该公司计划显着提高数据服务的质量。 Magnit 数据架构主管、数据奖提名者 Sergey Chernomyrdin 谈论该项目的实施。

数据奖

- Magnit 正在实施的项目的本质是什么?

作为进口替代项目计划和数据民主化战略目标的一部分,我们正在引入企业 Lakehouse。该解决方案改变了处理数据的方法,使数据和分析数据的工具更容易使用。

我想重点关注一个已经运行的系统,该系统重新思考传统的数据处理任务。 Lakehouse 存储原始数据,但在某些情况下,这些数据也会简化为关系结构。在这种格式中,我们跟踪真实的变化并保存从集成那一刻起的整个历史记录,使我们能够将信息系统的状态恢复到任何日期。这对于调查事件和一些业务案例至关重要,并且还允许我们讨论在 Lakehouse 中备份这些数据的附加电路。

此外,Lakehouse 还具有内置的数据质量检查(同步和异步)以及与企业数据目录和业务术语表的集成。我们去年详细讨论过这个问题,因此我们成为了 2024 年数据奖的获得者。

- Lakehouse 系统已在各地实施。是什么让您的项目脱颖而出?

首先,它是业界第一家公有云的企业Lakehouse。其次,Lakehouse 充当数据中心——数据不仅用于分析,还用于运营流程,包括对商店和物流运营至关重要的流程。

- 该解决方案在哪些平台上实施?

- 如何与源集成?