详细内容或原文请订阅后点击阅览
在VK Tech中推出了俄罗斯的第一个Data Lakehouse
该解决方案基于其自身开发的S3兼容对象存储和基于Kubernetes的高性能云Trino SQL引擎。
来源:OSP网站大数据新闻VK Tech是俄罗斯的第一位供应商,它为用户提供了建立有关托管云服务的公司数据湖设施的机会。由于在新的Cloud Trino服务的VK云平台上的出现,可以从各种来源处理大量数据,因此Data Lakehouse的推出已成为可能。
VK Cloud中的Data Lakehouse是一种新的方法来存储和分析数据,结合了“数据湖”和公司数据存储(数据仓库)的最佳元素。它使您可以减少数据存储系统的负载,降低非结构化数据的存储成本,并由于计算节点和数据存储设施的分离而有效分析它。
Data Lakehouse在VK Cloud平台上的数据湖设备是根据S3兼容对象存储自己的开发的S3兼容对象存储,并根据Kubernetes实施了高性能SQL-Engine Cloud Trino。在Data Lakehouse中使用改良的流行打开器组件使公司可以获得现代堆栈以处理大型项目,仅用于实际消费资源的付款,而无需购买许可证。
多亏了与多个来源的并行连接,Cloud Trino允许您减少ETL流程上的时间,加速处理原始数据,并使来自公司各个部门的用户能够快速获取数据,以便轻松构建构建数据分析以自助服务模式。使用云存储(S3)可以减少将1 GB数据存储在云中的10倍 - 最多3卢布。而不是35卢布。用于数据仓库。随着业务需求的增长,Cloud Kubernetes允许您快速扩展基础架构,而不是重新加载基础架构以达到峰值负载。
Data Lakehouse可作为云平台构建,因此基于私有云和VK数据平台的基础架构。公共云VK云的基础架构根据152-os(UZ-1)的要求认证。