Mastering Hadoop, Part 3: Hadoop Ecosystem: Get the most out of your cluster
探索Hadoop生态系统 - 最大化群集潜在的帖子掌握Hadoop的关键工具,第3部分:Hadoop Ecosystem:从您的集群中获得最大的收益,首先出现在数据科学上。
Mastering Hadoop, Part 1: Installation, Configuration, and Modern Big Data Strategies
涵盖Hadoop设置,HDFS命令,MAPREDUCE,调试,优势,挑战以及大数据技术的未来的全面指南。《掌握Hadoop》,第1部分:安装,配置和现代大数据策略首先出现在数据科学方面。
这份 TDWI 报告加速了用户对 Hadoop 周围出现的新产品、技术和最佳实践的理解。它还将帮助读者将可用选项与用例联系起来,重点关注主流企业用途,同时尊重经过验证的 IT 实践并提供最大的业务价值。
Most Data Quality Initiatives Fail Before They Start. Here’s Why.
给我看看你的数据质量记分卡,我会告诉你一年后你是否会成功。照片由 Braden Collum 在 Unsplash 拍摄我每天都会与那些准备投入大量时间和资源用于注定会失败的数据质量计划的组织交谈。激励措施和 KPI 可以推动良好行为,这并不奇怪。销售薪酬计划受到严格审查,因此它们经常成为董事会会议的话题。如果我们对数据质量记分卡给予同样的关注会怎样?即使在其鼎盛时期,来自 Hadoop 时代的传统数据质量记分卡也很少取得巨大成功。我之所以知道这一点,是因为在创办 Monte Carlo 之前,我曾担任运营副总裁多年,试图创建能够推动信任和采用的数据质量标准。在过去几年中,云计算和元数据管理方
本文探讨了非极客但精通技术的业务专业人士如何理解如何使用 Hadoop,以及它将如何影响未来几年的企业数据环境。该论文作为一本手册,展示了六种常见的“玩法”,说明了 Apache Hadoop 如何支持和扩展企业数据仓库 (EDW) 生态系统。