详细内容或原文请订阅后点击阅览
构建用户友好型数据表的 5 大原则
设计直观、可靠的表格,您的数据团队一定会喜欢继续阅读 Towards Data Science »
来源:走向数据科学构建用户友好数据表的前5个原则
设计数据团队会喜欢的直观和可靠表
在数据科学和分析工作七年中,我创建并查询了许多表。我多次想知道:“这列是什么意思?” “为什么表A和表B中有两个具有相同名称的列?我应该使用哪一个?” “这张桌子的粒度是什么?”等。
如果您面临同样的挫败感,那么本文适合您!
在本文中,我将分享五个原则,这些原则将帮助您创建同事会欣赏的桌子。请注意,这是从数据科学家的角度写的。因此,它不会涵盖传统的数据库设计最佳实践,而是专注于制作用户友好表的策略。
I.真理的单一来源
维持每个关键数据点或度量标准的真实来源对于报告和分析非常重要。多个表中不应有任何重复的逻辑。
为方便起见,有时我们会在多个表中计算相同的指标。例如,客户表,每月财务报告表,商人表…
总商品价值(GMV)