数据科学项目的概念框架

常见框架类型的概述以及构建自定义框架的简单过程数据科学项目的概念框架帖子首先出现在走向数据科学上。

来源:走向数据科学

是用于表示抽象概念和组织数据的分析结构。数据科学家经常有意或无意地使用此类框架来制定项目计划,选择平衡各种权衡的机器学习模型,并向利益相关者提出研究结果和建议。本文概述了常见类型的概念框架、构建自定义框架的简单三步过程以及成功完成此操作的技巧。

注:以下部分中的所有图形均由本文作者创建。

注意:

常见框架类型

尽管概念框架有许多不同的形状和大小,但四种基本框架类型在数据科学项目中特别常见:层次结构、矩阵、流程流和关系图。我们将在下面简要介绍每种框架类型。

层次结构 矩阵 流程 关系映射

层次结构

分层框架通常采用树形图的形式,从根节点开始,以多个叶节点结束,如图 1 所示。例如,根节点可能表示分类法中的总体概念或决策树中的初始二元问题。节点在层次结构(或树)中的位置为我们提供了有关其与其他节点关系的有价值的信息。尽管图 1 将层次结构中的项目标记为“概念”,但它们可以是任何类型的实体。实体可能是中性的(例如概念、主题、细分)或具有某些正价或负价(例如收入、成本、问题)。层次结构的深度和广度可能有所不同。

图 1:分层框架的通用结构
互斥 累积详尽 MECE

矩阵

n
图 2:二乘二矩阵框架的通用结构

流程

图 3:流程框架的通用结构

关系映射

图 4:路径图的通用结构
交易: 因果: 基于相似性: 相关性 基于会员: 类型 尺寸
视频