为您的数据带来结构

使用路径模型测试假设在复杂的路径模型中,找到自己的路可能变得困难。照片由 Deva Darshan 在 Unsplash 上拍摄数据科学家经常收集大量变量并寻找它们之间的关系。在此过程中,对变量之间究竟如何相互关联做出假设和假设会很有帮助。学生为下一次考试学习的动力会影响他们的成绩吗?或者好成绩会激发学习的动力吗?激励人们表现出的行为模式究竟是什么,最终会带来好成绩?为了给上述问题提供一些结构,并提供一个工具来实证测试它们,我想在本文中解释路径模型,也称为结构方程模型 (SEM)。虽然在心理学等社会科学中路径模型很常用,但我觉得它们在数据科学和计算机科学等其他领域并不那么突出。因此,我想概述路径分析的主要概念,并介绍 semopy,这是一个在 python 中应用路径分析的包。在本文中,我们将分析人工数据,以展示可以用路径模型解决的典型问题,并介绍调节器和中介器的概念。请注意,这些数据是为了演示目的而生成的,可能并非在每个细节上都符合现实。研究问题在分析数据之前,我们需要知道我们要搜索什么。照片由 Ansia La 拍摄

来源:走向数据科学

将结构带入您的数据

用路径模型测试假设

deva darshan Unplash

数据科学家通常会收集大量变量并寻找它们之间的关系。在此旅程中,对变量彼此之间如何相互关系有假设和假设是有帮助的。学生学习下一次考试的动机会影响他们的成绩吗?还是良好的成绩会导致学习的动力?最终导致人们表现出良好成绩的行为模式到底是什么?

为上述问题提供一些结构,并提供一种以经验测试的工具,我想在本文中解释路径模型,也称为结构方程模型(SEM)。尽管在社会科学中通常使用了心理学路径模型,但我觉得它们在数据科学和计算机科学等其他领域并不突出。因此,我想概述路径分析的主要概念并介绍Semopy,这是用于在Python中应用路径分析的软件包。在本文中,我们将分析人工数据,以展示可以通过路径模型解决的典型问题,并介绍主持人和介体的概念。请注意,这些数据是出于演示目的而生成的,并且在每个细节上可能都不是现实的。

路径模型 结构方程模型 SEM 路径分析 Semopy 主持人 调解人

研究问题

ansia lasa

这一切都从数据开始

现在,我们拥有此处显示的所有变量的数据:

如何确切
假设所有变量直接影响变量等级的模型。作者的图像。
。作者的图像。

每个箭头都描述了变量之间的影响。我们还可以将这种关系作为加权总和,这样:

grades = a*feelt_of_belonging + b*number_of_friends + c*关系_WITH_TEACHER + D*FUN_IN_IN_SCHOOL + e*impelligence + f*ivey_in_topic

feel_of_belonging number_of_friends 关系_WITH_TEACHER fun_in_school 智能 等级 a