5您需要在下一次数据科学访谈之前需要了解的5个统计概念

这些常见的,基本的统计和机器学习概念对于降落数据科学家授予5个统计概念至关重要,您需要在下一次数据科学采访之前首先了解数据科学。

来源:走向数据科学

在我自己的数据科学求职旅程中,很幸运有机会与许多公司面试。

数据科学

与真实的人会面时,这些访谈一直是技术和行为的混合在一起,我也得到了自己的一系列评估任务,可以自己完成。

通过此过程,我已经对数据科学访谈中通常提出了哪些问题进行了大量研究。这些是您不仅应该熟悉的概念,而且还知道如何解释。

1。P值

作者的图像

进行统计测试时,通常您将具有零假设H0和替代假设H1。

假设您正在进行一个实验,以确定某些减肥药物的有效性。 A组服用了安慰剂,B组服用了药物。然后,您计算每组六个月内损失的平均磅数,并希望查看B组减轻的体重数是否在统计学上显着高于A组A。在这种情况下,零假设,H0将是H0在两组之间损失的平均LBS损失的统计学差异没有统计学上的显着差异,这意味着该药物对体重减轻没有实际影响。 H1是有很大的差异,并且B组由于药物而减轻了更多的体重。

回顾:

    H0:平均磅损失组A =平均磅损失组BH1:平均磅损失组A <平均LBS损失b
  • H0:平均磅损失组A =平均磅损失组B
  • H1:平均磅损失组A <平均磅损失组B
  • 然后,您将进行t检验以比较手段以获得P值。这可以在Python或其他统计软件中完成。但是,在获得p值之前,您将首先选择将P与P比较P的alpha(α)值(aka显着性水平)。

    t检验

    选择的典型alpha值为0.05,这意味着I型错误的概率(说如果没有时的均值存在差异)为0.05或5%。

    平均值 标准偏差