如何学习数据科学数学:初学者的路线图

对从哪里开始数据科学数学感到困惑?了解哪些数学概念要以什么顺序学习以及如何在实践中使用它们。

来源:KDnuggets
作者的图像|意识形态图

您不需要严格的数学或计算机科学学位就可以进入数据科学。但是您确实需要了解算法背后的数学概念,并分析您每天使用。但是为什么这很困难?

好吧,大多数人向后处理数据科学数学。他们直接进入抽象理论,不知所措并退出。真相?数据科学所需的几乎所有数学都基于您已经知道的概念。您只需要连接点,看看这些想法如何解决实际问题。

此路线图着重于实际上实际上重要的数学基础。没有理论上的兔子孔,没有不必要的复杂性。希望您对此有所帮助。

第1部分:统计和概率

统计在数据科学中不是可选的。从本质上讲,这是您如何将信号与噪声分开并提出可以捍卫的主张。没有统计思维,您只是用精美的工具做出了有根据的猜测。

这是为何重要的:每个数据集都讲述一个故事,但是统计数据可帮助您弄清楚该故事的哪些部分是真实的。当您了解发行版时,您可以立即发现数据质量问题。当您知道假设测试时,您就会知道您的A/B测试结果实际上意味着什么。

您将学到的内容:从描述性统计开始。您可能已经知道,这包括手段,中位数,标准偏差和四分位数。这些不仅是摘要号码。学会可视化发行版,并了解不同形状告诉您数据的行为。

概率下一步。了解概率和条件概率的基础知识。贝叶斯定理看起来可能有些困难,但这只是一种系统的系统方式,可以通过新的证据来更新您的信念。从垃圾邮件检测到医学诊断,这种思维模式无处不在。

关键资源:

第2部分:线性代数

学习资源:

第3部分:演算

资源:

第4部分:统计和优化的一些高级主题

总结

Bala Priya C