使您成为高级数据科学家的 6 项技术技能

除了编写代码之外,这些设计层面的决策、权衡和习惯悄悄地将高级数据科学家与其他人区分开来。文章 6 使您成为高级数据科学家的技术技能首先出现在走向数据科学上。

来源:走向数据科学

老实说。2025 年编写代码比十年前甚至五年前容易得多。

我们从 Fortran 迁移到 C 再到 Python,每一步都减少了工作所需的工作量。现在,像 Cursor 和 GitHub Copilot 这样的工具可以编写样板文件、重构函数,并通过几行自然语言改进编码管道。

与此同时,越来越多的人开始涉足人工智能、数据科学和机器学习领域。产品经理、分析师、生物学家、经济学家,凡是你能想到的,都在学习如何编码、了解人工智能模型如何工作以及如何有效地解释数据。

所有这些都是为了说明这一点:

高级数据科学家和初级数据科学家之间的真正区别不再是编码水平。

别误会我的意思。差异仍然是技术性的。它仍然取决于对数据、统计和建模的理解。但它不再是一个能够在白板上反转二叉树或在 O(n) 中解决算法的人。

在我的职业生涯中,我曾与不同领域的一些杰出数据科学家合作过。随着时间的推移,我开始注意到高级数据专业人员处理问题的方式,这与他们采用的具体模型或编码能力无关:而是与他们采用的结构化和有组织的工作流程有关,将不存在的产品转换为强大的数据驱动解决方案。

在本文中,我将描述高级数据科学家在开发 DS 产品或功能时使用的六阶段工作流程。高级数据科学家:

  • 在接触代码之前绘制生态系统
  • 像运营商一样思考 DS 产品
  • 用“笔和纸”端到端地设计系统
  • 从简单开始,然后获得增加复杂性的权利
  • 询问指标和输出
  • 调整向观众的输出并选择正确的工具来展示他们的作品
  • 让我们开始吧!

    绘制生态系统图

    了解这个生态系统从提出以下问题开始:

  • 我们正在改进的具体问题是什么,今天是如何解决的?
  • 好的,现在我们有:

    结论