从数据科学家到 AI 架构师 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

从数据科学家到 AI 架构师

2026年5月8日 18:00 33 Comments

数据科学中以模型为中心的思维的终结《从数据科学家到 AI 架构师》一文首先出现在《走向数据科学》上。

来源:走向数据科学

（不久前）当一名数据科学家意味着生活在笔记本中，调整超参数，就好像你的生活依赖于它一样，在很多情况下，整个项目确实依赖于它。

你还记得那些通宵达旦的网格搜索吗？或者构建感觉更像艺术而不是科学的特征工程管道？从 XGBoost 模型中挤出额外 0.7% 的准确度会带来满足感吗？

回到 2019 年，那是数据科学家的工作！这是有道理的。如果您想要一个强大的模型，您必须自己构建它或努力使其正确。真正的价值来自于您调整、优化和理解数据的能力。

现在，“最先进的”只需 API 调用即可。需要顶级语言模型吗？完毕。需要嵌入或多模态推理？也做完了。建模中最困难的部分现在由可扩展端点处理，远远超出了大多数团队可以自行构建的范围。

现在的问题是，如果模型已经有了，那么工作去哪儿了？

值不再仅仅存在于模型中。关键在于所有部分如何连接、沟通和适应。这种变化正在彻底重塑数据科学家的角色。

你问怎么办？这就是本文的全部内容。

如果您查看现代人工智能项目中的代码，您很快就会发现没有太多实际建模。

您可能会看到对 LLM 或嵌入模型的调用，但这很少是主要挑战。真正的工作是数据摄取、路由、组装上下文、缓存、监控和处理重试。

换句话说，using.fit() 现在是代码中最不有趣的部分之一。

如今，我们不再关注模型内部结构，而是用现成的组件组装系统。 A typical modeling stack now includes:

矢量数据库（例如 Pinecone、Milvus）

Prompt engineering.

内存层。

Collect a labeled dataset.

科学家矢量数据处理调用网格搜索人工智能先进的嵌入 fit 模型现在的调整项目意味着模型的部分组装数据库困难的强大的真正的准确度需要科学的构建建模数据现成的