详细内容或原文请订阅后点击阅览
从数据科学家到 AI 架构师
数据科学中以模型为中心的思维的终结《从数据科学家到 AI 架构师》一文首先出现在《走向数据科学》上。
来源:走向数据科学(不久前)当一名数据科学家意味着生活在笔记本中,调整超参数,就好像你的生活依赖于它一样,在很多情况下,整个项目确实依赖于它。
你还记得那些通宵达旦的网格搜索吗?或者构建感觉更像艺术而不是科学的特征工程管道?从 XGBoost 模型中挤出额外 0.7% 的准确度会带来满足感吗?
回到 2019 年,那是数据科学家的工作!这是有道理的。如果您想要一个强大的模型,您必须自己构建它或努力使其正确。真正的价值来自于您调整、优化和理解数据的能力。
现在,“最先进的”只需 API 调用即可。需要顶级语言模型吗?完毕。需要嵌入或多模态推理?也做完了。建模中最困难的部分现在由可扩展端点处理,远远超出了大多数团队可以自行构建的范围。
现在的问题是,如果模型已经有了,那么工作去哪儿了?
值不再仅仅存在于模型中。关键在于所有部分如何连接、沟通和适应。这种变化正在彻底重塑数据科学家的角色。
你问怎么办?这就是本文的全部内容。
发生了什么变化?
1. Bypassing the .fit() Method
如果您查看现代人工智能项目中的代码,您很快就会发现没有太多实际建模。
您可能会看到对 LLM 或嵌入模型的调用,但这很少是主要挑战。真正的工作是数据摄取、路由、组装上下文、缓存、监控和处理重试。
换句话说,using.fit() 现在是代码中最不有趣的部分之一。
2. Adapting to the New Components
如今,我们不再关注模型内部结构,而是用现成的组件组装系统。 A typical modeling stack now includes:
