详细内容或原文请订阅后点击阅览
正在酝酿的 GenAI 数据科学革命
如果您现在领导一个企业数据科学团队或定量研究部门,您可能会感觉自己生活在两个平行的宇宙中。在一个宇宙中,你会看到“GenAI”爆炸。聊天机器人现在可以编写代码并创造艺术,而董事会则痴迷于大型语言模型(LLM)将如何改变世界。正在酝酿中的 GenAI 数据科学革命首先出现在 DataRobot 上。
来源:DataRobot博客如果您现在领导一个企业数据科学团队或定量研究部门,您可能会感觉自己生活在两个平行的宇宙中。
在一个宇宙中,你会经历“GenAI”爆炸。聊天机器人现在可以编写代码并创造艺术,而董事会则痴迷于大型语言模型(LLM)将如何改变世界。在另一个宇宙中,您有自己的日常工作:预测客户流失、预测需求以及使用结构化表格数据检测欺诈的“严肃”工作。
多年来,这两个宇宙一直让人感觉完全分离。您甚至可能会觉得 GenAI 的炒作火箭已经让您的核心业务数据留在了平台上。
但这种分离只是一种幻觉,而且正在迅速消失。
从聊天机器人到预测:GenAI 实现表格和时间序列建模
无论您是怀疑论者还是真正的信徒,您肯定都曾与 Transformer 模型进行过交互以起草电子邮件,或与扩散模型进行过交互以生成图像。但是,当世界关注文本和像素时,相同的底层架构却在悄悄地学习一种不同的语言:数字、时间和表格模式的语言。
以 SAP-RPT-1 和 LaTable 为例。第一个使用 Transformer 架构,第二个是扩散模型;两者都用于表格数据预测。
我们正在见证数据科学基础模型的出现。
这些不仅仅是对您所知道的预测模型的渐进式改进。它们代表了范式的转变。正如法学硕士可以“零射击”他们未经过明确培训的翻译任务一样,这些新模型可以查看一系列数据(例如销售数据或服务器日志),并在无需传统的劳动密集型培训流程的情况下生成预测。
模型变成了模型生产工厂
传统上,机器学习模型被视为静态工件:对历史数据进行一次训练,然后部署以产生预测。
