DataRobot 开源十年:从预测性 AI 到代理生命周期

DataRobot 的开源十年:从预测性 AI 到代理生命周期 DataRobot 的每个时代都推出了开源。 DataRobot 的最新开源贡献直接映射到代理在生产中实际出现故障的位置。建立代理从未如此简单。选择一个框架,连接一个模型和一个检索器,添加...DataRobot 的开源十年:从预测人工智能到代理生命周期一文首先出现在 DataRobot 上。

来源:DataRobot博客

DataRobot 开源十年:从预测性 AI 到代理生命周期

DataRobot 的每个时代都推出了开源软件。 DataRobot 的最新开源贡献直接映射到代理在生产中实际出现故障的位置。

构建代理从未如此简单。选择一个框架,连接一个模型和一个检索器,添加一些工具,然后午餐时就会运行演示。演示之后问题就开始了。事实证明,您猜测的工作流程既不是最准确的选项,也不是最便宜的选项。代理人必须在不确定的情况下做出判断,并且没有快速的方法来推理风险。一旦有多个团队开始使用它,推理费用和延迟都会出现偏差。

这些不是框架问题。它们是生命周期问题,并在三个不同的阶段出现:设计工作流程、运行时不确定性下的推理以及大规模地将结果提供给真实用户。

这些都不是新领域。 DataRobot 的开源从来都不是一个附带任务。它逐步跟踪了该平台的演变:公开教授预测人工智能,然后为团队提供 AutoML 的编程所有权,现在为每个代理交付生产的实际基础设施。

十年的作品展示

这个习惯可以追溯到 2014 年,当时该团队开源了 KDD Cup 的顶级成绩代码,以及有关梯度提升、scikit-learn 和 statsmodels 回归的博客教程。数据科学家存储库的教程,以及后来的一系列生成式人工智能加速器,都源于同样的本能:真正理解人工智能的唯一方法是构建它,所以让人们工作代码而不是白皮书。所有这些都位于 R 和 Python SDK 之上,这使得试用帐户变成了人们可以编写脚本的东西,而不仅仅是点击。

代理生命周期及其中断位置

syftr:在猜测之前设计工作流程

pip install git+https://github.com/datarobot/syftr.git

开始使用