用于现代深度学习实验的代理人工智能

停止保姆训练。开始航运研究。为深度学习工程师构建的自主实验管理。现代深度学习实验的代理人工智能后首次出现在走向数据科学上。

来源:走向数据科学

读取您的指标、检测异常、应用预定义的调整规则、必要时重新启动作业并记录每个决策,而无需您在凌晨 2 点盯着损失曲线

在本文中,我将提供一个专为深度学习研究人员和 ML 工程师设计的轻量级代理,它可以:

• 自动检测故障

• 对性能指标进行直观推理

• 应用预定义的超参数策略

• 重新启动作业

• 记录每项行动和结果

没有架构搜索。没有 AutoML。不会对您的代码库进行侵入性重写。

实现是有意最小化的:容器化您的训练脚本,添加一个基于 LangChain 的小型代理,在 YAML 中定义超参数,并在 Markdown 中表达偏好。您可能已经完成了其中的 50%。

将此代理放入您的手动 train.py 工作流程中,并在一天内从 0️⃣ 到 💯。

您现有实验的问题

🤔 你无休止地思考超参数。

▶️ 你运行train.py。

🐛 您修复了 train.py 中的错误。

🔁 重新运行 train.py

👀 你盯着 TensorBoard。

🫠 你质疑现实。

🔄 你重复一遍。

别再盯着你的模型吐出数字了

你不是绝地武士。再多的凝视也不会神奇地让你的[验证损失|]分类准确率 |困惑|您可以命名的任何其他指标]朝您想要的方向移动。

在一个基于深度变压器的网络中,在你无法追踪的、甚至可能永远不会出现的网络中,在半夜照顾一个模型,以获得消失/爆炸的梯度 NaN?也很难。

当你的大部分时间都花在技术上必须完成的工作上,但对实际洞察力贡献甚微时,你应该如何解决真正的研究问题?

如果你一天的 70% 时间都被运营拖累所消耗,那么思考什么时候发生?

转向代理驱动的实验

这是一项枯燥、乏味、重复性的工作。

我们将卸载这些重复性任务,以便您可以将注意力转移到高价值的工作上

坦率地说,AutoML 的概念是可笑的。

代理驱动实验 (ADE)