详细内容或原文请订阅后点击阅览
用于现代深度学习实验的代理人工智能
停止保姆训练。开始航运研究。为深度学习工程师构建的自主实验管理。现代深度学习实验的代理人工智能后首次出现在走向数据科学上。
来源:走向数据科学读取您的指标、检测异常、应用预定义的调整规则、必要时重新启动作业并记录每个决策,而无需您在凌晨 2 点盯着损失曲线
在本文中,我将提供一个专为深度学习研究人员和 ML 工程师设计的轻量级代理,它可以:
• 自动检测故障
• 对性能指标进行直观推理
• 应用预定义的超参数策略
• 重新启动作业
• 记录每项行动和结果
没有架构搜索。没有 AutoML。不会对您的代码库进行侵入性重写。
实现是有意最小化的:容器化您的训练脚本,添加一个基于 LangChain 的小型代理,在 YAML 中定义超参数,并在 Markdown 中表达偏好。您可能已经完成了其中的 50%。
将此代理放入您的手动 train.py 工作流程中,并在一天内从 0️⃣ 到 💯。
您现有实验的问题
🤔 你无休止地思考超参数。
▶️ 你运行train.py。
🐛 您修复了 train.py 中的错误。
🔁 重新运行 train.py
👀 你盯着 TensorBoard。
🫠 你质疑现实。
🔄 你重复一遍。
别再盯着你的模型吐出数字了
你不是绝地武士。再多的凝视也不会神奇地让你的[验证损失|]分类准确率 |困惑|您可以命名的任何其他指标]朝您想要的方向移动。
在一个基于深度变压器的网络中,在你无法追踪的、甚至可能永远不会出现的网络中,在半夜照顾一个模型,以获得消失/爆炸的梯度 NaN?也很难。
当你的大部分时间都花在技术上必须完成的工作上,但对实际洞察力贡献甚微时,你应该如何解决真正的研究问题?
如果你一天的 70% 时间都被运营拖累所消耗,那么思考什么时候发生?
转向代理驱动的实验
这是一项枯燥、乏味、重复性的工作。
我们将卸载这些重复性任务,以便您可以将注意力转移到高价值的工作上
坦率地说,AutoML 的概念是可笑的。
