详细内容或原文请订阅后点击阅览
机器学习中的日志记录和调试 - 如何使用 Python 调试器和日志记录模块查找 AI 应用程序中的错误
有关如何调试机器学习代码以及如何使用日志捕获生产中的错误的指南(包括一组有用的 Tensorflow 函数,让您的调试生活更轻松)
来源:AI夏令营您是否曾经因为一个错误而困扰了很长时间?我记得有一次,我花了超过 2 周的时间来解决一个愚蠢的小拼写错误,这个错误没有导致程序崩溃,但却返回了无法解释的结果。我真的为此睡不着觉。因为我 100% 确定这也发生在您身上,所以在“生产中的深度学习”系列的第 4 集中,我们将重点介绍如何调试深度学习代码以及如何在部署模型之前使用日志记录来捕获错误和错误。我们将使用 Tensorflow 展示一些示例(遵循我们在过去 3 篇文章中构建的图像分割示例),但完全相同的原则也适用于 PyTorch 和所有其他 AI 框架。
图像分割示例正如我在本系列的介绍中所说,机器学习是普通软件,应该始终像对待普通软件一样对待。软件开发生命周期中最重要的部分之一就是调试。适当的调试可以帮助消除算法运行并被真实用户使用时的未来痛点,并使我们的系统像用户期望的那样健壮可靠。而且它在编码的早期阶段也是不可或缺的,可以加速我们算法的开发。
本系列简介 适当的调试可以帮助消除未来的痛点如何调试深度学习?
深度学习调试比普通软件更困难,原因如下:
- 模型性能不佳并不一定意味着代码中有错误迭代周期(构建模型、训练和测试)相当长训练/测试数据也可能存在错误和异常超参数会影响最终准确率并非总是确定性的(例如概率机器学习)静态计算图(例如 Tensorflow 和 CNTK)
模型性能不佳并不一定意味着代码中有错误
视频
SCHEMA =