Optimization Algorithms for Machine Learning
我一直在 Coursera 上学习 Andrew Ng 的深度学习专项课程。我已经完成了该专项课程 5 门课程中的第 1 门(神经网络和深度学习)。我正在学习第 2 门课程,即改进深度学习。这是一门非常有趣的课程,深入探讨了超参数调整、正则化和优化技术。1. 什么是优化算法?它们使您能够更快地训练神经网络,因为应用机器学习是一个非常经验的过程,这些算法有助于有效地达到优化结果。让我们开始研究具有更复杂版本的梯度下降的优化算法。1.1 批量与小批量梯度下降一般来说,梯度下降会遍历整个训练示例集(#m),并向全局最小值迈出一步。这也称为批量梯度下降。这有点低效,因为它要求我们先遍历所有训练示例,然