3 Important Considerations in DDPG Reinforcement Algorithm
照片由 Jeremy Bishop 在 Unsplash 上拍摄深度确定性策略梯度 (DDPG) 是一种用于学习连续动作的强化学习算法。您可以在 YouTube 上的以下视频中了解更多信息:https://youtu.be/4jh32CvwKYw?si=FPX38GVQ-yKESQKU以下是使用 DDPG 解决问题时必须考虑的 3 个重要事项。请注意,这不是 DDPG 的操作指南,而是内容指南,因为它只讨论了您必须研究的领域。噪声Ornstein-UhlenbeckDDPG 的原始实现/论文提到使用噪声进行探索。它还表明某一步骤的噪声取决于前一步的噪声。这种噪声的实现是 Ornstein-Uh