点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
强化学习是机器学习的第三主要类别,以及受监督和无监督的学习。此技术用于顺序决策问题,在这种决策问题中,代理采取了最大化其预期累积奖励的动作。与深度神经网络(称为深度增强学习)结合使用,该技术用于许多领域的控制问题。本课程单元的目的是将基本原则和现代范式应用于强化学习,以便学生可以独立地独立理解和构建该领域的新学术文献。讨论了单一代理和多代理情况。在许多作业中,学生获得动手经验
主要关键词