Loading...
机构名称:
¥ 1.0

强化学习和决策是一门三学分的课程,即强化学习和决策。强化学习是机器学习的一个子区域,与计算文物有关,通过经验来修改和改善其性能。强化学习的一个关键区别是用于训练模型的数据通常以模型本身通常收集的反复试验体验的形式出现。本课程重点介绍可以通过经典论文和最新工作的结合以编程方式学习控制政策的算法。它研究了它们存在的有效算法,以便单身和多代理计划以及从经验中学习近乎最佳决策的方法。主题包括马尔可夫决策过程;动态编程方法;基于价值的方法;马尔可夫决策过程部分可观察到;基于策略的方法;随机和重复的游戏;分散的部分可观察到的马尔可夫决策过程;和多代理方法。班级对概括,探索,表示和多代理系统的问题特别感兴趣。

课程课程

课程课程PDF文件第1页

课程课程PDF文件第2页

课程课程PDF文件第3页

课程课程PDF文件第4页

课程课程PDF文件第5页

相关文件推荐

2020 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥8.0
2024 年
¥3.0
2025 年
¥4.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2024 年
¥2.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2015 年
¥1.0
2022 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2025 年
¥1.0
2025 年
¥1.0
2024 年
¥7.0
2024 年
¥1.0
2024 年
¥4.0
2024 年
¥3.0
2023 年
¥1.0
2022 年
¥3.0
1900 年
¥5.0