Loading...
机构名称:
¥ 2.0

仍然做出正确的决定 ▪ Q 学习的优先级:使 Q 值接近(建模) ▪ 动作选择优先级:使 Q 值的排序正确(预测) ▪ 我们稍后会在课程中再次看到建模和预测之间的区别

CS 188:人工智能

CS 188:人工智能PDF文件第1页

CS 188:人工智能PDF文件第2页

CS 188:人工智能PDF文件第3页

CS 188:人工智能PDF文件第4页

CS 188:人工智能PDF文件第5页

相关文件推荐

2022 年
¥3.0
2023 年
¥1.0
2020 年
¥4.0
2024 年
¥1.0
2020 年
¥1.0
2020 年
¥1.0
2020 年
¥1.0
2023 年
¥3.0
2024 年
¥4.0
2023 年
¥1.0
2013 年
¥3.0
2024 年
¥1.0
2023 年
¥5.0
2023 年
¥2.0
2020 年
¥9.0
2024 年
¥4.0
2022 年
¥3.0
2021 年
¥6.0
2023 年
¥1.0