Loading...
机构名称:
¥ 1.0

强化学习是一种基于反馈的机器学习技术,在该技术中,代理商通过执行动作并查看动作结果来学习在环境中行为。对于每个好的行动,代理人都会得到积极的反馈,对于每个不良行为,代理人都会获得负面反馈或罚款。在加强学习中,代理商会自动使用反馈而没有任何标记的数据学习,这与监督学习不同。由于没有标记的数据,因此代理只能通过其经验来学习。rl解决决策是顺序的特定类型的问题,目标是长期的,例如游戏玩法,机器人技术等。代理与环境相互作用并自行探索它。代理在加强学习中的主要目标是通过获得最大的积极奖励来提高性能。强化学习的类型主要有两种类型的加强学习,它们是:o积极的强化o负面强化积极强化:积极的强化学习意味着添加一些东西以增加预期行为会再次发生的趋势。它对代理的行为产生积极影响,并增加了行为的强度。这种强化可以长期维持变化,但是过多的积极加强可能会导致各种州可以减少后果的状态。负面强化:负强化学习与积极强化相反,因为它增加了通过避免负面状况再次发生特定行为的趋势。根据情况和行为的不同,它比积极的强化更有效,但仅提供强化才能达到最低行为。

单位5

单位5PDF文件第1页

单位5PDF文件第2页

单位5PDF文件第3页

单位5PDF文件第4页

单位5PDF文件第5页

相关文件推荐

2024 年
¥1.0
2021 年
¥1.0
2023 年
¥1.0
2021 年
¥1.0
2021 年
¥58.0
2020 年
¥2.0
2013 年
¥3.0
2022 年
¥1.0
2023 年
¥2.0
1900 年
¥2.0
2023 年
¥1.0
2023 年
¥3.0
1900 年
¥2.0
2022 年
¥5.0
2024 年
¥1.0
2018 年
¥1.0
2024 年
¥1.0
2024 年
¥2.0
2025 年
¥11.0
2025 年
¥2.0
2023 年
¥1.0
2023 年
¥1.0
2023 年
¥1.0
2021 年
¥1.0