Loading...
机构名称:
¥ 1.0

Xu和Zeevi [9]的论文,“贝叶斯的设计原则,用于频繁的顺序学习”,提出了一种解决广泛的顺序决策问题的一般方法。它引入了一种新颖的优化设置,代理商持有“算法信念”,并旨在最大程度地减少遗憾的概念。作者提出了一个新的损失函数,该功能可以使代理使用标准贝叶斯原则更新信念,而无需提交特定的事先。该框架适用于各种多臂强盗和增强学习设置,并在随机,对抗和非平稳的强盗环境中实现了出色的经验性能。这项工作发表在2023年国际机器学习会议(ICML)中,并因其贡献而获得了“杰出纸质奖”。

Barbor-Baranciki.pdf

Barbor-Baranciki.pdfPDF文件第1页

Barbor-Baranciki.pdfPDF文件第2页

Barbor-Baranciki.pdfPDF文件第3页

Barbor-Baranciki.pdfPDF文件第4页

Barbor-Baranciki.pdfPDF文件第5页

相关文件推荐

2025 年
¥1.0
2025 年
¥37.0
2024 年
¥1.0
2020 年
¥1.0
2024 年
¥2.0
2023 年
¥1.0
2025 年

pdf

¥3.0
2025 年
¥29.0
2024 年
¥2.0
2024 年

pdf

¥1.0
2025 年

pdf

¥1.0
2024 年
¥1.0
2024 年
¥1.0
2020 年

pdf

¥1.0
2023 年

pdf

¥1.0
2022 年
¥4.0
2021 年
¥8.0
2024 年
¥1.0
2000 年
¥5.0
2025 年
¥2.0
2024 年

pdf

¥2.0
2023 年
¥4.0
2024 年

pdf

¥3.0
2023 年
¥10.0
2023 年

pdf

¥1.0
2024 年
¥1.0
2025 年
¥1.0
2025 年
¥3.0
1900 年
¥1.0