强化学习(RL)通过通过反复试验来学习最佳策略来玩复杂的游戏。本项目将增强性学习应用于Sudoku,这是一个具有挑战性的演绎难题,需要用数字1到9填充9x9网格,以便每行,列和3x3 Subgrid完全包含所有数字。sudoku拼图范围从轻松到硬;有些可以通过应用基本的Sudoku规则来解决,而另一些则需要复杂的策略。此外,难以立即解决困难的难题,需要预测前进的几个动作。该项目的目标是探索经过RL训练的深神经网络可以学会解决Sudoku难题,这表明RL在处理演绎推理任务中的潜力。项目代码和运行说明可在gitlab上获得:https://gitlab.fi.muni.cz/xkarmaz/sudoku-rl
主要关键词