摘要 - 近年来,在线教育平台已经迅速增长,吸引了越来越多的学生进入数字学习环境。在在线教育中,学习者可以选择学习内容并更加自由地计划自己的学习路径。尽管在线教育平台为学习者提供了高度的自由度,但它减少了学习者的学习指南,这导致了诸如“信息超负荷”和“知识损失”之类的问题。主要的表现是学习者不知道如何计划学习路径,从而导致学习效率降低和学习效果不佳。为了应对这些挑战,本文提出了一种基于强化学习RLLP的学习路径建议算法。RLLP模型考虑了学习者的学习目标,知识水平以及知识点之间的关系。同时,它还考虑了学习路径和学习者的参与度的平稳性,旨在向学习者推荐高效且明智的学习路径。广泛的实验结果证明了RLLP模型的有效性。