摘要。使用具有符号表示的深度学习方法生成结构化的音乐,这是一项艰巨的任务,因为音乐元素之间的复杂关系定义了音乐构成。音乐的象征性表示,例如MIDI或乐谱音乐,可以通过以允许操纵和分析的格式编码音乐来帮助克服其中的一些挑战。但是,音乐的象征性表示仍然需要对音乐概念和理论的解释和理解。在本文中,我们提出了一种方法,该方法利用多代理系统(MAS)和强化学习(RL)进行象征性音乐生成。我们的模型主要集中于Music结构。它以较高的抽象水平运行,使其能够捕获长期的音乐结构和依赖性。我们将RL用作学习范式,人类用户作为音乐专家,以促进代理商对全球依赖和音乐特征的学习。我们展示了RL代理如何学习和适应用户的喜好和音乐风格。此外,我们介绍并讨论了在音乐发电领域中进行代理学习和适应和分布问题解决方案的方法的潜力。