详细内容或原文请订阅后点击阅览
用于音乐理解任务的感知启发式图形卷积
本文讨论了 MusGConv,一种用于符号音乐应用的感知启发式图卷积块。简介在音乐信息研究 (MIR) 领域,理解和处理乐谱的挑战不断被引入新方法和新途径。最近,许多基于图的技术已被提出,作为针对音乐理解任务的一种方式,例如语音分离、节奏检测、作曲家分类和罗马数字分析。这篇博文涵盖了我最近的一篇论文,其中我介绍了一种名为 MusGConv 的新图卷积块,专门用于处理乐谱数据。MusGConv 利用音乐感知原理来提高应用于音乐理解任务的图神经网络中图卷积的效率和性能。理解问题 MIR 中的传统方法通常依赖于音乐的音频或符号表示。虽然音频可以捕捉随时间变化的声波强度,但 MIDI 文件或乐谱等符号表示可以编码离散的音乐事件。符号表示尤其有价值,因为它们提供了音乐分析和生成等任务所必需的高级信息。然而,基于符号音乐表示的现有技术通常借鉴计算机视觉 (CV) 或自然语言处理 (NLP) 方法。例如,将音乐表示为矩阵中的“钢琴卷”
来源:走向数据科学用于音乐理解任务的感知启发式图卷积
用于音乐理解任务的感知启发式图卷积
本文讨论了 MusGConv,这是一种用于符号音乐应用的感知启发式图卷积块
简介
在音乐信息研究 (MIR) 领域,理解和处理乐谱的挑战不断被引入新方法和新途径。最近,许多基于图的技术已被提出作为针对音乐理解任务的方法,例如语音分离、节奏检测、作曲家分类和罗马数字分析。
这篇博文涵盖了我最近的一篇论文,其中我介绍了一种名为 MusGConv 的新图卷积块,专为处理乐谱数据而设计。MusGConv 利用音乐感知原理来提高应用于音乐理解任务的图神经网络中图卷积的效率和性能。
MusGConv MusGConv理解问题
MIR 中的传统方法通常依赖于音乐的音频或符号表示。虽然音频可以捕捉随时间变化的声波强度,但 MIDI 文件或乐谱等符号表示可以编码离散的音乐事件。符号表示特别有价值,因为它们提供了音乐分析和生成等任务所必需的高级信息。
乐谱作为图表
基于 GNN 的乐谱方法的基本思想是将乐谱建模为一个图表,其中音符是顶点,边由音符之间的时间关系构建。要从乐谱创建图表,我们可以考虑四种类型的边(请参见下图以了解乐谱上图表的可视化):