Loading...
机构名称:
¥ 1.0

要将神经序列模型(例如变形金刚)应用于音乐发电任务,必须通过一系列有限的代币来代表一段音乐。这样的词汇通常涉及各种类型的令牌。例如,要描述音符,一个人需要单独的令牌来指示音符的音高,持续时间,速度(动态)和放置时间(起始时间)。虽然不同类型的令牌可能具有不同的适当性,但现有模型通常以与自然语言建模单词相同的方式对待它们。在本文中,我们提出了一种概念上不同的方法,该方法明确考虑了令牌的类型,例如注释类型和度量标准类型。,我们提出了一种新的变压器解码器 - 使用不同的馈送头来建模不同类型的kens。通过扩展压缩技巧,我们通过对相邻令牌进行分组,大大降低了令牌序列的长度,从而将一段音乐转换为一系列复合单词。我们表明,在动态有向超图中,可以将结果模型视为学习者。,我们采用它来学会创作全面的长度长度(每首歌曲最多涉及10k个个人to-kens)的表现力的流行钢琴音乐,无论是有条件地和无条件的)。我们的实验表明,与最先进的模型相比,所提出的模型在训练时收敛了5至10倍(即,在一天的GPU上,在具有11 GB内存的单个GPU上),并且在生成的音乐中具有可比的质量。

复合单词变压器:学习构成全...

复合单词变压器:学习构成全...PDF文件第1页

复合单词变压器:学习构成全...PDF文件第2页

复合单词变压器:学习构成全...PDF文件第3页

复合单词变压器:学习构成全...PDF文件第4页

复合单词变压器:学习构成全...PDF文件第5页