详细内容或原文请订阅后点击阅览
卷积神经网络如何学习音乐相似性
通过对比学习来学习音频嵌入,并将其部署到真正的音乐推荐应用程序中。这篇文章《卷积神经网络如何学习音乐相似性》首先出现在《走向数据科学》上。
来源:走向数据科学用于音乐推荐的音频嵌入?
流媒体平台(Spotify、Apple Music 等)需要能够向用户推荐新歌曲。推荐越好,聆听体验就越好。
这些平台可以通过多种方式构建推荐系统。现代系统将不同的推荐方法混合在一起形成混合结构。
想想当你第一次加入 Spotify 时,你会被问到你喜欢什么类型。根据您选择的流派,Spotify 会推荐一些歌曲。像这样基于歌曲元数据的推荐被称为基于内容的过滤。还使用协作过滤,将行为相似的客户分组在一起,然后在他们之间传递建议。
上述两种方法很大程度上依赖于用户行为。另一种方法越来越多地被大型流媒体服务使用,是使用深度学习在学习的嵌入空间中表示歌曲。这使得歌曲可以在高维嵌入空间中表示,捕捉节奏、音色、纹理和制作风格。然后可以轻松计算歌曲之间的相似性,在考虑数亿用户和数千万首曲目时,这比使用经典的协同过滤方法具有更好的扩展性。
随着法学硕士的兴起,单词和短语嵌入已成为主流并且相对容易理解。但是嵌入如何应用于歌曲以及它们解决了什么问题?本文的其余部分重点介绍音频如何成为模型输入、哪些架构选择对音乐特征进行编码、对比学习如何塑造嵌入空间的几何形状以及使用嵌入的歌曲推荐系统如何在实践中发挥作用。
音频如何成为神经网络的输入?
组块和对比学习
同一音频样本的嵌入应该比批次中任何其他样本的嵌入更相似。
\[
\]
L =
