最近,人们对计算音乐创作的兴趣激增,这在很大程度上受到了 ChatGPT 和 Stable Diffusion 等大型生成模型的影响。这些强大的生成式人工智能模型已经展示了非凡的能力,尤其是在文本和图像生成领域。在这些发展的推动下,音乐行业也开始探索部署大型音乐创作模型,如 MusicLM 和 MusicGen。然而,值得注意的是,这些以音乐为中心的生成模型的性能和能力尚未达到与文本和图像生成模型相同的复杂程度。音乐的生成面临着独特的挑战,例如捕捉复杂的时间结构、编排情感进程、描绘声音景观以及管理各种音乐元素之间复杂的相互作用。当前基于人工智能的音乐生成系统的可控性和交互性并不令人满意。鉴于这些考虑,对基于人工智能的流行音乐创作技术的发展进行批判性审查是及时且必要的,特别是从行业角度来看。本文借鉴作者作为行业和学术界高级研究人员的丰富经验,全面概述了基于人工智能的音乐创作技术及其在现实世界音乐制作中的实际应用。它研究了歌词生成、旋律创作、歌词旋律匹配、编曲和音频合成等多个方面。该评论深入了解了人工智能技术在实际音乐制作中的演变和应用,批判性地评估了它们的优势和局限性。此外,本文还确定了该领域面临的挑战和未来的潜在方向,希望为该领域的发展做出贡献。
主要关键词