最近,人们对计算音乐创作的兴趣激增,这在很大程度上受到了 ChatGPT 和 Stable Diffusion 等大型生成模型的影响。这些强大的生成式人工智能模型已经展示了非凡的能力,尤其是在文本和图像生成领域。在这些发展的推动下,音乐行业也开始探索部署大型音乐创作模型,如 MusicLM 和 MusicGen。然而,值得注意的是,这些以音乐为中心的生成模型的性能和能力尚未达到与文本和图像生成模型相同的复杂程度。音乐的生成面临着独特的挑战,例如捕捉复杂的时间结构、编排情感进程、描绘声音景观以及管理各种音乐元素之间复杂的相互作用。当前基于人工智能的音乐生成系统的可控性和交互性并不令人满意。鉴于这些考虑,对基于人工智能的流行音乐创作技术的发展进行批判性审查是及时且必要的,特别是从行业角度来看。本文借鉴作者作为行业和学术界高级研究人员的丰富经验,全面概述了基于人工智能的音乐创作技术及其在现实世界音乐制作中的实际应用。它研究了歌词生成、旋律创作、歌词旋律匹配、编曲和音频合成等多个方面。该评论深入了解了人工智能技术在实际音乐制作中的演变和应用,批判性地评估了它们的优势和局限性。此外,本文还确定了该领域面临的挑战和未来的潜在方向,希望为该领域的发展做出贡献。
人工智能音乐创作应用自上个世纪以来就已出现,但直到最近,它们的采用还仅限于一小部分研究人员和工程师,其本体也仅限于计算创造力实验。音乐产业的持续转型、对人工智能音乐公司的资本注入不断增加以及人工智能的技术进步正在扩大这一领域并改变这些应用的本体。这种扩展和本体论转变引发了本文将要探讨的几个伦理和政治问题。我将目前指导商业人工智能生成音乐主流研究的意识形态基础置于背景中,并确定了这项研究引起的两个紧迫问题。首先,艺术过剩人口不可避免地增加,创意劳动力成本下降;其次,基于对现有音乐和听众偏好的开发,对新殖民主义做法的默认接受。我建议这些技术的创造者应该讨论和解决这些问题,并建议 MIR 研究进行伦理和认识论转变。
过去几年,人工神经网络架构的重大发展促进了自动音乐创作模型的广泛应用。然而,大多数现有系统都采用基于硬代码和预定义规则的算法生成结构,通常不包括交互式或即兴行为。我们提出了一种基于运动的音乐系统 MoMusic,作为 AI 实时音乐生成系统。MoMusic 具有部分随机谐波排序模型,该模型基于音调和弦进展的概率分析,通过音乐集合论进行数学抽象。该模型针对二维网格呈现,通过姿势识别机制产生结果声音。摄像头捕捉用户手指的运动和轨迹,创造出连贯的、部分即兴的和声进程。MoMusic 集成了多个音色音域,从钢琴等传统古典乐器到使用语音转换技术创建的新型“人声乐器”。我们的研究证明了 MoMusic 的互动性、激发音乐家灵感的能力以及使用各种音色音域生成连贯音乐材料的能力。MoMusic 的功能可以轻松扩展,以结合不同形式的姿势控制音色变换、节奏变换、动态变换甚至数字声音处理技术。
简介 ................................................................................................................................ 2 音乐创作的机器学习技术 .............................................................................................. 3 人工智能在音乐产业中的影响 .............................................................................................. 4 音乐与情感 ............................................................................................................................ 5 人工智能音乐的伦理问题 ...................................................................................................... 6 文献综述总结 ...................................................................................................................... 7 研究问题 ............................................................................................................................. 8 方法论/伦理问题: ............................................................................................................. 8
数字技术的兴起增加了对音乐创作民主化的兴趣,但是当前的创造力经常将扫盲和教育优先于满足儿童对休闲创造的需求的优先级优先。为了解决这个问题,我们与6-13岁的儿童进行了参与式设计会议,以探讨他们对休闲音乐活动的看法,并确定支持不同表达方式的创意应用程序的要素。我们的研究旨在回答两个关键问题:(1)儿童如何促进休闲音乐创作活动以及哪些创意应用程序的元素有助于表达?和(2)哪些见解可以告知未来休闲音乐工具的设计?我们的发现表明,孩子们将休闲音乐的创作视为涉及各种活动,视觉效果有助于理解声音,并进行各种有趣的互动,从而带来创造性的体验。我们根据我们的发现和将休闲创作作为“有目的的游戏”提出了设计含义。此外,我们讨论了它对Creative Mir的影响。
Impact语句 - 本研究论文介绍了自动化音乐发电,这是由深度学习技术提供支持的音乐作品的革命范式。有可能改变音乐创作的潜力,这种创新使人们对音乐作品工具的访问人数民主化,从而激发了各个级别的艺术专业知识的创造力。人工智能与人类艺术家之间的合作是这项研究的基石,为艺术探索和灵感创造了肥沃的基础。超出其创造性的范围,该项目是多种音乐传统的监护人。从广泛的MIDI文件中学习,该模型演变成一个活生生的存储库,塑造了未来的作品并保护文化音乐遗产。这种开创性的方法不仅在音乐中促进了AI的技术格局,还深深影响了艺术表达和协作动态。本质上,它表示技术与传统的和谐融合,塑造了音乐创作和文化保护的轨迹。
摘要:众所周知,情感音乐创作系统可以触发人类的情感。然而,设计这种系统来刺激用户的情感仍然是一个挑战,因为汇总该领域现有文献以帮助推进研究和知识的研究有限。本研究对情感算法创作系统进行了系统的文献综述。根据系统综述协议,从 IEEE Xplore、ACM 数字图书馆、SpringerLink、PubMed、ScienceDirect 和 Google Scholar 数据库中选择了 18 项主要研究。研究结果表明,缺乏一个独特的定义来概括各种类型的情感算法创作系统。因此,提供了一个独特的定义。研究结果还表明,大多数情感算法创作系统都是为游戏设计的,以提供背景音乐。生成创作方法是最常用的创作方法。总体而言,该领域的研究数量相当少。这些趋势的可能原因是缺乏情感音乐创作系统的共同定义,以及缺乏对现有系统的设计、实施和评估的详细记录。