近来,人们提出了多种用于歌词生成的神经模型。然而,之前的大部分工作都是一次性完成生成过程,很少需要人工干预。我们认为,歌词创作是一个以人类智能为中心的创造性过程。人工智能应该在歌词创作过程中扮演助手的角色,而人机交互对于高质量的创作至关重要。本文介绍了一种人工智能辅助歌词创作系统 Youling,旨在与音乐创作者合作。在歌词生成过程中,Youling 支持传统的一次性全文生成模式和交互式生成模式,用户可以根据先前的上下文从生成的候选句子中选择满意的句子。该系统还提供了一个修改模块,使用户可以反复修改歌词中不想要的句子或单词。此外,Youling 还允许用户使用多方面的属性来控制生成的歌词的内容和格式。该系统的演示视频可在 https://youtu.be/DFeNpHk0pm4 上找到。
摘要 - 在这项工作中,我们介绍了自动框架,这是一项新颖的框架,旨在从提供的歌词和音乐伴奏中产生多样化和高质量的歌声。自动自动通过将音乐伴奏纳入额外的条件输入来扩展现有的基于语义令牌的文本到语音方法。这使其能够自动将其声音与伴奏的节奏和旋律细微差别同步,同时坚持提供的歌词。我们的贡献包括针对用于唱歌语音综合的自回旋音频模型的新型培训计划,以及消融研究,以确定在音乐伴奏上生成的最佳方法。我们通过主观听力测试来衡量自动的性能,展示了其产生连贯和创意的歌声的能力。此外,我们开源代码库,以在唱歌语音合成领域进行进一步的研究。索引术语 - 语音综合,音乐发电,自回归音频生成
摘要。近年来,自然语言处理领域(NLP)发生了一场革命,文字一代在这一转变中起着关键作用。这种转变不仅限于技术领域,而且还无缝渗透了创意领域,一个很好的例子是歌曲歌词的一代。真正有效的生成模型,例如生成训练的预训练变压器(GPT)-2,需要进行微调作为关键步骤。本文利用了广泛参考的Kaggle数据集的鲁棒性,标题为“歌曲歌词”,仔细探讨了调节三个关键参数的影响:学习率,批处理大小和序列长度。数据集提出了一个引人入胜的叙述,该叙述将学习率视为最有影响力的决定因素,直接影响了产生的歌词的质量和连贯性。在增加批处理大小和扩展序列长度有望增强模型性能的同时,很明显,还有一个饱和点,超出该点的效果受到限制。通过此探索,本文旨在揭开模型校准的复杂世界,并强调战略参数选择在追求抒情卓越方面的重要性。
导演 / 编舞 . . . . . . . . . . . . . . . . . . . . Larry Nye 音乐总监 . . . . . . . . . . . . . . . . . . . Jill Brunelle 音响设计师 . . . . . . . . . . . . . . . Nathan Roberts 灯光与布景设计师 . . . . . . . . . . . . . . Douglas Macur 服装设计师 . . . . . . . . . . . . . . Heidi Leigh Hanson 舞蹈队长 . . . . . . . . . . . . . . . . . . Alexina Cristante 助理灯光设计师 . . . . . . . . . . . . TJ Blotney 舞台经理 . . . . . . . . . . . . . . . Ariana Harris 助理舞台经理 . . . . . . . . . . . . . Lauren Marini 制作经理 . . . . . . . . . . . . . Mike Skinner 技术总监 . . . . . . . . . . . . . . Brandon Fuller 电工大师 . . . . . . . . . . . . . . . . . . . Devin Lee 舞台管理导师. . . . . . . . . Robyn Gostomski Theresa Stark 服装店主管. . . . . . . . . . . Richard Harding 道具主管. . . . . . . . . . Cailey Harwood-Smith 布景主管. . . . . . . . . . . . . Amelia Pizzoferrato 部门营销协调员. . . . . . . . . . Molly Flanagan 音响工程师/A1 广播混音师. . . Nick Moran 音响 A2. . . . . . . . . . . . . . . . Francie Ortiz 灯光板操作员. . . . . . . . .Sam Mena 服装运行团队负责人. . . . . . . .Kat Duffner 服装运行团队. . . . . . . . .Connor Shieldes 摄像师 1. . . . . . . Thomas Sicignano 摄像师 2. . . . . . . . .Ryleigh Rivas 摄像师 3. . . . . . . . .Alyssa Masi 视频广播工程师. . . . . . . . . . . NicoleThomas 海报设计. . . . . . . . . . . . . . . . Barbara Kagan 节目单设计. . . . . . . . . . . . . . Molly Flanagan
解释歌词的可唱性是语言模型 (LM) 在歌词生成中一项重要但缺失的能力。这项能力使作曲家能够快速评估 LM 生成的歌词是否可以与旋律和谐地唱出来,并帮助歌手在练习过程中将歌词与旋律对齐。本文提出了 XAI-Lyricist,利用音乐韵律指导 LM 生成可唱的歌词并提供人类可理解的可唱性解释。我们使用 Transformer 模型在音乐韵律约束下生成歌词,并提供歌词韵律模式的演示作为可唱性解释。XAI-Lyricist 通过计算指标(困惑度、韵律-BLEU)和以人为本的研究(人类评分、平均唱歌时间和尝试次数)进行评估。实验结果表明,音乐韵律可以显著提高 LM 生成的歌词的可唱性。一项针对 14 名歌手的对照研究也证实了所提供的解释有助于他们比阅读纯文本歌词更快地理解歌词的可唱性。
摘要 我们提出 AI-Lyricist:一个根据所需词汇和 MIDI 文件作为输入来生成新颖而有意义的歌词的系统。这项任务涉及多项挑战,包括自动识别旋律并从多声道音乐中提取音节模板、生成与输入音乐风格和音节对齐相匹配的创意歌词以及满足词汇约束。为了应对这些挑战,我们提出了一个自动歌词生成系统,该系统由四个模块组成:(1)音乐结构分析器,用于从给定的 MIDI 文件中获取音乐结构和音节模板,利用预期音节数的概念更好地识别旋律;(2)基于 SeqGAN 的歌词生成器,通过策略梯度进行多对抗训练优化,使用双鉴别器进行文本质量和音节对齐;(3)深度耦合的音乐歌词嵌入模型,将音乐和歌词投射到联合空间中,以便公平比较旋律和歌词约束;以及一个名为 (4) Polisher 的模块,通过对生成器应用掩码并替换要学习的单词来满足词汇约束。我们在超过 7,000 个音乐歌词对的数据集上训练了我们的模型,并通过主题、情感和流派方面的手动注释标签进行了增强。客观和主观评价均表明 AI-Lyricist 在所提出的任务上的表现优于最先进的技术。
近年来,流媒体的兴起极大地改变了我们听音乐的方式。在智能手机带来的各种生活方式的改变中,音乐是发生巨大变化的消费者行为之一。人工智能根据用户的喜好自动生成推荐歌曲,并每日更换。流媒体服务的使用极大地改变了音乐消费方式,从选择喜欢的艺术家、歌曲和专辑的方式转变为以播放列表为中心的方式。要想通过流媒体创造热门歌曲,利用播放列表非常重要。而要被列入播放列表,歌曲需要是可以作为背景音乐反复收听的。为了增加各种播放列表中歌曲的播放次数,比起金属等声音激烈的歌曲,那些能让听众仔细聆听歌词的歌曲更合适。在流媒体排行榜上,播放次数才是指标,而不是销量或出席人数,热门歌曲只是一首好听到让人想一遍又一遍听的歌曲。唱片公司、艺人、经纪公司、大众媒体的力量减弱,歌词和音乐变得更为重要。这与CD单曲排名有很大区别。 Aimyon 被列入各公司的官方播放列表,例如“Top 50”和“Next Break”,这使她在流媒体中广受欢迎。 Aimyon 受欢迎的主要原因是她的歌词很棒。她的人气不仅源于她的歌词,而且加上流媒体这种偏爱让人想反复听的歌曲的媒介的协同效应,让她出道以来人气迅速飙升。本研究重点关注 Aimyon 的歌词,并考虑使用文本挖掘来量化歌词的数据。分析爱慕的歌词发现,“你”、“我”、“你们”、“我们两个”等词语在她的所有歌曲中都使用频繁,因为它们反映了她的艺术风格。
一首 19 世纪和 20 世纪初广为人知的歌曲; 19 世纪最受欢迎的舞蹈之一。这首歌有大量的变奏(诗节)。这首歌是建立在呼叫-响应原理之上的;家庭关系被用作诉求,各种军事术语或意识形态,以及不太常见的日常符号,被用作回应。可以用“亲爱的朋友们”作为副歌来代替“brava ladushki”。如果旋律或多或少稳定的话,那么歌词则像往常一样,每个人都以自己的方式进行改变。这就是为什么这首歌有很多歌词。这原本是一首不押韵的民歌,名叫《在一片空旷的田野里有一棵树》。在《征兵法》颁布之后(1705年至1874年有效),歌曲的歌词和节奏发生了重大变化。这首歌以形象和语言的方式描绘了18世纪至20世纪初士兵的军事生活世界。 2)信息来源:Soboleva G. G. 俄罗斯歌曲。音乐页面。
歌曲在人脑中如何处理?在歌曲中,音乐和歌词在音乐语言的协同作用中紧密绑定,以传达含义和情感,而不是语言内容,从而提出了有关如何代表两个组成部分并将其整合到有凝聚力的感知整体中的问题。先前的研究指出了对音乐,语音和歌曲敏感的人类皮质的领域,它们既可以找到共享和专业网站。然而,听歌曲时的音乐和歌词处理之间的互动仍然很糟糕。为了解决这个问题,我们探究了具有脑电图的特定于音乐和语音的神经预测机制。当向听众提供歌曲或相应的嗡嗡声(无语言)旋律时,比较了旋律预测的编码。同样,在歌曲和相应的口语(无旋律)歌词中研究了语音预测的编码。我们发现,歌曲中音乐和言语的同意改变了它们的预测信号的产生和处理,从而改变了它们的神经编码。此外,我们在旋律和音素期望的神经编码中找到了一个权衡,其平衡取决于谁在听(反映听众的偏爱的内部驱动力,例如音乐训练)以及歌曲的创作和表演方式(外部驱动程序(外部驱动力)(反映了歌词和音乐的出色和音乐))。总的来说,我们的结果表明,歌曲涉及并行预测过程,以竞争共享处理资源的使用。