摘要。近年来,自然语言处理领域(NLP)发生了一场革命,文字一代在这一转变中起着关键作用。这种转变不仅限于技术领域,而且还无缝渗透了创意领域,一个很好的例子是歌曲歌词的一代。真正有效的生成模型,例如生成训练的预训练变压器(GPT)-2,需要进行微调作为关键步骤。本文利用了广泛参考的Kaggle数据集的鲁棒性,标题为“歌曲歌词”,仔细探讨了调节三个关键参数的影响:学习率,批处理大小和序列长度。数据集提出了一个引人入胜的叙述,该叙述将学习率视为最有影响力的决定因素,直接影响了产生的歌词的质量和连贯性。在增加批处理大小和扩展序列长度有望增强模型性能的同时,很明显,还有一个饱和点,超出该点的效果受到限制。通过此探索,本文旨在揭开模型校准的复杂世界,并强调战略参数选择在追求抒情卓越方面的重要性。
摘要 - 在这项工作中,我们介绍了自动框架,这是一项新颖的框架,旨在从提供的歌词和音乐伴奏中产生多样化和高质量的歌声。自动自动通过将音乐伴奏纳入额外的条件输入来扩展现有的基于语义令牌的文本到语音方法。这使其能够自动将其声音与伴奏的节奏和旋律细微差别同步,同时坚持提供的歌词。我们的贡献包括针对用于唱歌语音综合的自回旋音频模型的新型培训计划,以及消融研究,以确定在音乐伴奏上生成的最佳方法。我们通过主观听力测试来衡量自动的性能,展示了其产生连贯和创意的歌声的能力。此外,我们开源代码库,以在唱歌语音合成领域进行进一步的研究。索引术语 - 语音综合,音乐发电,自回归音频生成
解释歌词的可唱性是语言模型 (LM) 在歌词生成中一项重要但缺失的能力。这项能力使作曲家能够快速评估 LM 生成的歌词是否可以与旋律和谐地唱出来,并帮助歌手在练习过程中将歌词与旋律对齐。本文提出了 XAI-Lyricist,利用音乐韵律指导 LM 生成可唱的歌词并提供人类可理解的可唱性解释。我们使用 Transformer 模型在音乐韵律约束下生成歌词,并提供歌词韵律模式的演示作为可唱性解释。XAI-Lyricist 通过计算指标(困惑度、韵律-BLEU)和以人为本的研究(人类评分、平均唱歌时间和尝试次数)进行评估。实验结果表明,音乐韵律可以显著提高 LM 生成的歌词的可唱性。一项针对 14 名歌手的对照研究也证实了所提供的解释有助于他们比阅读纯文本歌词更快地理解歌词的可唱性。
导演 / 编舞 . . . . . . . . . . . . . . . . . . . . Larry Nye 音乐总监 . . . . . . . . . . . . . . . . . . . Jill Brunelle 音响设计师 . . . . . . . . . . . . . . . Nathan Roberts 灯光与布景设计师 . . . . . . . . . . . . . . Douglas Macur 服装设计师 . . . . . . . . . . . . . . Heidi Leigh Hanson 舞蹈队长 . . . . . . . . . . . . . . . . . . Alexina Cristante 助理灯光设计师 . . . . . . . . . . . . TJ Blotney 舞台经理 . . . . . . . . . . . . . . . Ariana Harris 助理舞台经理 . . . . . . . . . . . . . Lauren Marini 制作经理 . . . . . . . . . . . . . Mike Skinner 技术总监 . . . . . . . . . . . . . . Brandon Fuller 电工大师 . . . . . . . . . . . . . . . . . . . Devin Lee 舞台管理导师. . . . . . . . . Robyn Gostomski Theresa Stark 服装店主管. . . . . . . . . . . Richard Harding 道具主管. . . . . . . . . . Cailey Harwood-Smith 布景主管. . . . . . . . . . . . . Amelia Pizzoferrato 部门营销协调员. . . . . . . . . . Molly Flanagan 音响工程师/A1 广播混音师. . . Nick Moran 音响 A2. . . . . . . . . . . . . . . . Francie Ortiz 灯光板操作员. . . . . . . . .Sam Mena 服装运行团队负责人. . . . . . . .Kat Duffner 服装运行团队. . . . . . . . .Connor Shieldes 摄像师 1. . . . . . . Thomas Sicignano 摄像师 2. . . . . . . . .Ryleigh Rivas 摄像师 3. . . . . . . . .Alyssa Masi 视频广播工程师. . . . . . . . . . . NicoleThomas 海报设计. . . . . . . . . . . . . . . . Barbara Kagan 节目单设计. . . . . . . . . . . . . . Molly Flanagan
近来,人们提出了多种用于歌词生成的神经模型。然而,之前的大部分工作都是一次性完成生成过程,很少需要人工干预。我们认为,歌词创作是一个以人类智能为中心的创造性过程。人工智能应该在歌词创作过程中扮演助手的角色,而人机交互对于高质量的创作至关重要。本文介绍了一种人工智能辅助歌词创作系统 Youling,旨在与音乐创作者合作。在歌词生成过程中,Youling 支持传统的一次性全文生成模式和交互式生成模式,用户可以根据先前的上下文从生成的候选句子中选择满意的句子。该系统还提供了一个修改模块,使用户可以反复修改歌词中不想要的句子或单词。此外,Youling 还允许用户使用多方面的属性来控制生成的歌词的内容和格式。该系统的演示视频可在 https://youtu.be/DFeNpHk0pm4 上找到。