计算能力的最新进展以及互联网上文本、图像和其他数据的广泛可用性为具有数十亿个参数的人工智能 (AI) 模型奠定了基础。尤其是大型语言模型,它为能够改变社会运作方式的新技术打开了大门 [ 4 ]。例如,OpenAI 的模型已经在大量数据上进行了训练,可以生成类似人类的文本 [ 5 ]。这些模型基于 Transformer 架构,该架构使用自注意力机制来模拟语言的复杂性。这些模型中最著名的是生成式预训练 Transformer 3 (GPT-3),它已被证明对一系列语言任务非常有效,例如生成文本、完成代码和回答问题 [ 5 ]。这有可能彻底改变科学家撰写和修改学术论文的方式,节省时间和精力,使研究人员能够专注于更高级的任务,例如数据分析和解释。
本文介绍了 Jazz Transformer,这是一种生成模型,它利用一种名为 Transformer-XL 的神经序列模型来建模爵士乐的曲谱。此外,该模型还努力结合魏玛爵士乐数据库 (WJazzD) 中存在的结构事件,以在生成的音乐中归纳结构。虽然我们能够将训练损失降低到较低值,但我们的听力测试表明,生成的曲目和真实曲目的评分之间存在明显差距。因此,我们更进一步,从不同角度对生成的曲目进行了一系列计算分析。这包括分析音高类、律动和和弦进行的统计数据,借助适应度景观图评估音乐的结构性,并通过类似 MIREX 的延续预测任务评估模型对爵士乐的理解。我们的工作以分析的方式展示了为什么迄今为止机器生成的音乐仍然比不上人类的艺术作品,并为未来自动作曲的研究设定了一些目标。
2.文献综述 文献综述简介 争议的开始 13 支持人工智能的立场 14 反对人工智能的论点 16 人工智能与平面设计师的关系 20 基于人工智能的平面设计工具 23 对艺术家整体的风险 24 未经授权使用创作者的图像 24 对版权的困惑 25 模仿艺术家作品的道德问题 27 工作替代 30 积极的前进道路 31 艺术家的反击 31 负责任的人工智能和猖獗的人工智能的风险 32 质疑人工智能 37 情况继续发展 39
能够与之交流。在这里,增强现实(AR)环境中提供的信息可能有益于传达机器人的意图[24,26],可视化安全信息,并高点用户必须执行的过程或任务[22]。根据我们的经验,这种沉浸式的人类机器人协作(HRC)环境通常在桌面系统(例如Unity3D)上撰写,从而充分利用鼠标和键盘等熟悉的输入技术。但是,在教育者中有效设计AR内容需要准确模拟应锚定的现实世界环境。即使那样,通常在AR中的AR内容模拟AR含量与AR头部安装显示器(HMD)时的位置可视化之间存在明显差异。此外,部署到HMD,测试和调试的过程以及在桌面系统上再次编辑的过程通常很慢,乏味且具有挑战性。为了解决这个问题,先前的工作最近证明了使用增强现实来创作AR-AR-ADITU的潜力[21]。但是,原位AR创作工具的好处是什么,可以说在输入功能方面可能会受到限制(中间交互作用与鼠标和键盘)?我们看到了几个优点:(1)用户可以立即测试例如可视化及其外观属性的变化,而无需重新编译整个应用程序。此外,(2)这样的创作工具可以降低进入障碍,因为它可以允许新手用户在不需要广泛的编程技能的情况下设计受支持的系统。但是,我们从AR中开发创作系统[21]的经验表明,在纯AR环境中,整个AR体验的设计和配置可能很困难:例如,在空气中显示的虚拟键盘上有效的文本输入并不是琐碎的[12],并且操纵传统界面元素(例如,按钮和列表)可能会互动(例如,纽扣和列表),因此很难改善互动。最近的作品因此,将多个设备作为互补接口[9,27](例如AR HMDS和移动触摸屏设备)组合起来,以利用每种技术的各自优势。在我们先前的Robovisar [21]项目上构建,我们提供了一种混合创作工具,其中包括桌面环境,平板电脑和AR HMD,可以集体作者并运行完整的AR用户体验。该系统应允许用户在与机器人直接合作的同时设计所有AR内容。通过启用初始设置和原位创作,我们提出的系统会流畅地支持执行阶段,从而使用户可以在一个或多个机器人上尝试使用其撰写的工作流,这可能但不必是配件。在以下内容中,我们介绍了我们的概念,描述了原型的特征。在本文中,我们将范围限制在创作和协作集会上,从而排除了HRC组装的其他关键方面(例如,机器人编程,设计组装说明)。但是,我们有信心将来这些步骤可以与我们的概念集成在一起。
NWC 选修课主要针对兵棋创作领域的新手,但也涉及中级技能。它对高级水平的讲解较少 — — 对于这类综合课程来说这并不奇怪。该选修课采用讲座、课堂活动(其中大部分围绕使用 WCK 构建课堂兵棋)和独立研究项目相结合的方式,涵盖与兵棋创作相关的所有任务和技能。项目似乎尤为重要。虽然它们并不要求学生创建完整的兵棋 — — 事实上,这样的任务不切实际 — — 但项目确实有助于将兵棋创作的各个任务联系在一起,并“填补”与过程中一些不太明显的元素相关的“空白”。
随着生成性AI(Genai)的迅速发展,人类合作的出现是一种普遍的新工作风格。但是,在此协作管道中,除了用户和系统本身之外,还涉及多个利益相关者,从而引发了关于共同创建的所有者的争议。在本文中,我们探讨了日常用户对人类共同创造的主人翁意识,旨在为从业者提供对未来Genai设计的见解,以增强用户体验。我们确定了与人们对人类共同创造的心理所有权的看法相关的三个主要因素,并系统地分析了个人评估这些因素的方法。这些发现有助于为促进适当的所有权感而促进生产和安全使用Genai工具的策略。
随着基于图像的生成人工智能的成熟和广泛应用,其所引发的争议也促使高等教育领域的人士呼吁立即禁止该技术,因为他们担心该技术可能会引发大规模抄袭 [6, 7] 。迄今为止,学术界几乎没有表现出任何兴趣认真研究这种新工具的实际用例和最佳实践。学术界反而关注这项新兴技术所带来的颠覆的理论和美学含义。Ajani [8] 就是一个例子,她在研究中指出了“艺术”的两个相互竞争的定义——“艺术是技术的表达,艺术是情感的表现” [8, p. 253] 。因此,讨论围绕着如何看待和评价“艺术”,无论是它捕捉人类状况的能力,还是可证明的技术实力 [9,10] 。
音乐世界和舞蹈世界本身就是一个研究领域。同时,在计算机科学领域,人们对脑机接口 (BCI) 的兴趣近年来显著增加,因为它代表着实现更内在的人机关系的可能性。生物反馈系统 [1] 也正在获得发展势头,其特点是佩戴 BCI 的用户和计算机之间的连续循环。在本文中,我们提出了一种生物反馈系统的演示,该系统将一名舞者、一个专门开发的音乐作曲软件和两名音乐家置于编舞/作曲关系中。舞者佩戴 NeuroSky MindSet 设备 [2],该设备可检测一些神经参数,特别是她的注意力值 [3]。根据这些值,软件会生成音乐复音,并在电子乐谱上呈现给演奏它的音乐家。反过来,这样产生的音乐会影响舞者的心理状态,舞者会根据所听到的内容调整舞蹈,从而生成新的复音音乐小节。
导演 / 编舞 . . . . . . . . . . . . . . . . . . . . Larry Nye 音乐总监 . . . . . . . . . . . . . . . . . . . Jill Brunelle 音响设计师 . . . . . . . . . . . . . . . Nathan Roberts 灯光与布景设计师 . . . . . . . . . . . . . . Douglas Macur 服装设计师 . . . . . . . . . . . . . . Heidi Leigh Hanson 舞蹈队长 . . . . . . . . . . . . . . . . . . Alexina Cristante 助理灯光设计师 . . . . . . . . . . . . TJ Blotney 舞台经理 . . . . . . . . . . . . . . . Ariana Harris 助理舞台经理 . . . . . . . . . . . . . Lauren Marini 制作经理 . . . . . . . . . . . . . Mike Skinner 技术总监 . . . . . . . . . . . . . . Brandon Fuller 电工大师 . . . . . . . . . . . . . . . . . . . Devin Lee 舞台管理导师. . . . . . . . . Robyn Gostomski Theresa Stark 服装店主管. . . . . . . . . . . Richard Harding 道具主管. . . . . . . . . . Cailey Harwood-Smith 布景主管. . . . . . . . . . . . . Amelia Pizzoferrato 部门营销协调员. . . . . . . . . . Molly Flanagan 音响工程师/A1 广播混音师. . . Nick Moran 音响 A2. . . . . . . . . . . . . . . . Francie Ortiz 灯光板操作员. . . . . . . . .Sam Mena 服装运行团队负责人. . . . . . . .Kat Duffner 服装运行团队. . . . . . . . .Connor Shieldes 摄像师 1. . . . . . . Thomas Sicignano 摄像师 2. . . . . . . . .Ryleigh Rivas 摄像师 3. . . . . . . . .Alyssa Masi 视频广播工程师. . . . . . . . . . . NicoleThomas 海报设计. . . . . . . . . . . . . . . . Barbara Kagan 节目单设计. . . . . . . . . . . . . . Molly Flanagan
大型语言模型 (LLM),例如生成式预训练 Transformer 3 (GPT-3) [ 3 ],因其生成文本内容的能力而引起了研究人员和从业人员的极大关注。ChatGPT 1 的迅速成功——推出仅两个月后月活跃用户就达到 1 亿,创下了历史上增长最快的消费者应用记录 2——不仅凸显了生成式 AI 在生成精确和个性化文本内容方面的潜力和能力,而且凸显了界面和交互在与 AI 通信中的关键作用。由于 ChatGPT 是针对对话任务进行了微调的 GPT-3 变体,因此技术基础保持相似;相反,主要区别似乎是人机交互范式的转变,
