简介 十一年前,马希尔 (Maher) 问道:“谁在创造?” (Maher 2012),并提出了几个创造性应用的分析空间,包括构思和互动两个维度。马希尔的问题引出了乔丹诺斯 (Jordanous) 的 PPP 视角框架,其中创造行为可以由人类或人工智能 (Jordanous 2016) 执行,以及坎托萨洛 (Kantosalo) 和塔卡拉 (Takala) 的 5C 框架,其中创造行为由人类和人工智能共同组成的集体执行 (Kantosalo and Takala 2020)。1然而,对于人与人工智能互动中创造力的位置,人们的共识较少。混合主动性创造性界面方法提出了一组基本的细粒度活动,这些活动可以由人类或人工智能以某种结构化对话的形式执行(Deterding 等人,2017 年;Spoto 和 Oleynik,2017 年),随后扩展到生成应用(Muller、Weisz 和 Geyer,2020 年),针对特定算法方法进行了改进(Grabe、Duque 和 Zhu,2022 年),并针对其他算法方法进行了批评(Zheng,2023 年)。虽然这些方法生成了重叠的分析动作词汇,但它们并没有解决创造力在何处发生(以及由谁或什么通过这些动作发生)的问题。在这篇短文中,我们提供了对该问题的一个答案的几个例子。我们重新利用 Kantosalo 和 Takala (2020) 的 5C 中的集体概念,提出一种类型的创造力可能会在以下互动空间中不对称地出现 (Rezwana and Maher 2022)
生成式人工智能有可能支持人类的创造力。在过去 60 年里,以人为本的人工智能 (HCAI) 学者们提出了多种模型来设计人机共同创造系统。1961 年,Rhodes 提出了“4P”模型,即“一个人在某个环境中通过计算机化流程制造一件产品 (Press)”[1]。在早期观点中,计算机主要是一种工具。近 60 年后,Kantosalo 和 Takala 对他们的“5C”模型进行了最新更新:“一个集体 (一个人和一个人工智能) 合作为某个情境中的社区做出贡献”[2]。在 Kantosalo 和 Takala 的框架内,以及 Glăveanu 在分布式创造力方面的工作 [3],我们研究一个或多个人如何与人工智能代理合作共同创造贡献,同时保持人类对过程和结果的控制。在早期工作中,我们为软件工程任务的大型语言模型 (LLM) 开发了一个对话式 UI [4]。在一项定量实验中,Ross 及其同事表明,经过精心调优的 UI 可以让后端 LLM 表现得谦逊、礼貌且非常支持 [5]。我们重新使用了这种架构,通过仔细的提示工程来探索创造力和共同创造的机会。在调查了人与人之间的共同创造策略 [6、7、8] 之后,我们进行了三项非正式实验 [9],采用了众所周知的用富有成效的表述来构建问题的策略 [10、11]。接下来,在第四个实验中,我们探索了更强大的概念,即在发现初始框架在某些方面存在缺陷或不足 [13] 后,重新构建问题 [12]。对话式 UI 允许人类控制如何
人工智能也进入了视觉艺术[7]、创意写作和诗歌[8,9]等艺术领域。更多示例可在“ML x Art”列表1中找到。本次研讨会的征集意见中也提出了一个共同的愿景,即人类创造性地使用人工智能作为工具。从这个角度来看,这些新的交互系统有望通过利用人工智能功能来实现创造力支持工具(CST,[10])的关键思想。更具体地说,这种支持可以让人类和人工智能扮演许多不同的角色(有关最新概述,请参阅[11])。例如,这包括使用人工智能作为发散或收敛代理,如霍夫曼[12]所述,即产生或评估(人类的)想法。与此相关的是,Kantosalo 和 Toivonen [13] 强调交替共同创造,即人工智能“取悦”用户和“激怒”用户。此外,Negrete-Yankelevich 和 Morales-Zaragoza [ 14 ] 描述了一组相关的角色,包括将人工智能视为“学徒”,