理论背景:ChatGPT 等生成式人工智能的蓬勃发展改变了人们对创意工作的认知。在图形领域,Midjourney、DALL-E 或 Adobe Firefly 等 AI 系统允许创建高质量的图形,而无需艺术技能或聘请才华横溢的设计师。同时,加密货币和相关的非同质化代币 (NFT) 的出现导致创意行业,尤其是艺术市场发生了根本性变化。本文的目的:本文旨在研究人工智能生成的艺术和 NFT 对全球艺术市场的发展速度和影响,重点关注市场趋势、对能源价格的依赖、细分市场以及这些变化如何影响艺术品定价和艺术家的生计。研究方法:作者评估了 NFT 市场的受欢迎程度和发展,以及 2022 年崩溃的主要原因。作者确定了艺术市场发展的可能情景,指出了主要的潜在威胁,并强调了未来数字资产估值的关键决定因素。主要发现:尽管最初买家会感到兴奋,但他们对数字商品的评价会降低,尤其是那些由人工智能生成的商品。它们被认为天生就低劣且价值较低。作品的过度生产加上人工智能解决方案的可用性意味着传统的供需机制降低了价格
生成的AI模型,例如稳定的扩散,DALL-E和MIDJOURNEY,最近引起了广泛的关注,因为它们可以通过学习复杂,高维图像数据的分布来产生高质量的合成图像。这些模型现在正在适用于医学和神经影像学数据,其中基于AI的任务(例如诊断分类和预测性建模)通常使用深度学习方法,例如卷积神经网络(CNNS)和视觉变形金刚(VITS)(VITS),并具有可解释性的增强性。在我们的研究中,我们训练了潜在扩散模型(LDM)和deno的扩散概率模型(DDPM),专门生成合成扩散张量张量成像(DTI)地图。我们开发了通过对实际3D DTI扫描进行训练以及使用最大平均差异(MMD)和多规模结构相似性指数(MS-SSSIM)评估合成数据的现实主义和多样性来生成平均扩散率的合成DTI图。我们还通过培训真实和合成DTI的组合来评估基于3D CNN的性别分类器的性能,以检查在培训期间添加合成扫描时的性能是否有所提高,作为数据增强形式。我们的方法有效地产生了现实和多样化的合成数据,有助于为神经科学研究和临床诊断创建可解释的AI驱动图。
在这份技术报告中,我们广泛研究了众所周知的生成人工智能(AI)应用的产出的准确性,以响应描述流体力学社区熟悉的常见流体运动现象的提示。我们检查了一系列应用程序,包括Midjourney,Dall·E,跑道ML,Microsoft Designer,Gemini,Meta AI和Leonardo AI,由Google,OpenAI,Meta和Microsoft等著名公司介绍。我们的文本提示生成图像或视频,包括“vonKármán涡流街”,“经过机翼”,“ kelvin-helmholtz的不稳定”,“尖锐的超音速身体上的冲击波”等示例。我们将这些应用程序生成的图像与实验室实验和数值软件产生的图像进行比较。我们的发现表明,这些生成的AI模型没有得到充分训练的流体动力学成像,从而导致潜在的误导性输出。除了文本到图像/视频生成之外,我们还进一步探索了使用这些AI工具从图像/视频到文本生成的过渡,旨在研究其对流体运动现象的描述的准确性。本报告为学术机构中的教育工作者提供了警告,强调了这些工具误导学生的潜力。它还旨在告知这些著名公司的研究人员,鼓励他们解决这个问题。我们猜测,这种缺点的主要原因是从科学期刊中对版权保护的流体运动图像的有限访问权限。
S. SHYAM SUNDAR,宾夕法尼亚州立大学 CASON SCHMIT,德克萨斯农工大学 从纽约市警察逮捕唐纳德·特朗普的假照片到一个聊天机器人描述一位还活着的计算机科学家不幸去世,新一代生成人工智能系统能够创建令人信服但虚构的文本和图像,这引发了人们对欺诈和错误信息的担忧。事实上,一群人工智能研究人员和业内人士在 2023 年 3 月 29 日敦促该行业暂停对最新人工智能技术的进一步培训,否则,政府可以“实施暂停”。这些技术——图像生成器(如 DALL-E、Midjourney 和 Stable Diffusion)以及文本生成器(如 Bard、ChatGPT、Chinchilla 和 LLaMA)——现在可供数百万人使用,并且不需要技术知识即可使用。鉴于科技公司推出这些人工智能系统并在公众身上进行测试时可能造成广泛危害,政策制定者面临着确定是否以及如何监管新兴技术的任务。对话邀请了三位技术政策专家来解释为什么监管人工智能是一项如此大的挑战——以及为什么正确监管如此重要。为了跳到每个回应,下面是每个回应的列表:人类的弱点和移动目标结合“软”和“硬”方法要问的四个关键问题
最近,生成式机器学习模型的输出质量得到了一定程度的提高,开辟了新的使用途径。这种质量的提高导致了商业生成平台的出现,用户可以在其中创建任意的文本和图像提示,以便快速生成大量图像。这些图像有时用作完成的创意结果,有时用作进一步手动编辑或设计构思的基础。从手动草图到图像编辑器和 3D 渲染,各种传统的可视化方法每天都在建筑设计中使用。建筑师很快就对生成方法产生了兴趣,正如 AEC 杂志 (2022) 的特别版所反映的那样。这项新技术在公众中得到了广泛讨论,从其具体用例到其开发方式的伦理以及它将带来哪些变化。在本文中,我们希望利用 Midjourney 平台的开放性以定量方式分析当前的建筑用例和功能。我们通过多种方法分析了 5800 万个查询,包括 word2vec 等 NLP 方法。我们考虑了这些模型背后的相关技术部分,并将研究它们如何使现在和将来的建筑师受益。图像生成模型的当前技术基础是所谓的扩散方法。Sohl-Dickstein 等人(2015 年)首次引入了正向扩散,它会逐步破坏图像中的结构化信息,而反向扩散则试图重新生成丢失的信息。然而,由于原始图像信息已被破坏,反向扩散至少部分起作用
摘要 近年来,人工智能 (AI) 图像生成器的复杂程度和公众可访问性显著提高,能够从一行文本创建逼真的复杂图像。这些图像生成器的一个潜在应用是在产品设计项目的概念生成阶段。在概念生成中成功实施 AI 文本转图像生成器可以为公司和设计师节省成本和时间。因此,本文的目的是研究 AI 与产品设计和教育的整合。进行了文献综述,以大致了解 AI 是什么以及 AI 图像生成器如何工作。进行了一项实验,使用了三个不同的图像生成器:Stable Diffusion、DALLꞏE 2 和 Midjourney。每个 AI 文本转图像生成器都生成了三张餐桌图像,并将其插入到加权和评级矩阵中,与宜家的三张真实餐桌一起作为概念进行评级。矩阵中有四个设计规范来评估概念:美观度、性能、尺寸、安全性。该矩阵已发送给产品设计专业的学生和毕业生,以匿名方式填写。得分最高的概念来自宜家,其次是 DALLꞏE 2 生成的概念。根据实验结果,得出结论,AI 图像生成器还不是产品设计中概念生成的可行替代方案,但可以成为在概念生成阶段激发设计师使用新想法的有用工具。
使用生成式人工智能为自主系统生成行动计划。联系人 Damien Pellier (Damien.Pellier@imag.fr) LIG-Marvin Humbert Fiorino (Humbert.Fiorino@imag.fr) LIG-Marvin,关键词 自动规划,生成式人工智能 上下文 自动规划 [1] 是人工智能的一个领域,其目的是设计决策算法用于自主系统,即机器人、无人机、机器人等代理。由于这些系统无需人工监督即可“自主”运行,因此它们必须始终制定行动计划以实现分配给它们的目标。众所周知,自主规划是 NP 难问题,而领域特定语言 (DSL)(如 PDDL(规划领域描述语言)[2])被设计用于将代理任务(行动、目标和世界状态等)建模/指定为规划问题。计划生成基于许多经典的 AI 技术,例如树搜索和启发式搜索、SAT 或 CSP 问题求解等(有关更多详细信息,请参阅 PDDL4J [3] 和 [1])。同时,生成人工智能(也称为生成 AI 或 GenAI [4])是能够使用生成模型生成文本、图像或其他媒体的人工智能 [5][6][7]。生成 AI 模型学习其输入训练数据的模式和结构,然后生成具有相似特征的新数据。在 2020 年代初期,基于 Transformer 的深度神经网络的进步使许多生成 AI 系统成为可能,这些系统以接受自然语言提示作为输入而闻名。其中包括大型语言模型聊天机器人(如 ChatGPT、Bing Chat、Bard 和 LLaMA)以及文本到图像的人工智能艺术系统(如 Stable Diffusion、Midjourney 和 DALL-E)。
“生成式人工智能是否侵犯版权?”是一个紧迫的问题。这也是一个难题,原因有二。首先,“生成式人工智能”不仅仅是一家公司的一种产品。它是一个庞大的松散相关技术生态系统的统称,包括 ChatGPT 等对话式文本聊天机器人、Midjourney 和 DALL·E 等图像生成器、GitHub Copi-lot 等编码助手以及作曲和制作视频的系统。生成式人工智能模型具有不同的技术架构,并使用不同的算法对不同种类和来源的数据进行训练。有些需要数月时间和数百万美元的训练;其他的可以在一个周末完成。这些模型以非常不同的方式提供给用户。有些是通过付费在线服务提供的;其他系统则以开源模式分发,任何人都可以下载和修改它们。这些系统的行为不同,并引发不同的法律问题。因此,我们需要正确的框架——比“生成式人工智能”一词更深入——以便准确、清晰地推理所涉及的不同法律问题。第二个问题是版权法非常复杂,而生成式人工智能系统设法触及了它的许多角落。它们提出了作者身份、相似性、直接和间接责任、合理使用和许可等问题。这些问题不能孤立地分析,因为到处都有联系。生成式人工智能系统的输出是否合理使用可能取决于其训练数据集的组装方式。
两小时的会议以参与者进入一个黑匣子般的工作室开始,工作室中有四组创作者设置了四个工作站,工作站配有笔记本电脑和屏幕,这些创作者在自己的项目中使用了人工智能和沉浸式技术,从世界构建和讲故事到生成视觉效果作为规划工具。其中,设计师兼活动家 Magda Mojsiejuk 以“Pecha-kucha”风格开始,解释了与人工智能相关的词汇,如算法、大型语言模型、深度学习、自然语言处理、机器学习等。人工智能作为一种强大的技术,可以应用于我们生活和社会的各个方面。在本次会议上,重点是生成式人工智能,可以简单地描述为“创建文本、图像或音乐等的人工智能”。通过这个简短的介绍,观众了解了一些关于人工智能的基本概念和事实,例如这些人工智能模型是如何在数据集上进行训练的,例如“chatGPT”表示聊天生成预训练变压器。 Magda 也提到,人工智能近来取得的突破性进展,是受到人类大脑的启发。研究人员制造出类似大脑的人工神经元和神经网络,以提升人工智能的学习能力。从这个意义上讲,机器就像人类一样在学习。与此同时,谷歌的另一款人工智能 Gemini 帮助 Magda 整理了词汇表。现场有三分之一的听众举手表示,自己对这些技术术语不够熟悉。许多与会者认为,这个简短的介绍很有启发性,对本环节的后续讨论很有帮助。Magda 邀请听众在演讲结束后到她的站点,亲身体验使用另一款生成式人工智能“Midjourney”生成图片,然后只需非常简单的设备,就可以生成有形的宝丽来照片。
长期以来一直对“数据驱动”的世界数据源和强迫,尤其是当嵌入社会技术系统中的“客观”类别可能损害那些属于传统类别之外的人[8、9、20、24、49]。例如,由图像数据提供动力的商业性别面部识别软件在深色皮肤[10]和变性[61]人方面的性能较差。最近,面向消费者的生成AI(Genai)产品(例如Chatgpt,Dall-E和Midjourney)的扩散似乎巩固了数据和AI对我们的日常生活的侵蚀,进一步强调了参与数据的重要性[32]以及我们与数据设计的方式[43]。当前对生成AI的强调与2010年代的类似趋势相似。在她的基础HCI关于Queering的论文中,Ann Light在我们的日常生活中快速采用了数字工具的效果[46]。她转向酷儿理论,以促进排队作为抵制主导话语的潜在设计取向。排队涉及中断或分解类别[11-13];这是一种使现状困扰的创造性颠覆形式。正如其他HCI学者所指出的那样,远离现状不仅需要观察当前状态和(重新)为其设计[41]。取而代之的是,我们必须质疑为什么最新技术将自己置于我们的生活中,谁最有利于其采用并受到伤害的潜力。这样做需要以抵抗当前技术化和集中化影响的方式进行设计[47]。在这个为期一天的研讨会中,我们邀请参与者考虑如何消除迫在眉睫的数据叙事,算法决策,