我们似乎正处于媒体创作领域一场真正革命的开端:“生成媒体”的兴起。自 1984 年以来,我一直在使用计算机工具进行艺术和设计,我见证了一些重大的媒体革命,包括用于媒体创作和编辑的 Mac 电脑和桌面应用程序的推出、照片级逼真的 3D 计算机图形和动画的发展、1993 年后网络的兴起以及 2006 年后社交媒体网络的兴起。新的人工智能“生成媒体”革命似乎与其中任何一个一样重要。事实上,它的重要性可能与 19 世纪摄影术的发明或 16 世纪西方艺术中线性透视的采用一样大。 (如果您不熟悉这个主题,这里有一个非常简短的历史。生成媒体革命已经发展了 20 多年。第一篇人工智能论文提出,庞大的非结构化网络世界(包括文本、图像和其他文化产物)可用于训练计算机执行各种任务,该论文出现在 1999-2001 年。2015 年,谷歌的“深度梦境”和“风格迁移”方法引起了广泛关注:突然间,计算机可以创造出模仿许多著名艺术家风格的新艺术图像。2021 年 1 月发布的 DALL-E 是另一个里程碑:现在计算机可以根据文本描述合成图像。Midjourney、Stable Diffusion 和 DALL-E 2 都为 2022 年这一演变的加速做出了贡献。现在,合成图像可以具有多种美感,从照片写实主义到任何类型的物理或数字媒体,包括马赛克、油画、街头摄影或 3D CG 渲染。用于生成此类图像的代码在人工智能领域被称为“模型”,于 2021 年公开。 2022 年 8 月,引发了一系列实验并加速了发展。)
主要关键词