Stable Diffusion 3——下一代 AI 图像生成器

OpenAI 的最新作品 Sora 制作了引人入胜的视频,提供了无与伦比的视觉构图真实感。该模型利用语言理解和视频生成的融合,可以解释文本提示、适应各种输入方式并模拟动态相机运动。

来源:Qudata

Stable Diffusion 3 – 下一代 AI 图像生成器

Stability AI 是人工智能领域的知名企业,已宣布发布 Stable Diffusion 3 (SD3),这是其开放权重图像合成模型系列的最新版本。

Stable Diffusion 3 的发布

Stable Diffusion 系列模型,包括版本 1.4、1.5、2.0、2.1、XL、XL Turbo 以及现在的 3,一直在不断突破 AI 在图像生成方面所能实现的界限。借助 SD3,Stability AI 旨在为 OpenAI 的 DALL-E 3 等专有模型提供更开放的替代方案,同时承认受版权保护的训练数据、偏见和潜在滥用的挑战。

与前代产品不同,SD3 拥有一系列大小从 8 亿到 80 亿个参数不等的模型,使其能够满足从智能手机到服务器等各种设备的需求。这种模型大小的多功能性确保 SD3 能够满足不同的计算要求,同时保持其生成复杂逼真图像的能力。

Stability AI 首席执行官 Emad Mostaque 强调了 SD3 背后的技术进步,他表示:“它使用了一种新型扩散变压器(类似于 Sora),结合了流匹配和其他改进。它利用了变压器的改进,不仅可以进一步扩展,还可以接受多模态输入。”

Sora

“流匹配”技术可确保从随机噪声到结构化图像的平滑过渡,从而增强模型生成视觉连贯输出的能力。凭借其扩散变压器架构,SD3 采用了一种新颖的图像合成方法,从以处理模式和序列的能力而闻名的变压器中汲取灵感。这种创新方法不仅有助于高效扩展,而且还能产生更高质量的图像输出。

加入 Stable Diffusion 3 的候补名单,探索 AI 生成艺术的无限潜力。

加入 Stable Diffusion 3 的候补名单