扩散模型关键词检索结果

双子座扩散:Google DeepMind的新文本扩散模型

Gemini Diffusion: Google DeepMinds nya textdiffusionsmodell

双子座扩散是由Google DeepMind开发的实验文本扩散模型,它代表了语言建模方面的重要一步。双子座扩散与传统模型(例如自回归语言模型)之间的区别在于文本的生成方式。尽管这些传统模型为单词构建文本单词,但双子座扩散使用了一种方法,其中它以随机的“噪声”开头,并逐渐[…] Gemini扩散:Google DeepMind的新文本扩散模型首次出现在AI新闻上。

扩散模型,简单地解释

Diffusion Models, Explained Simply

从噪声到艺术:如何使用扩散模型生成高质量的图像The Post Exfusion模型,首先出现在数据科学上。

扩散模型的投射组成机制

Mechanisms of Projective Composition of Diffusion Models

我们研究了扩散模型中组成的理论基础,特别着眼于分布外的外推和长度将军。先前的工作表明,通过线性得分组合组成分布可以实现有希望的结果,包括在某些情况下(Du等,2023; Liu等,2022)。但是,我们对这些构图如何以及为什么起作用的理论理解仍然不完整。实际上,甚至还不清楚组成的“工作”意味着什么。本文开始解决这些基本差距。我们从…

修复扩散模型对镜子和反射的有限理解

Fixing Diffusion Models’ Limited Understanding of Mirrors and Reflections

自从生成AI开始引起公共利益以来,计算机视觉研究领域已加深了其对能够理解和复制物理定律的AI模型的兴趣。然而,教学机器学习系统模拟重力和液体动力学等现象的挑战一直是研究工作的重点,即[…]固定扩散模型对镜像和反射的有限理解的有限理解,首先是在unite.ai上出现的。

通过传输激活来控制语言和扩散模型

Controlling Language and Diffusion Models by Transporting Activations

大型生成模型变得越来越有能力,并且更广泛地部署到电力生产应用程序中,但是让这些模型确切地产生所需的东西仍然具有挑战性。对这些模型的输出的细粒度控制对于满足用户的期望和减轻潜在的滥用非常重要,从而确保了模型的可靠性和安全性。为了解决这些问题,Apple Machine Learning研究人员开发了一种新技术,该技术具有模态性敏捷性,并通过可忽略的计算开销对模型的行为进行了精细的控制,而…

Univg:统一图像生成和编辑的通才扩散模型

UniVG: A Generalist Diffusion Model for Unified Image Generation and Editing

文本对图像(T2I)扩散模型在以用户提示后生成视觉吸引人的图像时显示出令人印象深刻的结果。在此基础上,各种方法进一步调整了针对特定任务的预训练的T2I模型。但是,这需要单独的模型体系结构,培训设计和多个参数集来处理不同的任务。在本文中,我们介绍了Univg,这是一个通才扩散模型,该模型能够支持具有一组权重的各种图像生成任务。 Univg将多模式输入视为统一条件,以使各种下游……

新的扩散模型从AI图像合成中借用10倍速度的技术

Nya diffusionsmodeller lånar teknik från AI-bildsyntes för 10x hastighetsökning

扩散模型是一种生成的AI技术,它不是依次生成文本,制作自动回归模型,而是从创建文本的粗略草图并在几轮中进行了完善。这种方法的使用包括两个主要步骤:首先将模型高斯噪声添加到输入中,然后学会通过[…]新的扩散模型从AI Image Synthesis中借用10倍速度增加的新扩散模型首先出现在AI新闻上。

具有像素空间扩散模型的新型视图合成

Novel View Synthesis with Pixel-Space Diffusion Models

从单个输入图像中综合新的视图是一项具有挑战性的任务。传统上,通过估计场景深度,扭曲和钻孔来完成此任务,并通过机器学习模型实现了管道的一部分。最近,在新型视图合成(NVS)中越来越多地使用了生成模型,通常包含整个端到端系统。在这项工作中,我们适应了现代扩散模型体系结构,用于像素空间中的端到端NV,从而大大优于先前的最新技术(SOTA)技术。我们探索了编码几何的不同方法…

扩散模型预测 3D 基因组结构

Diffusion model predicts 3D genomic structures

此图显示了 Dip-C 研究中报告的几条染色体的三维基因组结构,这些染色体用于训练新的 ChromoGen 模型。图片来源:研究人员提供,由 MIT News 编辑。作者:Anne Trafton 您体内的每个细胞都包含相同的基因序列,但每个细胞仅表达其中的一部分 […]

ImmerseDiffusion:生成空间音频潜在扩散模型

ImmerseDiffusion: A Generative Spatial Audio Latent Diffusion Model

我们引入了 ImmerseDiffusion,这是一种端到端生成音频模型,可根据声音对象的空间、时间和环境条件产生 3D 沉浸式音景。ImmerseDiffusion 经过训练可生成一阶环绕声 (FOA) 音频,这是一种包含四个通道的传统空间音频格式,可以渲染为多通道空间输出。所提出的生成系统由将 FOA 音频映射到潜在成分的空间音频编解码器、基于各种用户输入类型训练的潜在扩散模型(即文本提示、空间……

DSplats:通过对基于 Splats 的多视图扩散模型进行去噪实现 3D 生成

DSplats: 3D Generation by Denoising Splats-Based Multiview Diffusion Models

生成高质量的 3D 内容需要能够学习复杂场景及其中真实物体的稳健分布的模型。最近基于高斯的 3D 重建技术通过以前馈方式预测 3D 高斯函数,在从稀疏输入图像中恢复高保真 3D 资产方面取得了令人印象深刻的结果。然而,这些技术通常缺乏扩散模型提供的广泛先验和表现力。另一方面,已成功应用于多视图图像去噪的 2D 扩散模型显示出生成广泛...

通过传输激活来控制语言和扩散模型

Controlling Language and Diffusion Models by Transporting Activations

大型生成模型的功能不断增强,部署范围也越来越广,这引发了人们对其可靠性、安全性和潜在滥用的担忧。为了解决这些问题,最近的研究提出通过控制模型激活来控制模型生成,以便有效地诱导或防止生成输出中出现概念或行为。在本文中,我们介绍了激活传输 (AcT),这是一个由最佳传输理论指导的激活控制通用框架,它概括了许多以前的激活控制工作。AcT 是……

Kaleido 扩散:使用自回归潜在模型改进条件扩散模型

Kaleido Diffusion: Improving Conditional Diffusion Models with Autoregressive Latent Modeling

扩散模型已成为从文本描述生成高质量图像的强大工具。尽管这些模型取得了成功,但它们在采样图像中通常表现出有限的多样性,尤其是在使用高无分类器指导权重进行采样时。为了解决这个问题,我们提出了 Kaleido,这是一种通过结合自回归潜在先验来增强样本多样性的新方法。Kaleido 集成了一个自回归语言模型,该模型对原始标题进行编码并生成潜在变量,作为抽象和中间表示……

让光明照耀!扩散模型和重新点亮的未来

Let There Be Light! Diffusion Models and the Future of Relighting

在这篇关于场景编辑的深入博客中,了解尖端扩散模型如何处理重新照明、协调和阴影消除。照片由 Brian Aitkenhead 在 Unsplash 上拍摄。重新照明是在给定输入场景的情况下,在指定的目标照明条件下渲染场景的任务。这是计算机视觉和图形学中的关键任务。然而,这是一个不适定问题,因为场景中物体的外观是由光源、几何形状和表面材料属性等因素之间的复杂相互作用产生的。这些相互作用产生了歧义。例如,给定一个场景的照片,物体上的黑点是由于照明投射的阴影造成的,还是材料本身的颜色很暗?区分这些因素是有效重新照明的关键。在这篇博文中,我们讨论了不同的论文如何通过扩散模型解决重新照明问题。重新照明包含

扩散模型方法解决生成 AI 图像中的纵横比问题

Diffusion model approach tackles aspect ratio problem in generative AI images

左侧图片由标准方法生成,而右侧图片由 ElasticDiffusion 生成。两张图片的提示都是“一只运动猫在新闻发布会上向记者解释其最新丑闻的照片。”(图片由 Moayed Haji Ali/莱斯大学提供。)作者:John Bogna 生成式人工智能 […]

无分类器指导扩散模型的概述

An overview of classifier-free guidance for diffusion models

详细了解无分类器指导的细微差别,这是当前最先进的图像生成模型(称为扩散模型)的核心采样机制。

Pytorch 中从头开始的扩散模型

Diffusion Model from Scratch in Pytorch

去噪扩散概率模型 (DDPM) 的实现 MNIST 上的 DDPM 示例 — 作者提供的图片简介一般来说,扩散模型是一种生成式深度学习模型,它从学习到的去噪过程中创建数据。扩散模型有很多种,最流行的通常是文本条件模型,它可以根据提示生成特定的图像。一些扩散模型 (Control-Net) 甚至可以将图像与某些艺术风格融合在一起。下面是一个例子:作者使用经过微调的 MonsterLabs 的 QR Monster V2 提供的图片如果您不知道这幅图像有什么特别之处,请尝试远离屏幕或眯起眼睛来查看图像中隐藏的秘密。扩散模型有许多不同的应用和类型,但在本教程中,我们将构建基础的无条件扩散模型 DDP

In-Paint3D:使用无闪电扩散模型生成图像

In-Paint3D: Image Generation using Lightning Less Diffusion Models

深度生成 AI 模型的出现大大加速了 AI 的发展,在自然语言生成、3D 生成、图像生成和语音合成方面具有非凡的能力。3D 生成模型已经改变了众多行业和应用,彻底改变了当前的 3D 生产格局。然而,许多当前的深度生成模型遇到了一个共同的障碍:复杂的布线 […]文章 In-Paint3D:使用无闪电扩散模型生成图像首先出现在 Unite.AI 上。