图像压缩关键词检索结果

迪士尼研究提供改进的基于 AI 的图像压缩 – 但可能会产生幻觉细节

Disney Research Offers Improved AI-Based Image Compression – But It May Hallucinate Details

迪士尼的研究部门正在提供一种新的图像压缩方法,利用开源稳定扩散 V1.2 模型以比竞争方法更低的比特率生成更逼真的图像。新方法(尽管与 JPEG 和 AV1 等传统编解码器相比,其复杂性有所增加,但仍被定义为“编解码器”)可以在任何 […] 上操作。文章迪士尼研究提供改进的基于 AI 的图像压缩——但它可能会产生幻觉细节首先出现在 Unite.AI 上。

Gen-AI 安全概况:文本转图像模型缓解堆栈指南

Gen-AI Safety Landscape: A Guide to the Mitigation Stack for Text-to-Image Models

AI 不再狂野:了解驯服 T2I 模型的安全组件了解文本转图像 AI 模型的功能和风险文本转图像模型 (T2I) 是根据文本提示描述生成图像的 AI 系统。潜在扩散模型 (LDM) 正在成为最流行的图像生成架构之一。LDM 首先将图像压缩到“潜在空间”,这是表示图像所需的核心信息的压缩、简化表示,而无需在较少的维度上提供所有详细的像素数据。该模型从此潜在空间中的随机噪声开始,并通过称为扩散的过程逐渐将其细化为清晰的图像,由输入文本引导。LDM 用途广泛,不仅能够生成文本转图像输出,还具有修复等功能,允许用户通过简单描述所需的更改来编辑现有图像的特定部分。例如,您可以通过文本命令无缝地从照片中删

使用强化学习训练扩散模型

Training Diffusion Models with Reinforcement Learning

使用强化学习训练扩散模型replay扩散模型最近已成为生成复杂高维输出的事实标准。您可能知道它们能够制作令人惊叹的 AI 艺术和超逼真的合成图像,但它们也在药物设计和连续控制等其他应用中取得了成功。扩散模型背后的关键思想是将随机噪声迭代地转换为样本,例如图像或蛋白质结构。这通常被激发为最大似然估计问题,其中模型被训练以生成尽可能接近训练数据的样本。然而,扩散模型的大多数用例并不直接与匹配训练数据有关,而是与下游目标有关。我们不只是想要一张看起来像现有图像的图像,而是一张具有特定外观的图像;我们不只是想要一个物理上合理的药物分子,而是想要一个尽可能有效的药物分子。在这篇文章中,我们展示了如何使用