最近,扩散模型已成为强大的生成模型类别。尽管他们成功,但对他们的语义空间的理解仍然有限。这使得在没有其他培训的情况下,获得精确且脱节的图像生成,尤其是以无监督的方式而挑战。在这项工作中,我们从有趣的观察中提高了对它们的语义空间的理解:在一定范围的噪声水平中,(1)扩散模型中学习的后均值预测指标(PMP)是局部线性的,(2)其Jacobian的单数矢量位于其低度语义语义下集中。我们提供了坚实的理论基础,以证明PMP中的线性和低级别的合理性。这些见解使我们能够提出一种无监督的,单步的,无训练的LO W-rank Co n-trollable图像编辑(LOCO编辑)方法,用于在扩散模型中精确局部编辑。LOCO编辑确定了具有良好属性的编辑说明:同质性,可传递性,合成性和线性性。Loco编辑的这些属性从低维语义子空间中受益匪浅。我们的方法可以进一步扩展到各种文本到图像扩散模型(T-Loco Edit)中的无监督或文本监督编辑。最后,广泛的经验实验证明了Loco编辑的有效和效率。可以在项目网站上找到代码和ARXIV版本。1
文本到图像的扩散模型在可控图像生成领域取得了巨大成功,同时也带来了隐私泄露和数据版权问题。成员资格推断在此背景下作为检测未经授权数据使用的潜在审计方法而出现。虽然人们对扩散模型进行了一些研究,但由于计算开销和增强的泛化能力,它们并不适用于文本到图像的扩散模型。在本文中,我们首先发现文本到图像的扩散模型中的条件过拟合现象,表明这些模型倾向于在给定相应文本的情况下过拟合图像的条件分布,而不仅仅是图像的边际分布。基于这一观察,我们推导出一个分析指标,即条件似然偏差(CLiD),以进行成员资格推断,这降低了估计单个样本记忆的随机性。实验结果表明,我们的方法在各种数据分布和数据集规模上都明显优于以前的方法。此外,我们的方法表现出对过度拟合缓解策略(例如早期停止和数据增强)的卓越抵抗力。
降解概率模型在机器学习中变得越来越重要,但尚未研究其量子对应物。在这项工作中,我们提出了生成差异模型的量子版本。在该算法中,人工神经网络被参数化的量子电路代替,以直接操纵量子状态。我们既提出完整的量子版本,也是该算法的潜在经典量词版本。在潜在模型中,参数化的量子电路是通过使用预训练的经典自动编码器获得的,以低维的数据表示训练。对于这两种模型,我们都展示了一种使用辅助量子位来调节输出分布的方法。已使用定性评估补充的定量指标对模型的性能进行了评估。对于潜在模型,我们显示了对实际量子硬件的简化版本的实现。NISQ设备上的执行允许在存在噪声的情况下评估算法的性能。
具有节点属性的大规模图在各种现实世界应用中越来越普遍。创建镜像现实世界示例的合成,富含属性的图至关重要,尤其是在限制始终数据时共享分析和开发学习模型的图形数据。传统的图生成方法的处理能力有限,无法处理这些复杂的结构。扩散模型的最新进展显示出在没有属性和较小分子图的生成图形结构方面的潜力。但是,由于复杂的属性结构相关性和这些图的大尺寸,这些模型在生成大型属性图时面临挑战。本文介绍了一种新颖的扩散模型,GraphMaker,专为生成大型归因图而设计。我们探索了节点属性和图形结构生成过程的各种组合,发现异步方法更有效地捕获了复杂的属性结构相关性。我们还通过边缘迷你批次生成解决可扩展性问题。为了证明我们在图形数据传播中的实用性,我们引入了新的评估管道。评估表明,GraphMaker生成的合成图可用于为在原始图上定义的任务开发竞争图形学习模型,而无需实际访问这些图形,而许多领先的图形生成方法在此评估中缺乏。我们的实施可在https://github.com/graph-com/graphmaker上获得。
摘要:使自动驾驶汽车能够在轮胎部队饱和的情况下可靠地在Handling的范围内可靠运行,这将提高其安全性,尤其是在诸如紧急障碍避免或不利天气状况之类的情况下。然而,由于任务的动态性和对道路,车辆及其动态相互作用的不确定特性的高灵敏度,解锁此能力是具有挑战性的。是出于这些挑战的动机,我们提出了一个框架,以使用包含来自不同环境中不同车辆的轨迹的未标记数据集学习有条件的扩散模型,以进行高性能车辆控制。我们设计了扩散模型,以通过物理知识数据驱动的动力学模型的参数的多模式分布来捕获复杂数据集的轨迹分布。通过调节在线测量中的生成过程,我们将扩散模型集成到一个实时模型预测控制框架中,以限制驾驶,并证明它可以在频率上适应给定的车辆和环境。在Toyota Supra和Lexus LC 500上进行的广泛实验表明,单个扩散模型在不同的轮胎在不同的道路条件下使用不同的轮胎时,可以在两辆车上进行可靠的自动漂移。该模型与任务特定的专家模型的性能相匹配,同时以概括性的概括为单位,铺平了迈向一般,可靠的方法,以在处理范围内进行自动驾驶。
生成模型(例如Di usion模型)在近年来已取得了显着的进步,从而使能够综合各个领域的高质量现实数据。在这里,探索了在超分辨率显微镜图像上的分解模型的适应和训练。表明,生成的图像类似于实验图像,并且生成过程不会从训练集中的现有图像中显示出很大程度的记忆。为了证明生成模型在数据增强中的有用性,将基于基于学习的高分辨率数据训练的基于深度学习的单位图(SISR)方法的性能与单独使用实验图像或数学建模产生的图像进行了比较。使用一些实验图像,改进了重建图像的重建质量和空间分辨率,从而展示了分解模型图像产生的潜力,以克服显微镜图像收集和注释的限制。最后,该管道公开可用,可在线运行和用户友好,以使研究人员能够生成自己的合成显微镜数据。这项工作证明了显微镜任务的生成分歧模型的潜在贡献,并为其在该领域的未来应用铺平了道路。
仿真在解释大型强子对撞机(LHC)实验的碰撞数据以及与理论预测的测试对齐中起着至关重要的作用。在模拟碰撞数据中所带来的独特挑战,包括高维特征空间和缺乏可拖动的可能性模型,启发了一系列深度学习解决方案[1,2]。特别是,对于模拟检测器中的粒子相互作用,核心挑战是有限的计算资源,以对热量计中的粒子阵雨建模所需的极端细节主导。在这里,基于Geant 4 [3 - 5]的蒙特卡洛模拟的传统方法是强大但资源高度的 - 占据了地图集模拟链中最大的时间[6]。在未来的高光度LHC运行中,热量计模拟将需要应对更高的数据速率,从而可能成为物理分析的限制因素,而在该领域没有显着进展[7]。为了大大加快热量计模拟的速度,已经采取了许多努力。虽然快速的淋浴模型已成功部署在LHC实验[8,9]中,但准确性却有限。最近,深层生成模型的出现导致了它们的广泛流行和解决这项任务的潜力。应用于量热计的第一个生成模型
扩散模型的训练和采样已在先前的艺术中详尽阐明(Karras等,2022; 2024b)。取而代之的是,底层网络架构设计保持在摇摇欲坠的经验基础上。此外,根据最新规模定律的趋势,大规模模型涉足生成视觉任务。但是,运行如此大的扩散模型会造成巨大的综合负担,从而使其具有优化的计算并有效分配资源。为了弥合这些空白,我们浏览了基于u-NET的效率扩散模型的设计景观,这是由声望的EDM2引起的。我们的勘探路线沿两个关键轴组织,层放置和模块插入。我们系统地研究基本设计选择,并发现了一些有趣的见解,以提高功效和效率。这些发现在我们的重新设计的架构EDM2+中,这些发现将基线EDM2的计算复杂性降低了2倍,而不会损害生成质量。广泛的实验和比较分析突出了我们提出的网络体系结构的有效性,该结构在Hallmark Imagenet基准上实现了最先进的FID。代码将在接受后发布。