摘要。现实世界图像超分辨率(RISR)旨在从退化的低分辨率(LR)输入中重新结构高分辨率(HR)图像,以应对诸如模糊,噪声和压缩工件之类的挑战。与传统的超分辨率(SR)不同,该方法通过合成的下采样来典型地生成LR图像,而RISR则是现实世界中降级的复杂性。为了有效地应对RISR的复杂挑战,我们适应了无分类器指导(CFG),这是一种最初用于多级图像生成的技术。我们提出的方法,真实的SRGD(带有无分类器引导扩散的现实世界图像超分辨率),将RISR挑战分解为三个不同的子任务:盲图恢复(BIR),常规SR和RISR本身。然后,我们训练针对这些子任务量身定制的类别条件SR扩散模型,并使用CFG来增强现实世界中的超分辨率效果。我们的经验结果表明,实际SRGD超过了定量指标和定性评估中的现有最新方法,如用户研究所证明的那样。此外,我们的方法在
在计算机图形学中创建高质量的材质是一项具有挑战性且耗时的任务,需要很高的专业知识。为了简化这个过程,我们引入了 MatFuse,这是一种统一的方法,它利用扩散模型的生成能力来创建和编辑 3D 材质。我们的方法整合了多种条件来源,包括调色板、草图、文本和图片,增强了创造可能性并对材质合成进行了细粒度的控制。此外,MatFuse 通过多编码器压缩模型的潜在操作实现了地图级材质编辑功能,该模型可以学习每个地图的解开的潜在表示。我们在多种条件设置下展示了 MatFuse 的有效性,并探索了材质编辑的潜力。最后,我们根据 CLIP-IQA 和 FID 分数定量评估生成材质的质量,并通过开展用户研究定性评估生成材质的质量。用于训练 MatFuse 的源代码和补充材料可在 https://gvecchio.com/matfuse 上公开获取。
文本对图像(T2I)生成模型最近成为一种强大的工具,可以创建照片现实的图像并引起多种应用。然而,将T2i模型的有效整合到基本图像分类任务中仍然是一个悬而未决的问题。促进图像锁骨表现的一种普遍的策略是通过使用T2I模型生成的合成图像来增强训练集。在这项研究中,我们仔细检查了当前发电和常规数据增强技术的缺点。我们的分析表明,这些方法努力产生既忠实的(就前景对象)而且针对领域概念的多样化(在背景上下文中)。为了应对这一挑战,我们引入了一种创新的类数据增强方法,称为diff-mix 1,该方法通过在类之间执行图像翻译来丰富数据集。我们的经验结果是,DIFF-MIX在信仰和多样性之间取得了更好的平衡,从而导致各种图像分类场景之间的性能显着提高,包括域名数据集的少量,常规和长尾分类。
为了自主驾驶模拟,早期尝试[8,32,35]部署游戏引擎来渲染图像。它不仅需要耗时的过程来重建虚拟场景,而且还需要以低现实主义的形式产生结果。,用于新型视图Synthesis(NVS)的神经渲染技术,例如神经辐射场(NERF)[21]和3D高斯分裂(3DGS)[14],用于同步,以使照片现实主义的街道视图进行同步。当前的研究[4、10、20、23、28、39、43、47、48、51、59]主要是街道视图合成中面临的两个挑战:无界场景的重建和染色体对象的建模。尽管已经取得了令人兴奋的进度,但在现有作品中尚未很好地探索评估重建质量的关键问题。众所周知,理想的场景仿真系统应具有高质量的自由视线渲染的能力。目前的作品通常采用从vehicle捕获而在训练阶段却看不见的观点(例如图。1),同时忽略了偏离训练观点的小说观点(例如图。1)。处理这些新颖的观点时,呈现质量的降低明显降低,对现有作品的模糊和伪像,如图1。此问题归因于车辆收集的图像的固有约束视图。训练图像通常沿着车辆的行驶方向捕获,并以车辆的车道为中心。由于车辆的快速行驶速度,框架之间的超偏度有限,因此不允许对现场中的物体进行全面的多视觉观察。因此,可以从稀疏视图中将自动驾驶的街道视图综合任务理解为重建问题。
摘要 - 通过人工智能(AI)基于人工智能(AI)基于人工智能的沟通优化仍然是基础的基础。作为第六代(6G)通信网络追求全赛纳里奥的覆盖范围,在复杂的极端环境中的选择提出了未经证实的挑战。这些环境的动态性质,结合物理约束,使AI解决方案(例如深度强化学习(DRL))很难为培训过程获得有效的奖励反馈。但是,许多现有的基于DRL的网络优化研究通过理想化的环境设置忽略了这一挑战。受到生成AI(Genai)(尤其是扩散模型)的强大功能的启发,在捕获复杂的潜在分布时,我们引入了一种新颖的基于扩散推理的奖励成型方案(着装),以实现强大的网络优化。通过对观察到的环境状态进行调节和执行动作,着装利用扩散模型的多步降级过程作为深层推理的一种形式,逐渐完善了潜在表示,以产生有意义的辅助奖励信号,以捕获网络系统模式。此外,连衣裙设计用于与任何DRL框架的无缝集成,允许连衣裙辅助的DRL(装扮得出)即使在极端的网络环境下也可以实现稳定而有效的DRL培训。实验结果表明,穿着的DRL大约达到1。礼服代码可从https://github.com/nice-hku/dress获得。与基线方法相比,在稀疏奖励无线环境中的收敛速度比其原始版本快于其原始版本,并且在多个一般DRL基准环境中的性能得到了显着改进。
扩散模型在产生各种自然分布的高分辨率,逼真的图像方面取得了巨大的成功。但是,他们的性能在很大程度上依赖于高质量的培训数据,这使得从损坏的样本中学习有意义的分布变得具有挑战性。此限制限制了它们在稀缺或昂贵的科学领域中的适用性。在这项工作中,我们引入了DeNoising评分蒸馏(DSD),这是一种出奇的有效和新颖的方法,用于训练低质量数据的高质量生成模型。DSD首先预修了一个扩散模型,专门针对嘈杂,损坏的样品,然后将其提炼成能够生产精制,干净的输出的单步生成器。传统上将得分蒸馏视为加速扩散模型的一种方法,但我们表明它也可以显着提高样本质量,尤其是从退化的教师模型开始时。在不同的噪声水平和数据集中,DSD始终提高生成性能 - 我们在图中总结了我们的经验证据1。此外,我们提供了理论见解,表明在线性模型设置中,DSD识别了干净的数据分散协方差矩阵的特征空间,并隐含地正规化了生成器。此透视图将蒸馏片重新升级为效率的工具,而且是改善生成模型的机制,尤其是在低质量的数据设置中。
标题:在1.5T MR-LINAC平台上对头颈癌的显而易见的扩散系数的回波平面成像的重新延伸系数的重现:使用QIBA计量学的技术验证作者:Brigid A. McDonald 1,Dina El-Habashy 1,Renjie He 1,Sammir 1,Sam Mir Bir 1,2 Mohamed 1, 3 , Sara Ahmed 1 , Yao Ding 4 , Jihong Wang 4 , Stephen Y. Lai 5 , Alex Dresner 6 , John Christodouleas 7 , Clifton D. Fuller 1 Affiliations: 1 The University of Texas MD Anderson Cancer Center, Department of Radiation Oncology, Houston, TX, USA 2 UT MD Anderson Cancer Center UTHealth Houston Graduate School of Biomedical Sciences, Houston,美国德克萨斯州3贝勒医学院,放射肿瘤学系,美国德克萨斯州休斯敦4 4美国德克萨斯州安德森大学癌症中心,放射物理系,美国德克萨斯州休斯顿,美国5号,美国德克萨斯州癌症中心,德克萨斯州癌症中心,德克萨斯州休斯敦,德克萨斯州休斯敦,美国德克萨斯州休斯敦,美国6美国菲利普斯医疗保健MR on Ceport,美国埃尔克斯郡,美国7月,美国埃尔克斯郡。目的:为了检测放射治疗期间的明显扩散系数(ADC)值的变化,用于生物图像引导的自适应放射治疗,必须表征ADC的变异性。我们评估了1.5T MR-LINAC上头颈癌中ADC值的可重复性。方法:39例头颈癌患者(36例原发性肿瘤,55个淋巴结)在1.5T MR-LINAC上在辐射疗法开始之前的两个时间点上以回声 - 平面成像扩散加权MRI成像。为每个病变测量平均值和中位ADC值和体积。绝对性和可重复性系数(RC)。线性回归分析和F检验,以确定病变体积或扫描之间的时间是否影响可重复性。Results: For primary tumors & lymph nodes: mean ADC, median ADC, and volume were 1.27 ± 0.33 mm 2 /s & 1.17 ± 0.34 mm 2 /s, 1.25 ± 0.35 & 1.16 ± 0.37 mm 2 /s, and 8.8 ± 12.3 cm 3 & 6.5 ± 7.2 cm 3 , respectively.对于肿瘤和节点,平均ADC的RC值为0.355 mm 2 /s&0.355 mm 2 /s,%RC值为29.1%和31.1%;中值ADC非常相似。可重现性与体积或扫描间隔没有显着相关,但是观察到较小体积的可重复性较差的趋势。结论:考虑到先前的报告,最佳%∆ ADC在头颈癌中的响应预测阈值约为15-30%,MR-LINAC上的这种序列具有可接受的可重复性来检测较大的ADC变化,但仍可能错过一些临床上显着的变化。
图1。(a)我们提出的拖拉术算法的概述:给定种子点或部分已知的流线,我们的方法提取了相应的局部和邻域DMRI信号,以形成输入数据序列(x 1,…,x t)。然后将此序列馈送到我们的网络中,以预测传播的方向。随后,流线根据给定的步长和传播方向生长。更新的流线(不完整)将是我们方法的新输入,
摘要 - 基于卷积神经网络(CNN)的深度学习模型已用于对阿尔茨海默氏病进行分类或从T1加权大脑MRI扫描中推断痴呆症的严重程度。在这里,我们研究了添加扩散加权MRI(DMRI)作为这些模型的输入的值。在这一领域进行了许多研究,重点介绍了特定数据集,例如阿尔茨海默氏病神经影像学计划(ADNI),该计划评估了北美人(主要是欧洲血统)的人,因此我们研究了对ADNI培训的模型,该模型如何推广到来自印度(Nimhans Cohort)的新人口数据集。我们首先通过预测“大脑时代”来基准我们的模型 - 从其MRI扫描中预测一个人的年龄并继续进行广告分类的任务。我们还评估了在训练CNN模型之前使用3D CycleGAN方法来协调成像数据集的好处。我们的实验表明,在大多数情况下,在协调后的分类性能会提高,并且DMRI作为输入的性能更好。