生成模型(例如扩散模型)在近年来已取得了重大进步,从而使能够在各个领域综合高质量的现实数据。在这里,我们探讨了从公开可用数据库的超分辨率显微镜图像的扩散模型的适应和培训。我们表明,生成的图像类似于实验图像,并且生成过程不会记住训练集中的现有图像。此外,我们比较了使用我们生成的高分辨率数据与使用样本数学建模获得的高分辨率数据训练的基于深度学习的反卷积方法的性能。使用一个小的实际训练数据集,我们可以根据空间分辨率获得出色的重建质量,从而表明了准确的虚拟图像生成的潜力,以克服收集和注释图像数据的局限性进行培训。最后,我们使我们的管道公开可用,可在线运行和用户友好,以使研究人员能够生成自己的合成显微镜数据。这项工作证明了生成扩散模型对显微镜任务的潜在贡献,并为其在该领域的未来应用铺平了道路。
1恩纳·科尔大学(University of Enna Kore)医学与外科学院,意大利恩纳(Enna)94100; salvatore.lavalle@unikore.it(s.l.); caterina_gagliano@hotmail.com(c.g.)2临床和实验放射学单元,实验成像中心,IRCCS San Raffaele科学研究所,通过Olgettina 60,20132年意大利米兰; edo.masiello@gmail.com 3,“有机体Di Senso”系“ Sapienza”,VialeDell'università,33,00185,意大利罗马; giannicola.iannella@uniroma1.it(G.I.); giuseppe.magliulo@uniroma1.it(G.M.); annalisa.pace@uniroma1.it(A.P。)4人类解剖学和实验肿瘤学,医学院,乌蒙斯健康科学研究所,蒙斯大学,比利时7022 MONS; jerome.lechien@unimons.ac.be Be 5耳鼻喉科服务,圣地亚哥De Costela医院综合大楼,15705 Santiago de Compostela,西班牙; Christian.calvo.henriquez@gmail.com 6医学和外科科学系和高级技术“ GF Ingrassia”,Ent科,卡塔尼亚大学,Via S. Sofia,S。Sofia,78,95125,意大利Catania,意大利; s.cocuzza@unict.it(s.c。); federicamariaparisi@gmail.com(F.M.P。) : +39-3204-1545-764人类解剖学和实验肿瘤学,医学院,乌蒙斯健康科学研究所,蒙斯大学,比利时7022 MONS; jerome.lechien@unimons.ac.be Be 5耳鼻喉科服务,圣地亚哥De Costela医院综合大楼,15705 Santiago de Compostela,西班牙; Christian.calvo.henriquez@gmail.com 6医学和外科科学系和高级技术“ GF Ingrassia”,Ent科,卡塔尼亚大学,Via S. Sofia,S。Sofia,78,95125,意大利Catania,意大利; s.cocuzza@unict.it(s.c。); federicamariaparisi@gmail.com(F.M.P。): +39-3204-1545-767服务D'Orl et de Chirurgie cervico-faciale,中心医院蒙特佩利尔,奥古斯丁·弗里奇(Augustin Fliche)80 Avenue Augustin Fliche,34000 Montpellier,法国8,奥托尔希尼尔纳律学系,亚历山大大学,亚历山大21577,奥托尔希元学系; ahmedyassinbahgat@gmail.com 9头颈外科,耳鼻喉科,头颈和口腔外科手术单元,Morgagni Pierantoni医院,经Carlo Forlanini,34,47121Forlí,意大利,意大利; giovanni.cammaroto@hotmail.com 10麻醉和重症监护系Policlinico-san Marco,意大利卡塔尼亚95125; luigilavia7@gmail.com 11 Ent and Audiology系,费拉拉大学,意大利44121 Ferrara; dott.albertocaranti@gmail.com(A.C。); claudio@claudiovicini.com(c.v.) *通信:tnmaniaci209@gmail.com;电话。
摘要:唇裂/pa/p/p)是一种普遍的上颌面先天性异常,是由于额骨和上颌过程中的融合失败而引起的。目前,尚无国际商定的唇唇修复的黄金标准程序,并且经常根据外科医生的过去经验和个别患者病例的具体特征选择手术方法。Asher-McDade得分是一种评估单侧裂口手术的广泛使用的工具,依赖于与上颌面区域的美学和对称性有关的标准。但是,尚未开发客观的指标来评估手术成功。本研究旨在结合深度学习和生成对抗网络(GAN)方法,以构建图像生成框架,以产生术后唇部图像,该图像可以用作评估手术成功的标准化参考。我们根据图像嵌入式介绍了图像相似性分数,我们用来验证生成的图像。我们的方法为一组合成面的技术铺平了道路,这些技术可以指导外科医生评估CL/P手术的结果。
摘要 - 基于扩散过程的文本到图像模型,能够将文本描述转换为详细的图像,在艺术,设计以及其他方面具有广泛的应用,例如Dall-E,例如Dall-E,稳定的扩散和Midjourney。但是,它们使用户可以在没有艺术培训的情况下创建与专业质量相当的艺术品,从而导致对侵犯版权的担忧。为了解决这些问题,以前的作品提出了诸如基于对抗扰动和基于水印的方法之类的策略。前者涉及引入微妙的变化以破坏图像生成过程,而后者涉及在艺术品中嵌入可检测的标记。现有方法面临限制,例如需要修改原始图像,容易受到图像预处理的影响,并在将其应用于已发表的艺术品时面临困难。
TIG模型背后的核心原理涉及复杂的神经网络的利用,通常利用诸如生成对抗网络(GAN)和自动回归变形金刚等体系结构。这些模型具有理解和解释文本输入的能力,随后生成与所提供的描述保持一致的图像。该过程涉及从文本提示中学习复杂的模式,纹理和上下文细节,展示了这些模型在不同域中彻底改变内容创建的潜力。随着TIG的景观继续发展,必须对现有文献进行全面审查,以了解这个新兴领域内的细微差别,挑战和进步。在这篇综述中,我们深入研究了15篇开创性论文,这些论文对文本到图像生成模型的开发和完善有重大贡献。
基于机器学习的图像生成模型(例如稳定扩散)现在能够生成很难与真实图像区分开的合成图像,这引起了许多法律和道德问题。作为缓解措施的潜在度量,可以训练神经网络检测许多生成模型合成的图像中存在的数字伪像。但是,由于所讨论的伪影通常是特定于模型的伪像,因此这些所谓的探测器通常会出现来自模型的图像时的性能差,因此尚未接受过培训。在本论文中,我们研究了Dreambooth和Lora,最近出现了两种精细方法,以及它们对假图像探测器的性能的影响。Dreambooth和Lora可用于微调一个稳定的扩散基础模型,该模型具有创建基本模型更改版本的效果。可以这样做的便捷性导致了社区产生的合成图像的扩散。然而,模型微调对图像可检测性的影响尚未在科学背景下研究。因此,我们提出以下研究问题:使用Dreambooth或Lora对稳定的扩散基本模型进行微调会影响仅在基本模型图像上训练的探测器的性能指标吗?我们采用了一种实验方法,使用验证的VGG16架构将二进制分类作为检测器。我们在来自Imagenet数据集的真实图像上训练检测器,以及由三个不同稳定扩散基础模型合成的图像,从而产生了三个训练有素的检测器。然后,我们在这些模型的微调版本生成的图像上测试他们的性能。我们发现,在使用微调模型发生的图像上测试检测器的准确性低于对训练的基础模型生成的图像进行测试的准确性。在前者类别中,与洛拉生成的图像相比,Dreambooth生成的图像对检测器的影响更大。我们的研究表明,在伪造图像探测器培训的背景下,有必要在Dreambooth微调模型中考虑到不同的实体。
理解微观自由度在强烈相互作用的系统的行为是许多物理领域的主要目标,范围从结构镜[1,2]到基本粒子理论[3,4],甚至延伸到量子重力[5,6]。但是,这些系统的第一原则计算通常非常困难,并且需要强大的工具。计算在系统进行相转换时特别具有挑战性,因为可能会出现新的自由度并变得相关。在这种情况下,基本理论必须始终如一地关联这两个阶段,从而描述了从一组自由度到另一组自由度的过渡。对于二阶过渡,系统在所有长度尺度上的行为取决于有限的所谓关键指数。这一问题的许多现代方法中的一种是功能重新归一化组(FRG)[7-11],也称为精确的重新归一化组(RG)或
资料来源:Chloe Veltman,“新工具通过直接破坏系统帮助艺术家对抗人工智能”,NPR,2023.11.3.,https://www.npr.org/2023/11/03/1210208164/new-tools -help-artists-fight-ai-by-directly-disrupting-the-systems 图片来源:Cara @ Jingna Zhang, 2023年12月2日,https://cara.app/zemotion; kudurru主页,访问日期2023年12月5日,https://kudurru.ai/
摘要:深度学习模型已在多个领域得到应用,但在医学成像等敏感领域仍需要进行调整。由于时间限制,医学领域需要使用该技术,因此准确度水平可确保可信度。出于隐私方面的考虑,医学领域的机器学习应用无法使用医疗数据。例如,由于缺乏脑部 MRI 图像,使用基于图像的分类很难对脑肿瘤进行分类。通过应用基于生成对抗网络 (GAN) 的增强技术,解决了这一挑战。深度卷积 GAN (DCGAN) 和 Vanilla GAN 是用于图像生成的 GAN 架构的两个示例。本文提出了一个使用 GAN 架构和深度学习模型生成和分类脑部 MRI 图像的框架,称为 BrainGAN。因此,本研究提出了一种自动检查生成的图像是否令人满意的方法。它使用三个模型:CNN、MobileNetV2 和 ResNet152V2。使用 Vanilla GAN 和 DCGAN 生成的图像训练深度迁移模型,然后在由真实脑部 MRI 图像组成的测试集上评估其性能。从实验结果来看,ResNet152V2 模型的表现优于其他两个模型。ResNet152V2 基于 DCGAN 架构生成的脑部 MRI 图像实现了 99.09% 的准确率、99.12% 的精确率、99.08% 的召回率、99.51% 的曲线下面积 (AUC) 和 0.196 的损失。
摘要。阿尔茨海默病是一种无法治愈的慢性神经系统疾病 (NLD),会影响人类记忆力,并随着大脑区域的萎缩而丧失认知思维能力。早期发现阿尔茨海默病 (AD) 是延缓其影响的唯一希望。本研究设计了一种计算机辅助自动检测方法,可以从磁共振图像扫描中检测出 AD 的轻度认知障碍。数据驱动的解决方案需要大量带注释的图像才能进行诊断。然而,获取大量带注释的数据用于医疗应用是一项艰巨的任务。我们利用深度卷积生成对抗网络 (DCGAN) 来合成高质量图像以增加数据集大小。微调的 CNN(VGG16 架构)模型对图像进行处理,以提取直观的特征以进行早期诊断。VGG16 提取的图像特征输入到支持向量机进行分类。本研究进行了大量实验来验证所提出的方法在公共数据集上的表现优于相对基线。