用于磁共振成像 (MRI) 的单图像超分辨率 (SISR) 重建引起了人们的极大兴趣,因为它不仅可以加快成像速度,还可以改善可用图像数据的定量处理和分析。生成对抗网络 (GAN) 已被证明在图像恢复任务中表现良好。在这项工作中,我们遵循 GAN 框架并开发了一个与鉴别器相结合的生成器来解决 T1 脑 MRI 图像上的 3D SISR 任务。我们开发了一种新颖的 3D 内存高效的残差密集块生成器 (MRDG),其在 SSIM(结构相似性)、PSNR(峰值信噪比)和 NRMSE(归一化均方根误差)指标方面实现了最先进的性能。我们还设计了一个金字塔池化鉴别器 (PPD) 来同时恢复不同尺寸尺度上的细节。最后,我们引入了模型混合,这是一种简单且计算效率高的方法,可以平衡图像和纹理
摘要。结构化照明显微镜(SIM)是一种已建立的光学超级分辨率成像技术。但是,基于广场图像采集的常规SIM通常仅限于可视化薄细胞样品。我们提出,将一维图像恢复和结构化照明组合在正交方向上,以实现超分辨率,而无需旋转照明模式。因此,图像采集速度提高了三倍,这也有益于最大程度地减少光漂白和光毒性。通过在系统中包括共聚焦缝隙来显着抑制聚焦背景和相关噪声,从而增强了厚厚的生物组织中的光学切片。随着所有技术改进,我们的方法捕获了小鼠脑组织样品中神经元结构的三维叠加图像堆栈的深度范围超过200μm。
生成的扩散事先从现成的扩散生成模型中捕获,最近引起了人们的极大兴趣。但是,已经尝试了几次尝试将扩散模型采用到嘈杂的反问题上,要么无法获得令人满意的结果,要么需要数千个迭代才能实现高质量的重建。在这项工作中,我们提出了一个基于误差和误差校正(DIFFECC)方法的基于扩散的图像恢复。两种策略在后采样过程中收缩恢复误差。首先,我们将现有的基于CNN的方法与扩散模型相结合,以确保从一开始就确定数据的稳定性。第二,为了扩大噪声的误差收缩效应,设计了重新启动采样算法。在误差校正策略中,估计校正想法是在数据项和先前项上提出的。在扩散采样框架内迭代迭代会导致出色的图像生成结果。表明,与基于最先进的采样的分散模型相比,我们的方法可以重建高质量的图像。
•Dipartimento di Elettronica e Informazione E Bioingegneria(Deib - 计算机科学)的副教授,自2019年9月以来,Politecnico di Milano; •图像分析 /处理领域的20年学术研究经验。许多工业研究项目的领导者成像和变化/异常检测。•我的研究兴趣包括用于图像处理和机器学习的数学和统计方法,尤其是图像恢复和分析,变化/异常检测和学习非组织环境的方法。•出版物:经过同行评审的国际期刊的31篇论文(在Scimago中排名第2 Q1)4本书章节,70会议(12个排名a ++的笑容)和11篇研讨会论文。H-INDEX:28(3534 CIT。 在Google Scholar,2024年7月)。 学术年龄:17y。 •担任首席研究员的主要项目:H-INDEX:28(3534 CIT。在Google Scholar,2024年7月)。学术年龄:17y。•担任首席研究员的主要项目:
摘要。生成人工智能(AIGC)是人工智能的关键子集,它在多个领域(例如图像,音频和文本)中表现出非凡的数据生成和创建功能。本文旨在探讨AIGC在电影制作领域的应用,并特别强调了深卷积生成的对抗网络(DCGANS)的作用,并引入了直观的教学方法。通过实施DCGAN技术,这项研究实现了各种功能,包括生成虚拟角色,场景,样式转换,动态图像恢复和增强功能,从而增强了电影生产过程。视觉教学系统通过直观的界面和交互式操作来促进这些尖端技术的快速掌握。我们的研究表明,DCGAN在制作电影品质图像时表现出非凡的准确性和效率。此外,用户反馈确认了我们的视觉学习平台的卓越和优势。这项调查强调了AIGC在膜视觉生产中的巨大潜力,同时还通过基于视觉的学习来促进相关技术的传播和增强。技术和教育的这种开创性融合将培养新一代创新的电影制片人。
摘要本文通过使用基于学习的方法从有限数量的观点中解决了层析成像重建的挑战。通过使用高斯denoing算法的能力来处理复杂的优化任务,通过插入式游戏(PNP)算法的最新进步(PNP)算法显示了求解成像逆概率的希望。传统的denoising手工制作的方法产生具有可预测特征的图像,但需要复杂的参数调整并遭受缓慢的结合。相比之下,基于学习的模型可提供更快的性能和更高的重建质量,尽管它们缺乏解释性。在这项工作中,我们提出培训近端神经网络(PNN),以消除任意伪像并改善PNP算法的性能。这些网络是通过展开旨在找到最大后验(MAP)估计值的近端算法获得的,但使用学习的线性运算符在固定数量的迭代范围内获得。pnns提供了灵活性,可以通过近端算法来适应任何图像恢复任务。此外,与传统的神经网络相比,它们具有更简单的体系结构。
扩散模型的出现代表了生成建模,表现出非凡的能力,可以从文本输入中产生高保真图像。与此同时,图像恢复(IR),包括超分辨率,脱毛,去核,涂料和压缩,仍然是低级视力研究中的重要领域。最近,将扩散模型集成到IR任务中的趋势越来越大,产生的结果超过了以前的方法。尽管如此,扩散模型在IR中的应用提出了自己的一系列挑战,包括模型设计中的复杂性以及有关操作效率的关注点。该项目从Wang等人的“实用扩散的先验扩散”(StablesR)中汲取了灵感。[2023],它巧妙地采用了预训练的文本对图像扩散模型的生成能力来增强盲目的超级分辨率(SR)任务。Stables的框架如图1所示。这项研究展示了与未修饰的稳定扩散Rombach等人进行微调的时间感知编码器。[2022]模型,可导致重大的恢复改进,同时保持原始的生成框架并减少培训费用。在这个项目中,我们旨在扩大跨各种IR任务中Stables的应用,并调查更轻巧的解决方案的潜力。
摘要。虽然近红外(NIR)成像对于辅助驾驶和安全监控系统至关重要,但其单色性质会阻碍其更广泛的应用,这促使其开发了NIR到可见的翻译任务。但是,现有翻译的性能受到NIR和可见的想象之间被忽视的差异以及缺乏配对训练数据的限制。为了应对这些挑战,我们提出了一个新颖的对象感知到可见的翻译框架。我们的方法将可见的图像恢复分解为对象独立的亮度源和特定于对象的反射组件,从而在各种照明条件下分别处理它们以弥合NIR和可见成像之间的间隙。利用先前的细分知识增强了我们的模型识别和理解分离对象反射的能力。我们还收集了完全对齐的NIR可见图像数据集,这是一个大规模数据集,其中包括完全匹配的NIR对以及使用多传感器同轴摄像头捕获的可见图像。em-pirical评估证明了我们的方法优于现有方法,从而在主流数据集上产生了令人信服的结果。代码可访问:https://github.com/yiiclass/sherry。
摘要。深度神经网络(DNN)越来越多地在应用科学的各种领域中使用,尤其是在计算机视觉和图像处理等领域,它们可以增强仪器的性能。各种高级相干成像技术,包括数字全息图,利用卷积神经网络(CNN)或视觉变压器(VIT)等不同的深层体系结构。这些体系结构能够提取不同的指标,例如自动关联重建距离或3D位置确定,促进自动显微镜和相位图像恢复中的应用。在这项工作中,我们提出了一种使用Gedankennet模型的改编版本的混合方法,并与UNET样模型相结合,目的是访问Micro-Objects 3D姿势测量。这些网络在模拟全息数据集上进行了培训。我们的方法在推断3D姿势时达到了98%的精度。我们表明,Gedankennet可以用作回归工具,并且比微小的(TVIT)模型更快。总体而言,将深层神经网络整合到数字全息显微镜中和3D计算机微视频中,有望显着提高全息图的稳健性和处理速度,以精确的3D位置推理和控制,尤其是在微型机器人应用中。
近年来,仿制药的重新识别已取得了显着改善,但这些方法的设计是在人们可以使用的整个身体的假设下设计的。当由现实世界应用中的各种障碍物引起的遮挡时,这种假设会带来明显的表现降解。为了解决这个问题,已经出现了数据驱动的策略,以增强模型的遮挡性稳健性。在随机擦除范式之后,这些策略通常采用随机生成的噪声来取代随机选择的图像恢复以模拟障碍物。但是,随机策略对位置和内容不敏感,这意味着它们不能在应用程序方案中模仿现实世界的遮挡案例。为了克服此限制并充分利用数据集中的真实场景信息,本文提出了一种更直观,更有效的数据驱动策略,称为显着性贴片传输(SPT)。与视觉变压器结合使用,SPT使用显着贴片选择了人员实例和背景障碍。通过将人实例转移到不同的背景障碍物中,SPT可以轻松生成光真实的遮挡样品。此外,我们提出了一个与联合(OIOU)进行遮挡意识到的交叉点,以筛选面罩,以过滤更合适的组合和类临时策略,以实现更稳定的处理。对封闭和整体人士重新识别基准进行的广泛的实验评估表明,SPT在遮挡的REID上提供了基于VIT的REID算法的显着性能增长。