近年来,量子图像处理在图像处理领域引起了广泛关注,因为它有机会将海量图像数据放入量子希尔伯特空间。希尔伯特空间或欧几里得空间具有无限维度,可以更快地定位和处理图像数据。此外,多种类型的研究表明,量子过程的计算时间比传统计算机更快。在量子域中编码和压缩图像仍然是一个具有挑战性的问题。从文献调查中,我们提出了一种 DCT-EFRQI(直接余弦变换量子图像的高效灵活表示)算法来有效地表示和压缩灰度图像,从而节省计算时间并最大限度地降低准备的复杂性。这项工作旨在使用 DCT(离散余弦变换)和 EFRQI(量子图像的高效灵活表示)方法在量子计算机中表示和压缩各种灰度图像大小。使用 Quirk 模拟工具设计相应的量子图像电路。由于量子比特数的限制,总共使用 16 个量子比特来表示灰度图像的系数及其位置。其中,8 个量子比特用于映射系数值,其余量子比特用于生成相应系数的 XY 坐标位置。理论分析和实验结果表明,与 DCT-GQIR、DWT-GQIR 和 DWT-EFRQI 相比,所提出的 DCT-EFRQI 方案在 PSNR(峰值信噪比)和比特率方面提供了更好的表示和压缩。
通过融合图像可以准确地对任何人体健康问题进行医学诊断。在图像融合中,数据从不同的图片组合在一起,使我们仅在一张图片中就能获得大量信息。图像融合在医学成像应用中起着重要作用,它可以帮助放射科医生在 CT 和 MR 脑图像中发现异常。多模态 (MM) 是融合技术之一。在 MM 中,会融合不同的模态,例如计算机断层扫描 (CT)、正电子发射断层扫描 (PET) 和磁共振成像 (MRI) 扫描。每种模态都有各种特征,具有各种类型的功能信息和互补的解剖结构。用于发现脑中风和肿瘤的常用扫描技术是 MRI 和 CT。在本文中,将同一患者的脑 MR 图像的不同切片:T1 加权 (T1)、T1 对比增强 (T1ce)、T2 加权 (T2) 和液体衰减反转恢复 (Flair) 融合在一起,以诊断脑病理和异常。使用离散小波变换 (DWT)、拉普拉斯金字塔变换技术和主成分分析 (PCA) 融合技术进行了多次实验。对具有更多信息内容的不同融合图像进行了比较分析。这里考虑的性能指标包括峰值信噪比、均方误差和信噪比。进行了不同的实验,使用不同的融合技术对脑部 MR 图像的 Flair 和 T2 切片进行融合,在 SNR 和 PSNR 方面取得了更好的结果。
通过雾进行成像在诸如自动驾驶汽车,增强驾驶,飞行飞机,直升机,无人机和火车等工具中具有重要的应用。在这里我们表明,从雾反射的光的时间填充具有分布(伽马),该分布与从雾(高斯)遮住的物体所反映的光中不同。这有助于区分背景光子与雾和信号光子从遮挡物体反射的信号光子之间。基于此观察结果,我们恢复了被密集,动态和异质雾阻塞的场景的反射和深度。对于实际用例,成像系统以最小的占地面积为单位的反射模式设计,并基于LiDAR硬件。特别是,我们使用单个光子雪崩二极管(SPAD)摄像机,该摄像头将计入单个检测到的光子。在没有先验知识的情况下,开发了一个概率计算框架,以估计雾化本身的雾性特性。其他解决方案是基于雷达的,该雷达遭受分辨率较差(由于长波长)的障碍,或者按时门控遭受较低的信噪比。建议的技术在雾室中产生的多种雾密度中进行了实验评估。它在可见度为37厘米时演示了离相机57厘米的恢复对象。在这种情况下,它以5厘米的分辨率恢复了深度,并且场景反映了PSNR和3的4DB的反射。4×SSIM的重建质量随时间推移门控技术。4×SSIM的重建质量随时间推移门控技术。
摘要:在人工智能的时代,卷积神经网络(CNN)正在成为一种用于图像处理的强大技术,例如去核,超分辨率甚至样式转移。他们表现出很大的潜力,可以将下一代相机和展示带入我们的日常生活。但是,传统的CNN加速器很难在边缘生成超高分辨率视频,因为它们的大量急速带宽和功耗。例如,用于降级的高级FFDNET可能需要131 GB/s的DRAM带宽,而在4K UHD 30FPS处则需要106个计算顶部。在这次演讲中,我将介绍我们最近的两部作品,以应对DRAM带宽和功耗的挑战。首先,我将讨论图像处理CNN带来的图像二线革命并阐述其设计挑战;为了清楚起见,他们与识别CNN的差异将得到强调。然后,我将以整体方式介绍我们的第一份作品 - ECNN [Micro'19],共同优化推理流,网络模型,指令集和处理器设计。尤其是,具有面向硬件的ERNET模型的基于块的推理流可以支持FFDNET级DINOISING和SRRESNET级超分辨率,在4K UHD 30 FPS下使用小于2 GB/s的DRAM带宽。最后,我将介绍我们的第二件作品(ISCA'21],它利用了Ring Argebra的常规稀疏度,以实现近乎最大的硬件节省和优雅的卷积发动机质量降解。布局结果表明,可以分别使用3.76 W和2.22 W进行等效的41个高位计算,分别以40 nm的技术为50%(无质量下降)和75%和75%(PSNR下降的0.11 dB)。
摘要 - 隐身是将秘密信息隐藏在其他媒体中的实践,例如图像,音频,视频和文本。在当今社会中,它变得越来越重要,作为实现私人和安全沟通的一种方式。该研究项目的重点是图像隐志技术,这些技术用于通过统计切解技术来逃避秘密信息的检测。这项研究的目的是比较和评估不同的图像隐志方法,研究其实施复杂性,并提出一个框架以改善当前方法。这项研究将比较不同的地理技术在避免通过stemansysis检测中的效率,并可能导致未来更好的隐身技术的发展。本文重点介绍了空间域中的三种密集志方法:最小显着的位(LSB),像素值差异(PVD)和基于边缘的数据嵌入(EBE)方法。使用这三种方法进行了一个简单的实验来对几个图像进行加密,并研究了使用均方误差(MSE)和峰值噪声比(PSNR)的LSB的失真度量。尽管在实验中认为LSB方法可以接受失真度量结果,但所有方法都会导致文件容量显着差异。这表明需要进一步增强加密的安全性,以便不会轻易发现秘密消息。因此,在本文中,我们在使用PVD加密之前,使用Morse Code,基础64,SHA-245和高级加密标准(AES)提出了一种概念化的增强。关键字 - 隐肌,切解分析,空间域,基于边缘的数据嵌入。
摘要:脑瘤是年轻人死亡的第二大原因。脑瘤的形状和大小多种多样。良性脑瘤与癌性脑瘤并存。在医学图像处理中,检测和分割脑瘤极其困难。这里使用了四种预处理形式:自适应中值滤波器 (AMF)、中值滤波器、高斯滤波器和维纳滤波器。然后使用以下内容确定性能指标 1. 均方误差率 (MSE) 是系统准确度的度量。2. 峰值信噪比 (PSNR) 3. 结构相似性指数 4. 第四个是 Spearman 等级相关。根据上述测量结果,自适应中值滤波器对常规和异常图像均能产生最佳效果。关键词:脑瘤、滤波器和效率测量 1. 简介脑瘤被描述为脑内细胞外物质的不规则生长和异常。肿瘤是细胞不受控制地生长的结果。根据肿瘤的起源(转移性),可将肿瘤分为原发性肿瘤或继发性肿瘤。脑肿瘤的侵袭性很难评估。扩散到大脑的癌细胞开始在身体的每个部位扩散。例如,乳腺癌或肺癌细胞通常通过血流传播到大脑。扩散到身体其他部位的脑肿瘤通常是癌性的。良性肿瘤生长缓慢,不像恶性肿瘤那么危险。它很少扩散,边界清晰。手术是治疗这种疾病最有效的方法,尽管危险性较低。恶性肿瘤的生长速度不可控制,而且很快。这是一种危及生命的情况,需要立即就医。肿瘤的诊断基于肿瘤细胞的形态,以及某些肿瘤细胞特征,如发展速度、外观、肿瘤中间的死亡肿瘤细胞、血液供应和侵袭潜力。世界卫生组织将肿瘤分为四类
Kush Vora Ninad Mehendale *计算机工程系电子系K.J Somaiya工程学院K.J.Somaiya工程学院孟买,印度孟买,印度kush.v@somaiya.edu ninad@somaiya.edu摘要 - 脑肿瘤是死亡的主要原因之一,因此,尽早诊断它们至关重要。 MRI是检测肿瘤的最有效诊断工具。 但是,热噪声,温度波动和其他伪影可能会产生嘈杂的MRI扫描,从而导致诊断不准确。 深度学习算法与图像处理技术结合使用,已在各种医学成像任务中有助于增强MRI图像。 我们的工作提出了一个带有两个编码器码头对的U-NET体系结构,用于降解MRI扫描,该扫描在通过注入合成高斯噪声生成的数据集上进行了细微的调整。 该模型将峰信号与噪声比(PSNR)从11.90提高到30.96。 提出的工作还提供了经验证据,表明拟议的deoising策略可将脑肿瘤的预测准确性提高近23%。 使用U-NET开发的去核技术将使放射科医生和计算机辅助诊断系统(CAD)在精确诊断疾病中通过产生清洁剂和更清晰的MRI扫描来使其受益。 关键字 - 图像增强,脱氧,U-NET,脑肿瘤,高斯噪声I. i ntroduction a脑肿瘤是一团异常的脑细胞。 封闭人脑的头骨非常坚硬,因此在这个紧密区域内的任何发展都会导致重大并发症。 随着这些肿瘤的生长,头骨内部的压力会增加,从而导致脑损伤。Somaiya工程学院孟买,印度孟买,印度kush.v@somaiya.edu ninad@somaiya.edu摘要 - 脑肿瘤是死亡的主要原因之一,因此,尽早诊断它们至关重要。MRI是检测肿瘤的最有效诊断工具。但是,热噪声,温度波动和其他伪影可能会产生嘈杂的MRI扫描,从而导致诊断不准确。深度学习算法与图像处理技术结合使用,已在各种医学成像任务中有助于增强MRI图像。我们的工作提出了一个带有两个编码器码头对的U-NET体系结构,用于降解MRI扫描,该扫描在通过注入合成高斯噪声生成的数据集上进行了细微的调整。该模型将峰信号与噪声比(PSNR)从11.90提高到30.96。提出的工作还提供了经验证据,表明拟议的deoising策略可将脑肿瘤的预测准确性提高近23%。使用U-NET开发的去核技术将使放射科医生和计算机辅助诊断系统(CAD)在精确诊断疾病中通过产生清洁剂和更清晰的MRI扫描来使其受益。关键字 - 图像增强,脱氧,U-NET,脑肿瘤,高斯噪声I. i ntroduction a脑肿瘤是一团异常的脑细胞。封闭人脑的头骨非常坚硬,因此在这个紧密区域内的任何发展都会导致重大并发症。随着这些肿瘤的生长,头骨内部的压力会增加,从而导致脑损伤。脑肿瘤分为两种不同类型。恶性(癌)和良性(非癌症)。这些肿瘤进一步分为原发性和继发性肿瘤(转移性肿瘤)。原发性脑肿瘤起源于大脑内部,但是当癌细胞从其他器官传播到大脑(肺部到大脑)时,转移性脑肿瘤就会发展。绝大多数原发性脑肿瘤都不癌。死亡率的第十个主要原因是脑肿瘤。在2020年,全球估计,有251,329人死于原发性恶性脑和中枢神经系统(CNS)肿瘤。今天在美国,估计有70万人受到原发性脑肿瘤的影响。这些肿瘤可能是致命的,并对生活质量产生重大影响。女性比男性更有可能获得任何类型的大脑或脊髓肿瘤,而男性则更有可能患上恶性肿瘤。这主要是因为某些类型的肿瘤在一种性别或另一种性别中更为普遍(例如,脑膜瘤在女性中更为常见)。患有恶性大脑或中枢神经系统肿瘤患者的5年生存率
多级阈值处理是计算机视觉中的一个重要操作,计算机视觉是人工智能 (AI) 的一个子领域,用于理解和解释现实世界中的数据。现有的基于图像直方图的多级阈值熵方法主要处理除碎片边界之外的熵信息的最大化,这降低了准确性。这些问题导致阈值精度差且速度慢。为了解决这个问题,我们提出了一种基于相互依赖性的新技术,该技术使用碎片边界,这是一个最小化问题。研究了一个第一手目标函数,它处理碎片边界。传统的多级阈值技术由于穷举搜索过程而计算成本高昂,另一种方法是使用基于自然启发算法的进化计算。本文还提出了一种用于多级阈值的新优化器,称为自适应平衡优化器 (AEO),它是对基本平衡优化器 (EO) 的改进,通过为表现不佳的搜索代理实施自适应分散决策。使用标准基准函数将 AEO 性能与最先进的算法——平衡优化器 (EO)、灰狼优化器 (GWO)、鲸鱼优化算法 (WOA)、松鼠搜索算法 (SSA) 和风驱动优化 (WDO) 算法进行了比较。基于定性和定量分析,AEO 的表现优于 EO、GWO、WOA、SSA 和 WDO。通过使用 AEO 最小化目标函数来获得最佳阈值。对于实验,考虑了 BSDS 500 数据集的 500 张图像。考虑了峰值信噪比 (PSNR)、结构相似性指数 (SSIM) 和特征相似性指数 (FSIM) 等流行指标进行定量分析。在计算复杂度降低的同时,阈值精度存在显著差异。强调了本文的优点,以确保其未来在使用软计算(AI 的一个子领域)的工程应用领域中的应用。
摘要 小型数据集通常会影响医学成像研究中深度神经网络 (DNN) 的泛化、稳健性和整体性能。由于收集大型临床数据库始终很困难,我们提出了一种生成大型真实/多样化数据集的分析方法。临床脑部 PET/CT/MR 图像包括全剂量 (FD)、低剂量 (LD)(仅对应于 FD 扫描中获取的事件的 5%)、非衰减校正 (NAC) 和基于 CT 测量的衰减校正 (MAC) PET 图像、CT 图像以及 35 名患者的 T1 和 T2 MR 序列。所有图像均已注册到蒙特利尔神经研究所 (MNI) 模板。使用拉普拉斯混合,利用来自两个不同患者的图像的频域信息以及混合蒙版进行自然呈现。这种来自计算机视觉和图像处理社区的经典技术仍然被广泛使用,并且与现代 DNN 不同,它不需要训练数据。实施了改进的 ResNet DNN 来评估四个图像到图像的转换任务,包括 LD 到 FD、LD+MR 到 FD、NAC 到 MAC 和 MRI 到 CT,使用和不使用合成图像。使用已建立的指标进行定量分析,包括峰值信噪比 (PSNR)、结构相似性指数度量 (SSIM) 和联合直方图分析,以进行定量评估。包含 35 名患者的注册小数据集与包含 350 个合成数据集加 35 个真实数据集的大数据集之间的定量比较显示,LD 到 FD 的 RMSE 和 SSIM 分别提高了 29% 和 8%,LD+MRI 到 FD 的 RMSE 和 SSIM 提高了 40% 和 7%,NAC 到 MAC 的 16% 和 8%,MRI 到 CT 映射任务的 24% 和 11%。定性/定量分析表明,与参考图像相比,所提出的模型通过生成更高质量、更低定量偏差和方差的图像,提高了所有四个 DNN 模型的性能。
colorfront IBC 2024…从斯德哥尔摩‽…再加上阿姆斯特丹IBC 2024的其他开创性的工作流新闻,阿姆斯特丹 - colorfront(colorfront.com) - 高级性能迪尔(Colorfront.com)的高级授予高性能Dailies/transcoding/thracking Systems的多名授予的开发商强大的流和掌握解决方案。这些演示文稿将通过“现场流”的“现场流” SDR/HDR素材来强调Colorfront的系统的特殊功能,质量和安全性,由Colorfront Transkoder in-in-th-cloud处理,数量嘎嘎作响,将在瑞典(Stockholm,sweden of Sweden)进行实时的宽敞宽带,在实时的范围内进行大约900英里的范围。在IBC 2024期间,该公司还将在其完整的产品组合和基于云的运营中推出新的进步,其中许多由AI提供动力,这将使电影院和电视上的最终体验变得更好。Colorfront Mastering & QC Mastering operations are further enhanced in Transkoder: Colorfront continues to make giant strides in the advancement of cinema/TV mastering and QC mastering with Transkoder, and has opened a new chapter in SDR/HDR color workflows with a multitude of color remapping tools for SDR to Dolby Vision, DCI to Dolby Vision and HDR Cinema, amongst others.以及用于调整HDR滚动和纠正HLG内容的工具,Transkoder的自动字幕检测工具通过使用户能够独立于背景图像检测和调整字幕的亮度来支持增强的生产力,以获得最佳的HDR主人。DCP验证报告现在也以PDF的形式格式化。全新,AI辅助,滚动信用检测功能还提供了提高的效率,其能力可以提取滚动信用的文本内容,从而使用户可以换下更新信用额度的耗时任务。Transkoder还提供了其他自动化工具来检测,过滤和分类,例如不正确/移动架子,黑色边缘像素,死像素,火花/数字灰尘,以及黑色和重复的框架。可操作性改进包含显着增强的时间轴标记功能,以加速QC工作流程,可容纳许多类型的QC标签和对象标签,而新的PSNR和DeltaiCTCP视频比较工具生成时间轴标记,以指示版本之间可见的差异或重新编码的交付物之间的可见差异。QC任务的其他时间轴功能包括视频文件比较,提供参考视频输出的拆分视图,以及将拖放媒体直接拖放到时间轴上的能力。品牌 - 新的综合媒体报告PDF包括手动播放的并自动检测到的问题,每个问题都有屏幕截图设施。