摘要。扩散模型最初是为了产生图像的,最近引起了人们的关注,作为一种有希望的图像降级方法。在这项工作中,我们进行了全面的实验,以调查扩散模型所带来的挑战。在医学成像中,保留原始图像含量以及避免添加或删除潜在的病理细节至关重要。通过经验分析和讨论,我们在基于扩散的denoising背景下高出了图像感知与失真之间的权衡。,我们证明了标准扩散模型采样方案与一步denoising相比,PSNR的降低高达14%。此外,我们提供了视觉表明,表明扩散模型与随机采样相结合,具有在脱氧过程中产生合成结构的趋势,从而损害了被剥离图像的临床有效性。我们的彻底调查提出了有关扩散模型对医学图像denoising的适用性的疑问,强调了潜在的局限性,可以仔细考虑将来的应用。
在本文中,我们应对基于离线手写的对比损失 - 十个签名验证模型的白盒假阳性对抗性攻击的挑战。我们采用了一种新颖的攻击方法,该方法将攻击视为紧密复制但独特的写作风格之间的样式转移。为了指导欺骗性图像的产生,我们引入了两个新的损失函数,通过扰动原始样品和合成样品的嵌入向量之间的欧几里得距离来提高抗差成功率,同时通过降低生成图像和原始图像之间的差异来确保最小的扰动。我们的实验证明了我们的方法在白框攻击基于对比度损失的白框攻击中的最新性能,这是我们的实验所证明的。与其他白色盒子攻击方法相比,本文的主要内容包括一种新颖的假积极攻击方法,两种新的损失功能,手写样式的有效风格转移以及在白盒子假阳性攻击中的出色性能。
抽象的纹理分析用于非常广泛的场和应用,从纹理分类(例如,用于遥感)到分割(例如,在生物医学成像中),通过图像合成或模式识别(例如,用于图像inpainting)。对于这些图像处理过程中的每一个,首先,必须从原始图像中提取描述纹理属性的象征性特征。在过去的几十年中,已经提出了各种特征提取方法。每个人都有其优点和局限性:其中一些的性能不是通过翻译,旋转,affin和perspective变换来修改的;其他人的计算复杂性低;其他人再次容易实施;等等。本文对纹理特征提取方法进行了全面的调查。后者分为七个类:统计方法,结构方法,基于转换的方法,基于模型的方法,基于图形的方法,基于学习的方法和基于熵的方法。对于这七个类中的每种方法,我们介绍了概念,优势和缺点,并给出了应用程序的示例。这项调查使我们能够确定两类方法,特别是在将来值得关注的方法,因为它们的表现似乎很有趣,但是他们的详尽研究尚未进行。
数据可用性 图 1f、6e、i 和扩展数据图 2e 中呈现的细胞全图以及过滤的 SV 调用可在 doi: 10.5281/ zenodo.4533300 下获得。图 1c-e、4、6a-d、f、h 和扩展数据图 1b-f、h-j、2a-d、4、5c 和 6 的源数据随论文提供,包括扩展图 1c 中未处理的 Western blot。有助于图 1e、4、6c、h、扩展数据图 1d、2、5c 和 Look-Seq 实验(图 2、3、5、扩展数据图 3)分析的原始图像和视频因文件大小限制而未发布,但可根据合理要求提供。 CD34+ HSPC 衍生的 FISH 和 SKY 图像和分析(图 6d-g)由圣犹达细胞遗传学共享资源实验室生成,支持图 6d-g 中发现的衍生数据可应要求从通讯作者处获得。序列读取数据可在 Bioproject PRJNA676146 下的测序读取档案 (SRA) 中找到。
视觉变压器(VIT)在Handing高分辨率图像时的准确性卓越,但它面临着重要的空间冗余的挑战,从而增加了综合和记忆要求。为了解决这个问题,我们提出了本地化和焦点视觉变压器(LF- VIT)。该模型通过战略性地减少综合需求而不影响性能来运行。在本地化阶段,制定了降低的分辨率图像;如果确定的预测仍然难以捉摸,则触发我们的培养邻里全球阶级注意(NGCA)机制,根据初始发现有效识别和点亮阶级歧视区域。随后,在焦点阶段中,该指定的重新从原始图像使用以增强认可。唯一地,LF-VIT在两个阶段都采用一致的参数,以确保无缝的端到端优化。我们的经验测试肯定了LF-Vit的能力:它可以重新降低DEIT-S的拖鞋63%,并同意会增强吞吐量双重。该项目的代码位于https://github.com/edgeai1/lf-vit.git。
摘要尽管OOD每年造成数百万美元的经济和社会损失,但居住在发展中国家(例如巴西)的许多人由于其成本而无法访问Ood Alert System。为了解决这个问题,我们提出了一个廉价且强大的河流洪水检测系统,可以将其放在任何河流中,并在其床边处有一个地面。我们系统的新颖性是使用o的原始图像,无需预处理。因此,我们的方法可以使用城市环境中现有的监视摄像机进行部署。建议的系统通过使用深神经网络(DNNS)对河水刀片进行语义分割来测量河流水平。然后,它使用计算机视觉(CV)来估计水位。如果水位接近或高于危险阈值,则它会在没有人类干预的情况下自动发送警报。此外,我们的系统可以以3.32 cm的平均绝对误差(MAE)的平均绝对误差(MAE)成功测量河流的水位,这足以检测到何时何时过度OW。该系统也可靠地从不同的相机观点和照明条件来测量河流水位。我们展示了我们的方法的生存能力,并评估了原型的
摘要(150个单词)现代镜头设计能够解决> 10吉像素,而相机框架速率和高光谱成像的进步使Terapixel/S数据获取成为了真正的可能性。阻止这种高数据率系统的主要瓶颈是功耗和数据存储。在这项工作中,我们表明模拟光子编码器可以应对这一挑战,从而可以使用比数字电子设备低的功率来实现高速图像压缩。我们的方法依赖于硅 - 光子学前端来压缩原始图像数据,预言了能量密集型图像调理并减少数据存储要求。压缩方案使用被动无序的光子结构来对原始图像数据进行内核型随机投影,其功耗最少和低潜伏期。后端神经网络可以以超过90%的结构相似性重建原始图像。此方案有可能使用小于100 FJ/Pixel处理Terapixel/S数据流,从而为超高分辨率数据和图像采集系统提供了途径。
将实时计算机视觉AI应用于现有和新的外围安全系统,为在所有环境和照明条件下都提供了一系列令人信服的好处,以改善关键设施及其人员的安全性,安全性和运营。这些包括改进的威胁检测和简化安全流程,并改善了服务响应时间和准确性,同时降低了视频基础架构的总拥有成本(包括照明)。分析传感器的图像和视频提要通常会受到操作复杂性的阻碍,包括无法解释视频和图像并不完美的现实世界中的,不受约束的环境。就像人类一样,甚至最高质量的相机和传感器都看不到夜晚,眩光,雾,雨,雪,污染和其他视觉障碍。和最常见的是,计算机视觉AI解决方案是针对原始图像和未遮挡对象进行培训的。设施运营商还面临着关键系统的高生命周期更换成本,通常选择升级相机以提高操作效率。Prohawk AI可以实时提高其运营实用性,可以延长现有投资的有用寿命。此外,使用Prohawk Vision软件可以减少对昂贵且环境破坏性的视觉照明系统的需求,这在需要符合黑空的解决方案的领域尤其有问题。
摘要:在本文中,我们提出了一种使用生成对抗网络(GAN)生成合成脑图像的方法。在医学图像分析中,产生与原始图像完全不同的现实医学图像仍然是一项艰巨而重要的任务,而临床图像数据的交换也是实施诊断支持系统的关键问题。尽管如此,研究人员很难获得医疗图像数据,因为图像包含个人信息。最近建议的GAN模型可以学习如何在不看到实际图像数据的情况下分发训练图像,而生成的图像可以完全匿名化的个人信息。所产生的图像可用作训练图像,以分类医学图像,从而可促进医学图像分析。我们的论文中已经实施了图像生成的方法,而不是收集大量MRI数据。我们利用了一种渐进式生长GAN(PGGAN),这是一种新生儿大脑图像生成方法,可用于大脑MRI分类和ADHD预测任务。PGGAN在训练阶段添加新层,慢慢地发现了MRI图像中ADHD的特征。我们的图像生成方法表明,它可以产生大脑MR图像,以避免人造伪影并具有目标症状的临床特征。
视觉变压器(VIT)在全球建模中脱颖而出,但由于其注意力机制的二次计算复杂性,在资源受限设备上面临部署挑战。为了解决这个问题,我们提出了语义意识的聚类视觉变压器(SAC-VIT),这是一种非著作范围,以提高VIT的计算效率。SAC-VIT分为两个阶段:早期出口(EE)和语义意识聚类(SAC)。在EE阶段,处理下采样的输入信息以提取全局语义信息并生成初始推理结果。如果这些结果不符合EE终止标准,则将这些信息聚集到目标和非目标令牌中。在SAC阶段,目标令牌被映射回原始图像,裁剪和嵌入。然后将这些目标令牌与从EE阶段重复使用的非目标令牌结合使用,并在每个集群中应用注意力机制。具有端到端优化的两阶段设计,可降低空间冗余,并实现计算效率,从而显着提高所有VIT性能。广泛的实验证明了SAC-VIT的功效,减少了DEIT的62%,并实现了1.98倍的吞吐量,而无需损害。