近年来,检测变形人脸图像的任务变得非常重要,以确保基于人脸图像的自动验证系统(例如自动边境控制门)的安全性。基于深度神经网络 (DNN) 的检测方法已被证明非常适合此目的。然而,它们在决策过程中并不透明,而且不清楚它们如何区分真实人脸图像和变形人脸图像。这对于旨在协助人类操作员的系统尤其重要,因为人类操作员应该能够理解其中的推理。在本文中,我们解决了这个问题,并提出了聚焦分层相关性传播 (FLRP)。该框架在精确的像素级别向人类检查员解释深度神经网络使用哪些图像区域来区分真实人脸图像和变形人脸图像。此外,我们提出了另一个框架来客观地分析我们方法的质量,并将 FLRP 与其他 DNN 可解释性方法进行比较。该评估框架基于移除检测到的伪影并分析这些变化对 DNN 决策的影响。特别是,如果 DNN 的决策不确定甚至不正确,与其他方法相比,FLRP 在突出显示可见伪影方面表现得更好。
可变形图像配准是医学图像分析的基本步骤。最近,Transformer 已用于配准,其表现优于卷积神经网络 (CNN)。Transformer 可以捕获图像特征之间的长距离依赖性,这已被证明对配准有益。然而,由于自注意力的计算/内存负载高,Transformer 通常用于下采样特征分辨率,无法捕获全图像分辨率下的细粒度长距离依赖性。这限制了可变形配准,因为它需要每个图像像素之间精确的密集对应关系。没有自注意力的多层感知器 (MLP) 在计算/内存使用方面效率高,从而可以捕获全分辨率下的细粒度长距离依赖性。然而,MLP 尚未在图像配准中得到广泛探索,并且缺乏对医学配准任务至关重要的归纳偏差的考虑。在本研究中,我们提出了第一个基于相关感知 MLP 的配准网络 (CorrMLP) 用于可变形医学图像配准。我们的 CorrMLP 在新颖的粗到细配准架构中引入了关联感知多窗口 MLP 块,该架构可捕获细粒度多范围依赖性以执行关联感知粗到细配准。对七个公共医疗数据集进行的大量实验表明,我们的 CorrMLP 优于最先进的可变形配准方法。
1 四川大学华西第二医院放射科,妇女儿童出生缺陷与相关疾病教育部重点实验室,成都,2 四川大学华西医学院,华西医院,成都,3 四川大学华西第二医院超声科,妇女儿童出生缺陷与相关疾病教育部重点实验室,成都,4 四川大学华西医院心内科,心血管病研究所心脏结构与功能实验室,心脏结构与功能四川省重点实验室,成都,5 电子科技大学医学院四川省肿瘤医院暨研究所放射科,成都,6 四川大学华西第二医院妇产科,妇女儿童出生缺陷与相关疾病教育部重点实验室,成都
随着人脸识别系统 (FRS) 的部署,人们开始担心这些系统容易受到各种攻击,包括变形攻击。变形人脸攻击涉及两张不同的人脸图像,以便通过变形过程获得一个与两个贡献数据主体足够相似的最终攻击图像。可以通过视觉(由人类专家)和商业 FRS 成功验证所获得的变形图像与两个主体的相似性。除非此类攻击能够被检测到并减轻,否则人脸变形攻击会对电子护照签发流程和边境管制等应用构成严重的安全风险。在这项工作中,我们提出了一种新方法,使用新设计的去噪框架来可靠地检测变形人脸攻击。为此,我们设计并引入了一种新的深度多尺度上下文聚合网络 (MS-CAN) 来获取去噪图像,然后将其用于确定图像是否变形。在三个不同的变形人脸图像数据集上进行了广泛的实验。还使用 ISO-IEC 30107-3 评估指标对所提出方法的变形攻击检测 (MAD) 性能进行了基准测试,并与 14 种不同的最新技术进行了比较。根据获得的定量结果,所提出的方法在所有三个数据集以及跨数据集实验中都表现出最佳性能。
与基于卷积神经网络(CNN)相比,我们研究了基于变压器的行人检测模型较低性能的原因。CNN模型会产生密集的行人建议,单独完善每个建议,然后对其进行非最大抑制(NMS)的跟进,以产生稀疏的预测。在争论中,变压器模型每个地面真相(GT)行人盒选择一个建议,然后从中选择了正面的正态。所有其他建议,其中许多与选定的建议高度相似,都通过了负梯度。尽管这导致了稀疏的预测,从而消除了NM的需求,但在许多类似的建议中,任意选择,有效的训练和较低的行人检测准确性。为了减轻问题,我们建议基于Min-Cost-Flow的配方,而不是常用的Kuhn-Munkres匹配算法,并纳入了诸如每个地面真相盒的约束,并且与一个建议的提案相匹配,并且许多同样好的建议可以与单个地面真相盒相匹配。我们提出了基于匹配算法的第一个基于变压器的行人检测模型。广泛的实验表明,我们的方法达到了3个失误率(较低)3。7 /17。4 /21。8/8。3/2。0在Eurocity / tju-traffic / tju-校园 /城市专家 /加州理工学院数据集中,而4个。7/18。7/24。8/8。5/3。 1通过当前的sota。 代码可从https://ajayshastry08.github.io/flow_ matcher 获得。5/3。1通过当前的sota。代码可从https://ajayshastry08.github.io/flow_ matcher
我们开发了一个用于构建可变形模板的学习框架,该模板在许多图像分析和计算解剖学任务中起着基础性作用。用于模板创建和图像与模板对齐的传统方法经历了数十年的丰富技术发展。在这些框架中,模板是使用模板估计和对齐的迭代过程构建的,这通常在计算上非常昂贵。部分由于这一缺点,大多数方法为整个图像群体计算单个模板,或为数据的特定子组计算几个模板。在这项工作中,我们提出了一个概率模型和有效的学习策略,该模型和有效的学习策略可以产生通用或条件模板,并与一个神经网络联合使用,该神经网络可以有效地将图像与这些模板对齐。我们展示了该方法在各种领域的实用性,特别关注神经成像。这对于不存在预先存在的模板的临床应用特别有用,或者使用传统方法创建新模板的成本可能过高。我们的代码和地图集可作为 VoxelMorph 库的一部分在线获取,网址为 http://voxelmorph.csail.mit.edu 。
人类的视野比在分布外情景下表现出的鲁棒性更高。它已经通过逐个合成的分析来猜想这种鲁棒性益处。我们的论文通过通过渲染和能力算法在神经特征上进行近似分析,以一致的方式制定三重视觉任务。在这项工作中,我们引入了神经丝线可变形的网格(NTDM),该网格涉及具有变形几何形状的OBJECT模型,该模型允许对摄像机参数和对象几何形状进行优化。可变形的网格被参数化为神经场,并被全表面神经纹理图所覆盖,该图被训练以具有空间歧视性。在推断过程中,我们使用可区分渲染来最大程度地重建目标特征映射,从而提取测试图像的特征图,然后对模型的3D姿势和形状参数进行优化。我们表明,在现实世界图像,甚至在挑战分布外情景(例如闭塞和主要转变)上进行评估时,我们的分析比传统的神经网络更强大。在经常性能测试测试时,我们的算法与标准算法具有竞争力。
我们提出了一种新颖的神经可变形模型 (NDM),旨在从二维稀疏心脏磁共振 (CMR) 成像数据中重建和建模心脏的三维双心室形状。我们使用混合可变形超二次曲面对双心室形状进行建模,该超二次曲面由一组几何参数函数参数化,能够进行全局和局部变形。虽然全局几何参数函数和变形可以从视觉数据中捕捉到总体形状特征,但可以学习局部变形(参数化为神经微分同胚点流)来恢复详细的心脏形状。与传统可变形模型公式中使用的迭代优化方法不同,可以训练 NDM 来学习此类几何参数函数、来自形状分布流形的全局和局部变形。我们的 NDM 可以学习以任意尺度加密稀疏心脏点云并自动生成高质量的三角网格。它还可以隐式学习不同心脏形状实例之间的密集对应关系,以实现准确的心脏形状配准。此外,NDM 的参数直观,医生无需复杂的后处理即可使用。大型 CMR 数据集上的实验结果表明,NDM 的性能优于传统方法。
在本文中,我们提出了一种新型的可变形神经关节网络 (DNA-Net),这是一种基于无模板学习的方法,用于从单个 RGB-D 序列进行动态 3D 人体重建。我们提出的 DNA-Net 包括一个神经关节预测网络 (NAP-Net),它能够通过学习预测一组关节骨骼来跟随输入序列中人体的运动,从而表示人体的非刚性运动。此外,DNA-Net 还包括有符号距离场网络 (SDF-Net) 和外观网络 (Color-Net),它们利用强大的神经隐式函数来建模 3D 几何和外观。最后,为了避免像以前的相关工作那样依赖外部光流估计器来获得变形线索,我们提出了一种新的训练损失,即基于易到难几何的损失,这是一种简单的策略,它继承了倒角距离的优点来实现良好的变形引导,同时仍然避免了其对局部不匹配敏感性的限制。DNA-Net 以自监督的方式直接在输入序列上进行端到端训练,以获得输入对象的 3D 重建。DeepDeform 数据集视频上的定量结果表明,DNA-Net 的表现优于相关的最先进方法,并且有足够的差距,定性结果还证明我们的方法可以高保真度和细节重建人体形状。