显着对象检测(SOD)旨在识别引起人类注意力的图像中最重要的区域。这些地区通常包括汽车,狗和人等物体。在图1中,在视觉上表示显着的对象检测后的输入和输出图像。它旨在模仿人类的关注,以关注现场的引人注目。识别图像中的显着区域可以促进后续的高级视觉任务,提高效率和资源管理并提高绩效(Gupta等,2020)。因此,SOD可以帮助过滤不相关的背景,并且草皮在计算机视觉应用中起着重要的预处理作用,为这些应用提供了重要的基本处理,例如细分(Donoser等,2009; Qin等,2014; noh et al。 Borji和Itti,2019年; Akila等人,2021年,2021年;现有的SOD方法可以大致分为两个类:1)常规方法; 2)基于深度学习的方法,如图2所示。传统方法利用低级特征和一些启发式方法来检测包含基于局部对比的基于扩散的贝叶斯方法,先验和经典监督的显着对象。此外,基于深度学习的方法可以帮助提取全面的深层语义特征以提高性能。可以进一步分类为完全监督的学习(Wang等,2015a; Lee等,2016a; Kim and Pavlovic,2016; He et al。,2017a; Hou等,2017; Shelhamer等,2017; Shelhamer et al。,2017; Su等,2019; Su等人,2019年)和弱监督的学习(Zhao Al Al Al Al Al。 Al。,2018年,2018年; Zhang等人,2020a;本文将根据两个
弱监督的时间动作本地化旨在通过仅将视频级标签作为监督来定位行动区域并同时确定未修剪视频中的动作类别。伪标签生成是解决具有挑战性的问题的一种承诺策略,但是熟悉的方法忽略了视频的自然时间结构,可以提供丰富的信息来协助这种常规过程。在本文中,我们通过推断出明显的摘要 - 特征提出了一种新型弱监督的时间动作定位方法。首先,我们设计了一个显着推理模块,该模块利用了临时邻居片段之间的变化关系以发现显着的摘要功能,这可以反映视频中的显着动态变化。其次,我们引入了一个边界改进模块,该模块通过信息介绍单元增强了显着的摘要功能。然后,引入了一个歧视增强模块,以增强摘要特征的歧视性质。最后,我们采用精致的摘要功能来制定高保真伪标签,可用于进行动作本地化网络的培训。对两个公开数据集进行的实验实验,即,Thumos14和ActivityNet V1.3,与最先进的方法相比,我们所提出的方法取得了重大改进。我们的源代码可在https://github.com/wuli555555/issf上找到。
近年来,仿制药的重新识别已取得了显着改善,但这些方法的设计是在人们可以使用的整个身体的假设下设计的。当由现实世界应用中的各种障碍物引起的遮挡时,这种假设会带来明显的表现降解。为了解决这个问题,已经出现了数据驱动的策略,以增强模型的遮挡性稳健性。在随机擦除范式之后,这些策略通常采用随机生成的噪声来取代随机选择的图像恢复以模拟障碍物。但是,随机策略对位置和内容不敏感,这意味着它们不能在应用程序方案中模仿现实世界的遮挡案例。为了克服此限制并充分利用数据集中的真实场景信息,本文提出了一种更直观,更有效的数据驱动策略,称为显着性贴片传输(SPT)。与视觉变压器结合使用,SPT使用显着贴片选择了人员实例和背景障碍。通过将人实例转移到不同的背景障碍物中,SPT可以轻松生成光真实的遮挡样品。此外,我们提出了一个与联合(OIOU)进行遮挡意识到的交叉点,以筛选面罩,以过滤更合适的组合和类临时策略,以实现更稳定的处理。对封闭和整体人士重新识别基准进行的广泛的实验评估表明,SPT在遮挡的REID上提供了基于VIT的REID算法的显着性能增长。
摘要:近年来,医学图像分析在早期阶段检测疾病方面起着至关重要的作用。医疗图像迅速用于解决人类问题的各种应用。因此,需要复杂的医疗特征来开发诊断系统供医生提供更好的治疗。传统的异常检测方法遭受给定数据中异常区域的错误识别。视觉效果检测方法用于定位异常,以提高拟议工作的准确性。本研究探讨了视觉显着性图在阿尔茨海默氏病(AD)分类中的作用。自下而上的显着性对应于图像特征,而自上而下的显着性在磁共振成像(MRI)脑图像中使用域知识。提出的方法的新颖性在于使用椭圆形局部二进制模式描述符进行低级MRI表征。类似椭圆的拓扑有助于从不同方向获取特征信息。在不同方向上广泛定向特征覆盖了微模式。阿尔茨海默氏病阶段的大脑区域是从显着图中分类的。多内核学习(MKL)和简单而有效的MKL(SEMKL)用于从正常对照组中对阿尔茨海默氏病进行分类。所提出的方法使用了绿洲数据集,并将实验结果与八种最先进的方法进行了比较。提出的基于视觉显着性的异常检测在准确性,敏感性,特殊性和F量的方面产生可靠的结果。
突然的、令人意外的感觉事件会触发神经过程,从而迅速调整行为。为了研究这种现象的系统发生和机制,我们训练两只雄性恒河猴通过对等长操纵杆施加力量来将光标保持在视觉目标内。我们研究了令人意外的听觉刺激对施加的力量、头皮脑电图 (EEG) 活动和从背外侧前额叶皮质记录的局部场电位 (LFP) 的影响。听觉刺激引起 (1) 等长力的双相调制,短暂下降然后是纠正性的紧张性增加,和 (2) 由两个大的负波 - 正波 (N70 和 P130) 主导的 EEG 和 LFP 偏转。EEG 电位在头皮顶点对称且最大,非常类似于人类的“顶点电位”。 “皮层电位和力量紧密相关:P130 振幅预测了矫正力增加的幅度,特别是在从深层而非浅层皮层记录的 LFP 中。这些结果揭示了一种系统发育上保留的皮层运动机制,支持对突出的感觉事件做出反应的适应性行为。
在过去的几年中,深度卷积神经网络一直在验证和识别场景中推动面部识别(FR)技术的边界。尽管准确性很高,但他们经常因缺乏解释性而受到批评。对了解深面识别系统的决策过程的需求越来越不断增加。最近的研究调查了视觉显着性图作为一种解释,但在面部识别的背景下,它们通常缺乏讨论和分析。本文集中于可解释的面部验证任务,并想出了新的解释框架。首先,提供了基于显着的解释方法的定义,该方法的重点是深FR模型做出的决策。其次,提出了一种名为corrrise的新型模型不合时宜的方法来产生显着图,该图显示了任何给定的面部图像的相似区域和不同区域。然后,一种评估方法旨在衡量面部验证中一般视觉显着性解释方法的性能。最后,实质性的视觉和定量结果表明,与其他可解释的面部验证方法相比,提出的Corrrise方法具有有希望的结果。
数据增强现在是图像训练过程的重要组成部分,因为它可以有效地防止过度拟合并使模型对噪声数据集更加稳健。最近的混合增强策略已经取得了进展,可以生成可以丰富显着性信息的混合掩码,这是一种监督信号。然而,这些方法在优化混合掩码时会产生很大的计算负担。出于这个动机,我们提出了一种新颖的显着性感知混合方法GuidedMixup,旨在以较低的计算开销保留混合图像中的显着区域。我们开发了一种高效的配对算法,该算法致力于最小化配对图像的显着区域的冲突并在混合图像中实现丰富的显着性。此外,GuidedMixup通过平滑地插值两个配对图像来控制每个像素的混合率以更好地保留显着区域。在多个数据集上的实验表明,GuidedMixup 在分类数据集上实现了数据增强开销和泛化性能之间的良好平衡。此外,我们的方法在损坏或精简数据集的实验中也表现出良好的性能。
摘要:了解大脑感知外界输入数据的功能是神经科学的一大目标。神经解码有助于我们模拟大脑活动和视觉刺激之间的联系。通过这种建模可以实现从大脑活动重建图像。最近的研究表明,视觉显著性是图像刺激的重要组成部分,它给大脑活动留下了深刻的印象。本文提出了一个深度模型,通过视觉显著性从脑电图 (EEG) 记录中重建图像刺激。为此,我们训练了基于几何深度网络的生成对抗网络 (GDN-GAN),将 EEG 信号映射到每个图像对应的视觉显著性图。所提出的 GDN-GAN 的第一部分由切比雪夫图卷积层组成。所提出的网络的 GDN 部分的输入是基于功能连接的 EEG 通道图形表示。 GDN 的输出被施加到所提出的网络的 GAN 部分以重建图像显著性。所提出的 GDN-GAN 使用 Google Colaboratory Pro 平台进行训练。显著性指标验证了所提出的显著性重建网络的可行性和效率。训练后的网络的权重用作初始权重来重建灰度图像刺激。所提出的网络实现了从 EEG 信号进行图像重建。
“设备/系统/服务的显着技术特征 div>RE-CS-5747-004(B)-9如下所述。仅提及这些显着的技术功能,只是为了促进潜在的竞标者以了解招标下的要求,并且不得以任何方式限制或改变竞标文档中涵盖的设备/系统/服务的工作范围和技术功能/规格。关于工作范围和设备/系统/服务规范的详细规定,包括招标文件中的设备/系统/服务规范应为最终且具有约束力。”
人类的视觉是人类最强大的外部感官,对大多数人来说,这是我们吸收信息以理解和获取知识的主要方式。人类的可视化是人类区别于其他物种的一部分;也是人类智能与现在和未来的人工智能系统的区别之一。有效的可视化和视觉互动对于人类的所有活动都至关重要;其好处众所周知。然而,典型的视觉呈现往往是为大众观众设计的,是一种千篇一律的方法。然而,有充分的证据证实,人类的视觉处理有许多独特的方面。本次演讲支持 d'Auriol 提出的可视化个人主义,作为未来可视化设计的范式转变,其中人类可视化个性被建模并融合大众观众以及个性化可视化设计。除了在视觉互动中的实际应用显而易见之外,更严重的问题出现了:鉴于视觉能力的差异,人工智能系统如何与人类共存?本次演讲的第二部分详细阐述了人工智能系统需要意识到人类物种定义能力的差异和面貌:在本工作中具体指将可视化个体主义模型纳入人工智能系统的基本设计中。演讲的这一部分集中于提出概念和逻辑论据,以支持视觉人类突出的人工智能的研发。虽然提出了基于 d'Auriol 的工程洞察服务模型 (2016, 2021) 的理论公式,但这种理论本身并没有在本次演讲中得到强调。