摘要 - 视觉细分试图将图像,视频帧或点云分段分为多个段或组。该技术具有许多现实世界的应用,例如自动驾驶,图像编辑,机器人传感和医学分析。在过去的十年中,基于深度学习的方法在这一领域取得了显着的进步。最近,Transformers是一种基于最初为自然语言处理的自我注意力的一种神经网络,在各种视觉处理任务中已经超过了以前的卷积或经常性方法。具体来说,视觉变压器为各种细分任务提供了强大,统一甚至更简单的解决方案。本调查提供了基于变压器的视觉细分的详细概述,总结了最近的进步。我们首先审查背景,包括问题定义,数据集和先前的卷积方法。接下来,我们总结了一个统一所有基于变压器的方法的元结构结构。基于此元结构结构,我们检查了各种方法设计,包括对元结构和相关应用程序的修改。我们还提供了几个特定的子字段,包括3D点云进行分割,基础模型调整,域感知分割,有效的分割和医疗分割。此外,我们在几个公认的数据集上编译并重新评估了所审核的方法。最后,我们确定了这一领域的公开挑战,并提出了未来研究的方向。项目页面可以在https://github.com/lxtgh/aweshy-sementation-with-transformer上找到。
纸张涉及视觉伺服(VS),这是一种使用视觉信息引导机器人的众所周知的方法。在这里,将图像处理,机器人技术和控制理论组合在一起,以控制机器人的运动。该主题解释了VS的分类以及不同的相机配置及其控件。它还涵盖了图像处理,姿势估计,立体声视觉和摄像机校准,以机器人概念为例。图像处理包括两个基本操作:图像分割和图像解释。姿势代表机器人的位置和方向,该位置和方向是通过分析溶液,相互作用矩阵和算法溶液估算的。立体视觉代表基于机器人左和右眼(相机)对象图像之间的双眼差的对象深度的计算。对象的深度是通过四种基本方法计算的:来自平面同构象的表现几何,三角剖分,绝对取向和3D重建。摄像机校准是确定特定相机参数的过程,以便使用指定的测量完成操作。此外,它还侧重于基于3D视觉伺服和深层神经网络的机器人操纵(在学校中的娱乐场所),非线性鲁棒性视觉伺服器控制,用于机器人柑橘的收获,基于图像的磁滞性减少,以减少灵活的内窥镜仪器(Laparososcic Robotic robotic Sulobots)。
研究文章| Alpha节奏的行为/认知发展与视觉白质途径和视觉检测性能有关https://doi.org/10.1523/jneurosci.0684-23.2023收到:2023年4月14日收到:2023年11月21日接受:2023年11月21日接受:2023年11月29日
酒精和药物使用在被诊断为精神分裂症的患者中很常见。尽管精神分裂症中酒精使用障碍的频率很高,但在所有研究中,排除使用物质的使用导致数据非常有限。在高公平的解释中提出了许多理论。典型的抗精神病药对精神分裂症患者酒精和药物使用的影响受到限制。使用非典型抗精神病药的有效性,尤其是辛劳的使用。当我们研究文献时,尽管在治疗酒精滥用方面已经出现了许多新的药物,但在精神分裂症患者中,只研究了其中一个(Naltrexon)。在该患者人群中,这并不是正确的方法,即认为仅药理方法将带来最合适的好处。包括心理治疗在内的协调良好的治疗计划应该是绝对目标。
视觉认知模型通常假设大脑网络会预测刺激的内容以促进其后续分类。然而,在网络层面理解预测和分类仍然具有挑战性,部分原因是我们需要从动态神经信号中逆向工程它们的信息处理机制。在这里,我们使用可以隔离特定内容通信的连接性测量来重建每个参与者(N = 11,男女皆有)的网络机制。每个人都被提示预测的 Gabor 刺激的空间位置(左 vs 右)和内容[低空间频率(LSF) vs 高空间频率(HSF)],然后他们进行分类。使用每个参与者同时测量的 MEG,我们重建了预测和分类行为的 LSF 与 HSF 内容的网络。我们发现,在前额叶皮质的监督控制下,预测内容根据任务需求灵活地从颞叶皮质向下传播到侧枕叶皮质。当它们到达侧枕叶皮层时,预测会增强自下而上的 LSF 与 HSF 对刺激的表征,从枕叶腹侧顶叶到运动前皮层,进而产生更快的分类行为。重要的是,内容通信是通常在大脑区域之间测量的信号到信号通信的子集(即 55 – 75%)。因此,我们的研究分离了处理认知功能信息的功能网络。
illy,即8-14 Hz)与视觉任务中主观性能的度量成反比,例如置信度和视觉意识。有趣的是,相同的EEG签名似乎不会影响任务绩效(即准确性)的观点。我们在这里检查了当使用严格的精度措施时,这种解离是否存在。以前的脑电图研究已采用2-替代强制选择(2-AFC)歧视任务来将刺激前振荡活动链接到纠正/不正确的响应作为单次审判水平上准确性/客观绩效的指数。但是,2-AFC任务不能很好地估计单次试验准确性,因为将归类为控制的许多响应将受到猜测的污染(猜测的机会正确的响应率为50%)。在这里,我们采用了19个AFC的信函标识任务来衡量准确性和主观报道的每个试验的感知意识水平。作为正确的猜测率可以忽略不计(〜5%),此任务提供了更纯净的精度。我们的结果复制了刺激前α/β波段功率和感知意识等级之间的反相关关系,而没有与犯罪准确性的联系。刺激前振荡阶段无法预测主观意识或准确性。我们的结果证实了刺激前的EEG Power-Task性能链接的解离,以实现主观和客观措施,并进一步证实了刺激前的alpha功率作为视觉意识的神经预测指标。
alpha是静止人体中最强的电生理节奏。尽管在脑电图信号中占主导地位,但在发育过程中可以观察到α性质的巨大变化,并且在儿童期和成年期间α频率的增加。在这里,我们检验了以下假设:α节奏中的这些变化与视觉白质途径的成熟有关。我们以大型扩散MRI(DMRI)-EEG数据集(DMRI n = 2,747,EEG N = 2,561)的儿童和青少年(年龄范围5-11岁)的儿童和青少年进行了大写,并显示出特定于Alpha频率的发育范围。行为分析还证实了α频率的变化与视觉感知的成熟变化有关。目前的发现证明了白质组织特性,电生理反应和行为之间的发育变化之间的密切联系。
在本研究中,我们提出了一种用于基于稳态视觉诱发电位 (SSVEP) 的脑机接口 (BCI) 的新型混合视觉刺激,该刺激将各种周期性运动融入传统的闪烁刺激 (FS) 或模式反转刺激 (PRS)。此外,我们研究了每种 FS 和 PRS 的最佳周期运动,以增强基于 SSVEP 的 BCI 的性能。通过根据四个不同的时间函数(用无、平方、三角和正弦表示)改变刺激的大小来实现周期性运动,总共产生八种混合视觉刺激。此外,我们开发了滤波器组典型相关分析 (FBCCA) 的扩展版本,这是一种用于基于 SSVEP 的 BCI 的最先进的无需训练分类算法,可提高基于 PRS 的混合视觉刺激的分类准确性。 20 名健康个体参加了基于 SSVEP 的 BCI 实验,以区分四种不同频率的视觉刺激。评估了平均分类准确率和信息传输率 (ITR),以比较基于 SSVEP 的 BCI 对不同混合视觉刺激的性能。此外,还评估了用户对每种混合视觉刺激的视觉疲劳程度。结果,对于 FS,当除 3 秒外的所有窗口大小都加入正弦波形的周期运动时,报告的性能最高。对于 PRS,方波的周期运动在所有测试窗口大小中显示出最高的分类准确率。两种最佳刺激之间的性能没有观察到显著的统计差异。据报道,正弦波周期运动的 FS 和方波周期运动的 PRS 的平均疲劳分数分别为 5.3 ± 2.05 和 4.05 ± 1.28。因此,我们的结果表明,与传统的 FS 和 PRS 相比,具有正弦波周期运动的 FS 和具有方波周期运动的 PRS 可以有效提高 BCI 性能。