机器人及时通过传感器数据构建持久,准确且可操作的模型的能力是自主操作的范围。在将世界表示为点云可能足以进行本地化时,避免障碍物需要更密集的场景表示形式。另一方面,更高级别的语义信息通常对于分解必要的步骤来完成一项复杂的任务,例如烹饪,自主是至关重要的。因此,迫在眉睫的问题是,手头机器人任务的合适场景表示是什么?这项调查提供了对关键方法和框架的全面回顾,这在机器人空间感知领域推动了进步,并特别关注了代表的历史演变和当前的趋势。通过将场景建模技术分类为三种主要类型(公式,公式和指标 - 语言流行),我们讨论了空间启示框架正在从构建世界的纯几何模型转变为更高级的数据结构的方式,这些模型包括更高级别的概念,例如对象实例和位置的概念。特别重点是实时同时定位和映射(SLAM)的方法,它们与深度学习的集成,以增强了鲁棒性和场景的理解,以及它们处理场景动态性的能力,作为当今驾驶Robotics研究的一些最热门的主题。我们在讨论方面的挑战和未来的研究方向的讨论中进行了结论,以建立适合长期自治的强大而可扩展的空间感知系统。
计算机视觉社区过去主要集中于视觉算法的开发,用于对象检测,跟踪和分类,并在白天和类似办公室的环境中使用可见的范围传感器。在过去的十年中,红外线(IR),深度,X射线和其他不可见名的成像传感器仅在医学和防御等特殊领域中使用。与传统的计算机视觉相比,在这些感觉领域的兴趣相对较低,部分原因是它们的高成本,低分辨率,图像质量差,缺乏广泛可用的数据集以及/或缺乏对频谱不可访问的部分的优势的考虑。随着传感器技术的迅速发展,传感器成本急剧下降,这些局限性正在克服。此外,对安全和可靠性是主要问题的自主系统的兴趣日益增强,强调了强大的感知系统的重要性。在此类关键系统中,在不同频谱中运行的传感器相互补充,以克服每个单独的传感器的局限性,以在各种照明和天气条件下提供强大而可靠的感知。
尽管最近的研究通过深度学习技术突破了极限,但从 3D 点云中进行物体检测仍然是一项具有挑战性的任务。由于严重的空间遮挡和点密度随到传感器距离的固有变化,同一物体在点云数据中的外观会有很大变化。因此,设计针对这种外观变化的鲁棒特征表示是 3D 物体检测方法的关键问题。在本文中,我们创新地提出了一种类似域自适应的方法来增强特征表示的鲁棒性。更具体地说,我们弥合了特征来自真实场景的感知域和特征从由富含详细信息的非遮挡点云组成的增强场景中提取的概念域之间的差距。这种领域自适应方法模仿了人脑在进行物体感知时的功能。大量实验表明,我们简单而有效的方法从根本上提高了 3D 点云物体检测的性能并取得了最先进的结果。
摘要 人类在感知方面表现出重力优势:我们能更精确地判断向下移动物体的速度,而不是向上移动物体的速度,这表明重力加速度是一种内在化的先验。然而,尚不清楚这种重力先验是完全基于感知线索,还是可以结合语义知识。先前的研究仅使用了已知服从重力的物体,可能混淆了语义和感知线索。在这里,我们通过要求参与者判断通常与重力(球)或逆重力(火箭)相干移动的物体的速度来解决这个问题。我们的结果显示,无论物体身份如何,下落刺激都具有感知优势,这表明重力先验是基于感知线索的。
可变形图像配准是医学图像分析的基本步骤。最近,Transformer 已用于配准,其表现优于卷积神经网络 (CNN)。Transformer 可以捕获图像特征之间的长距离依赖性,这已被证明对配准有益。然而,由于自注意力的计算/内存负载高,Transformer 通常用于下采样特征分辨率,无法捕获全图像分辨率下的细粒度长距离依赖性。这限制了可变形配准,因为它需要每个图像像素之间精确的密集对应关系。没有自注意力的多层感知器 (MLP) 在计算/内存使用方面效率高,从而可以捕获全分辨率下的细粒度长距离依赖性。然而,MLP 尚未在图像配准中得到广泛探索,并且缺乏对医学配准任务至关重要的归纳偏差的考虑。在本研究中,我们提出了第一个基于相关感知 MLP 的配准网络 (CorrMLP) 用于可变形医学图像配准。我们的 CorrMLP 在新颖的粗到细配准架构中引入了关联感知多窗口 MLP 块,该架构可捕获细粒度多范围依赖性以执行关联感知粗到细配准。对七个公共医疗数据集进行的大量实验表明,我们的 CorrMLP 优于最先进的可变形配准方法。
糖尿病管理中越来越多的证据使疾病感知与对病情的成功控制,并改善了成年人的健康结果(1,2)。青少年通常很难遵守糖尿病护理计划(3,4),以便更好地了解他们对疾病的看法可以帮助改善其控制和健康成果(5,6)。此外,在青春期还形成了疾病感知,这使得这是一个重要的时期,在其中考虑这种情况(7,8)。尽管有充分的证据表明疾病对成年人的重要性,但对于青少年来说,这是尚无定论的(9,10)。可用的研究主要集中于提供不一致结果的定量研究(6,11)。在本文中,在一项审查研究的支持下,三项研究的定性发现强调了疾病在青少年发展框架内的重要性,并建议未来的研究以操作这些发现。本文的独创性在于对患者声音的有效使用和反映,这在医学研究中通常不存在。
如今,空气和噪音污染的持续增加已成为一种长期的滋扰,同时也是一个令人担忧的问题。在本期刊中,我们将提供一个系统来测量和监控环境参数,并在空气质量和噪音水平超过安全水平时发出警报。该系统使用必要的传感器来检测大气中的气体以及特定区域的噪音水平,并将其传输到微控制器 NodeMCU。现在,通过 Wi-Fi 凭证连接到 Node MCU 的云平台 Blynk 会获取数据并通过与被视为安全水平的值进行比较来处理数据。当每个空气质量和噪音污染变量超过允许水平时,这个基于云的监控应用程序 Blynk 还会提供一个警报系统。它通过向 Android 设备发送电子邮件或消息来通知用户,甚至可以激活蜂鸣器作为警报。这些数据被连续传输,并被存储以供进一步解释。这种基于云的污染监测系统是最经济、最可靠、最具成本效益的,并且可以增强以应对即将到来的挑战。2021 Elsevier Ltd. 保留所有权利。由第二届国际创新技术和科学会议 (iCITES 2020) 的科学委员会负责选择和同行评审。
当前的感知模型在很大程度上取决于资源密集型数据集,从而促使需要创新。通过从各种注释中构造图像输入来利用综合数据的最新进展,证明对下游任务有益。虽然先前的方法已单独解决了生成和感知模型,但首次降低了两者的谐调,从而解决了为感知模型生成有效数据的挑战。通过感知模型增强图像发生,我们引入了感知感知损失(P.A.损失)通过细分,提高质量和可控性。为了提高特定感知模型的性能,我们的方法通过提取和利用感知意识来定制数据(P.A.attr)在一代中。对象检测任务的实验结果突出显示了detDiffusion的统治性能,建立了布局引导的新最新作品。此外,降低的图像合成可以有效地增强训练数据,从而显着增强下游检测性能。
近年来,多层感知器 (MLP) 成为计算机视觉任务领域的研究热点。由于没有归纳偏差,MLP 在特征提取方面表现良好并取得了惊人的效果。然而,由于其结构简单,其性能高度依赖于局部特征通信机制。为了进一步提高 MLP 的性能,我们引入了脑启发神经网络的信息通信机制。脉冲神经网络 (SNN) 是最著名的脑启发神经网络,在处理稀疏数据方面取得了巨大成功。SNN 中的泄漏积分和触发 (LIF) 神经元用于在不同时间步骤之间进行通信。在本文中,我们将 LIF 神经元的机制合并到 MLP 模型中,以在不增加 FLOP 的情况下实现更好的准确率。我们提出了一种全精度 LIF 操作来在块之间进行通信,包括不同方向的水平 LIF 和垂直 LIF。我们还建议使用组 LIF 来提取更好的局部特征。借助 LIF 模块,我们的 SNN-MLP 模型在 ImageNet 数据集上分别仅使用 4.4G、8.5G 和 15.2G FLOP 就实现了 81.9%、83.3% 和 83.5% 的 top-1 准确率,据我们所知,这是最先进的结果。源代码将在 https://gitee.com/mindspore/models/tree/master/research/cv/snn mlp 上提供。