摘要 - 遮挡对安全至关重要的应用(例如自动驾驶)提出了重大挑战。集体感知最近引起了巨大的研究兴趣,从而最大程度地减少了闭塞的影响。尽管已经取得了重大进步,但是这些方法的渴望数据的性质为其现实世界部署带来了重大障碍,尤其是由于需要带注释的RSU数据。鉴于交叉点的数量和注释点云所涉及的努力,手动注释培训所需的大量RSU数据非常昂贵。我们通过根据无监督的对象发现为RSU设计标签有效的对象检测方法来应对这一挑战。我们的论文介绍了两个新模块:一个基于点云的空间时间聚集,用于对象发现,另一个用于改进。fur-hoverore,我们证明,对一小部分带注释的数据进行微调使我们的对象发现模型可以使用甚至超过完全监督的模型范围缩小性能差距。在模拟和现实世界数据集中进行了广泛的实验,以评估我们的方法†。
对象检测在各种自主系统中至关重要,例如监视,自动驾驶和驾驶员的稳定性,通过识别行人,车辆,交通信号灯和标志来确保安全。然而,诸如雪,雾和雨等不利天气条件构成了挑战,具有检测准确性,冒险发生事故和大坝。这清楚地表明了在所有天气条件下都起作用的强大观察检测解决方案的必要性。我们采用了三种策略来增强不利天气中的基于深度学习的对象检测:对全球全天候图像进行培训,对图像进行培训,并具有合成的增强天气噪声,并将对象的变形与不利天气图像denosistighting进行整合。使用分析方法,GAN网络和样式转移网络产生合成天气噪声。我们使用BDD100K数据集中的真实世界全天候图像和用于评估未见现实世界的不利天气图像的评估,通过训练对象进行分割模型比较了这些策略的性能。通过降级现实世界的不利天气图像以及对物体检测的结果和原始嘈杂图像的结果进行了评估,从而评估了不利天气。我们发现,使用全天候现实世界图像训练的模型表现最佳,而对对象检测进行对象检测的策略则表现最差。
这项研究的重点是在视频中移动对象检测的关键任务,以提高识别场景中动态特征的准确性和效率。所提出的方法专门结合了光流估计的准确性;带有Yolo(您只看一次)模型强的对象检测功能的Farneback方法。Yolo用于识别视频帧中的对象,并并发光流分析用于识别运动模式。这里提出了一种创新方法,该方法评估了检测到的对象内每个像素的运动角度和大小,以获得精确的移动对象识别。系统根据显示明显运动的像素的百分比来确定对象是否通过设置阈值来移动。,由于这种自适应技术,可以识别出较少的假阳性和更高的精度,因此可以识别移动对象。在各种数据集上的实验发现证明了建议的方法在精确识别移动对象方面的有效性。通过用于运动分析的光流和用于对象检测的YOLO的组合提供了一个完整的有效解决方案,可在视频流中移动对象检测。此处提出的方法在视频分析,自主系统和监视中具有潜在的应用,在该视频分析,自主系统和监视中,精确检测动态特征至关重要。索引项 - 移动对象检测,光流估计,运动角度和幅度。
抽象的人类视觉认知在文化之间大不相同。一个关键发现是,视觉处理是针对西方文化(美国和欧洲)以及东方文化(亚洲)背景的视觉场景的焦点。尽管迄今为止,幼儿存在一些文化差异的证据,但人类视觉认知中文化差异的个体发生起源尚未揭晓。这项研究通过跟踪12个月大的婴儿在电视范围(EEG)中视觉场景的对象与背景元素的神经特征与背景元素的神经签名在维也纳(奥地利;奥地利;一种西方文化; n = 35)和Kyoto(日本;一种东方文化; n = 36)。具体来说,我们通过以不同的刺激频率(5.67和8.5 Hz)呈现对象和背景来分离神经信号。结果表明,早期文化之间的人类视觉处理是不同的。我们发现,来自维也纳的婴儿表现出较高的物体信号,而京都的婴儿则表现出强调背景信号。人类视力中文化差异的早期出现可以部分通过早期的社会经验来解释:在一个单独的互动阶段,来自维也纳的母亲比京都的母亲更经常指出对象(与背景)要素。得出结论,采用跨文化发展的神经科学方法,我们揭示了对象和背景的视觉处理的跨文化差异在出生后的第一年就已经存在,这比以前想象的要早得多。
摘要。移动机器人和许多Edge AI设备需要对计算功率进行贸易,以防止功耗,电池尺寸和电荷之间的时间。因此,与通常用于训练和评估深层神经网络的功能强大的基于强大的基于GPU的系统相比,这种设备具有明显较小的计算能力是很常见的。对象检测是机器人和边缘设备的视觉感知的关键方面,但是在基于GPU的系统上运行最快的流行对象检测体系结构或旨在用大型输入图像尺寸最大化地图的旨在,可能无法很好地扩展到边缘设备。在这项工作中,我们评估了代表机器人和边缘设备功能的一系列设备上的Yolo和SSD家族的几个模型架构的延迟和图。我们还评估了运行时框架的效果,并证明了一些意外的largedIfferencesCanbefound.basedonourevaluationsweproposenewvariations yolo-lite体系结构,我们显示的可以在减少潜伏期时提供增加的地图。
显着对象检测(SOD)广泛用于运输中,例如道路损坏检测,辅助驾驶等。但是,由于其大量计算和参数,重量级草皮方法很难在计算能力低的情况下应用。大多数轻型SOD方法的检测准确性很难满足应用程序要求。我们提出了一个新颖的轻质尺度自适应网络,以实现轻质限制和检测性能之间的权衡。我们首先提出了比例自适应特征提取(安全)模块,该模块主要由两个部分组成:多尺度特征交互,可以提取不同尺度的特征并增强网络的表示能力;和动态选择,可以根据输入图像根据其贡献自适应地分配不同的权重。然后,基于安全模块,设计了一个轻巧和自适应的骨干网络,并结合了多尺度特征聚合(MFA)模块,将规模自适应网络与比例自适应网络相结合。我们在六个公共数据集上对模型进行定量和定性评估,并将其与典型的重量级和轻量级方法进行比较。只有2.29 M参数,它可以在GTX 3090 GPU上实现62 fps的预测速度,远远超过其他型号,并且可以保证实时性能。模型性能达到了一般重量级方法的性能,并超过了最先进的轻量级方法。
当前用于对象识别和分类的方法主要依赖于单帧图像中的静态信息。但是,对于战斗空中视频(通常是低分辨率视频),几乎无法获得用于对象分类和识别的所有静态索引。为了应对这一挑战,我们提出了一种创新的3D和动态语义场景分析的方法,该方法利用监视视频数据主要是从无人机平台捕获的,以对静态对象进行分类(例如建筑物)和移动对象(例如车辆)自动。在我们提出的自动对象检测和分类框架中,除了3D静态对象的视觉特征(例如建筑物或车辆的形状,线取向,颜色和纹理)以及城市环境的3D静态结构,我们还探索了动态视频功能,其中包括随时间推移的车辆运动图案。所有这些静态和动态特征都将被视为构造时空特征向量,然后将新生成的向量发送到实时和自动建筑物和车辆分类的概率动态影响图(DID)推理模型。此外,我们还提出了有关自动建筑物检测,3D地形建模和可视化的新颖3D算法,以支持准确的对象分类/分类。1。简介
印度阿萨姆邦阿萨姆市中心大学 摘要:图像处理是一种处理图像以修饰图像或从中提取有用信息的技术。它可以定义为通过使用复杂算法对图像进行技术分析。在这里,图像用作输入,有用的信息作为输出返回。与此同时,人工智能行业也正迎来巨大的繁荣曲线。据《福布斯》报道,人们相信到 2020 年,人工智能和机器学习可以在广告和销售方面创造额外的 2.6 万亿美元价值,在生产和交付链规划方面创造高达 2 万亿美元的价值。索引词:人工智能、物体检测、卷积神经网络、R-CNN [1]、Fast R-CNN [2]、Faster R-CNN [3]、YOLO [4]。
位置估计的准确性受能够提供相对目标测量值的传感器/信标数量的影响。虽然单个传感器/信标是最容易实现的系统,但必须进行多次测量才能确保位置信息的准确性。多个传感器/信标可以实现更及时的位置验证,但会增加系统复杂性。例如,传感器/信标的属性及其相对于目标物体的几何形状会影响系统的准确性。如果相同的传感器/信标太近,它们将提供几乎相同的信息,对知识库的补充很少。如果传感器/信标相距太远,可能会遗漏一些重要信息。因此,最佳传感器/信标间距介于这两个极端之间。本文将进一步探讨一种控制传感器/信标阵列几何形状的方法,以在实验期间保持最佳跟踪性能配置。
摘要 — 本文对扩展对象跟踪的当前研究进行了详尽概述。我们对扩展对象跟踪问题进行了清晰的定义,并讨论了其与其他类型对象跟踪的界限。接下来,我们将广泛讨论扩展对象建模的不同方面。随后,我们将介绍两种基本且常用的扩展对象跟踪方法——随机矩阵方法和基于卡尔曼滤波器的星形凸形状方法。下一部分将讨论多个扩展对象的跟踪,并详细说明如何使用随机有限集 (RFS) 和非 RFS 多对象跟踪器解决大量可行的关联假设。本文最后总结了当前的应用,其中重点介绍了四个示例应用,涉及摄像头、X 波段雷达、光检测和测距 (LIDAR)、红绿蓝深度 (RGB-D) 传感器。