摘要:同时定位和映射(SLAM)对于移动机器人技术至关重要。大多数vi-sual SLAM系统都假定环境是静态的。但是,在现实生活中,有许多动态对象,会影响这些系统的准确性和鲁棒性。为了改善视觉大满贯系统的表现,这项研究提出了基于定向的快速和旋转简短(ORB)-Slam3框架的动态视觉大满贯(SEG-SLAM)系统,您只能看一次(YOLO)V5深学习方法。首先,基于ORB-SLAM3框架,Yolov5深学习方法用于构建用于目标检测和语义分割的融合模块。此模块可以有效地识别并提取明显和潜在动态对象的先验信息。第二,使用先前的信息,深度信息和表现几何方法为不同的动态对象开发了差异化的动态特征拒绝策略。因此,提高了SEG-SLAM系统的定位和映射准确性。最后,拒绝结果与深度信息融合在一起,并使用点云库构建了无动态对象的静态密集映射。使用公共TUM数据集和现实世界情景评估SEG-SLAM系统。所提出的方法比当前动态视觉大满贯算法更准确,更健壮。
摘要这项研究提出了一种创新的视频监视中人行人检测方法,利用Yolov5的功率(您只看一次版本5)与基于光感知融合的功能提取相结合。所提出的方法旨在在不同的照明条件下提高行人检测系统的准确性和效率。yolov5以其实时对象检测功能而闻名,与一种新型的特征提取技术集成,该技术融合了来自多个光感知传感器的信息。这种融合策略允许模型在不同的照明方案中适应和稳健。实验结果证明了所提出的方法的优越性,实现了出色的性能。Yolov5与基于光感知的特征提取的融合,展示了行人检测中有希望的进步,以解决现实监视环境中动态照明条件带来的挑战。关键字:行人检测,视频监视,Yolov5,光感知融合,特征提取
摘要。自动型表面车辆(ASV)由于其广泛的应用而成为重要的研究重点。ASV发展中的一个主要挑战是对水面上的物体(例如浮标)的快速而准确的检测和鉴定。本研究研究了Yolov5在ASV上的浮标检测,重点是机器人操作系统(ROS)框架内的路径定位。路径定位用于根据浮标检测来确定血管的路线及其通过测试路径的移动。结果表明,Yolov5在检测ROS生态系统组成部分的凉亭模拟器内检测边界浮标时达到了100%的精度。此外,ASV能够沿着测试路径的中心准确导航,而不会与边界浮标相撞。这项研究有望为ASV技术的发展做出重大贡献。
抽象的智能移动性和自动驾驶汽车(AV),必须非常精确地了解环境,以保证可靠的决策,并能够将公路部门获得的结果扩展到铁路等其他领域。为此,我们基于Yolov5引入了一个新的单阶段单眼3D对象检测卷积神经网络(CNN),该卷积神经网络(CNN)致力于公路和铁路环境的智能移动性应用。要执行3D参数回归,我们用混合锚盒替换了Yolov5的锚点。我们的方法有不同的模型大小,例如yolov5:小,中和大。我们提出的新模型已针对实时嵌入DED约束(轻巧,速度和准确性)进行了优化,该模型利用了被分裂注意的改进(SA)卷积所带来的改进(称为小型分裂注意模型(SMALL-SA)。为了验证我们的CNN模型,我们还通过利用视频游戏Grand Theft Auto V(GTAV)来引入一个新的虚拟数据集,以针对道路和铁路环境。我们在Kitti和我们自己的GTAV数据集上提供了不同模型的广泛结果。通过我们的结果,我们证明了我们的方法是最快的3D对象检测,其准确性结果接近Kitti Road数据集上的最新方法。我们进一步证明,GTAV虚拟数据集上的预训练过程提高了实际数据集(例如Kitti)的准确性,从而使我们的方法比最先进的方法获得了更高的准确性,该方法具有16.16%的3D平均均衡性精度,而硬CAR检测的推理时间为11.1 MS/rtx 3080 gpu的推理时间为11.1 s/simage。
对于电力线路巡检,传统的人工巡检方式存在着抄表工作量大、准确率低、存在安全隐患等一系列问题。基于数字图像技术的电表读数图像智能识别方法具有很大的实用价值。但现有的基于深度学习的电表读数识别方法普遍忽略了电表仪表盘指针、刻度等关键点的提取,现有算法鲁棒性和抗干扰能力较差,因此本文旨在研究一种基于深度学习的电力线路巡检电表图像读数识别新方法。首先对电表仪表盘倾斜进行校正,精确定位仪表盘中心;然后基于YOLOv5网络模型构建电表读数识别模型,给出YOLOv5网络模型结构,介绍其工作原理;最后通过实验结果验证了所提出的电表读数图像处理方法及构建的识别模型的有效性。
摘要。珊瑚礁是重要的生态系统,由于当地人类的影响和气候变化,其威胁越来越大。对珊瑚礁的有效,准确的监测对于它们的保护和管理至关重要。在本文中,我们提出了一个自动珊瑚检测系统,该系统只能使用一次(YOLO)深度学习模型,该模型是专门针对水下进化分析量身定制的。要训练和评估我们的系统,我们采用了一个由400个原始水下图像组成的数据集。,我们使用数据增强技术通过图像操纵将带注释的图像的数量增加到580,这可以通过提供更多样化的训练示例来改善模型的性能。数据集是从捕获各种珊瑚礁环境,物种和照明条件的水下视频中仔细收集的。我们的系统可以实现Yolov5算法的实时对象检测功能,从而实现有效而准确的珊瑚检测。我们使用Yolov5从带注释的数据集中提取区分特征,从而使系统能够概括,包括以前看不见的水下图像。在我们的原始图像数据集上,使用Yolov5成功实施了自动珊瑚检测系统,突出了先进的计算机视觉技术在珊瑚礁研究和保护中的潜力。进一步的研究将着重于完善算法以处理具有挑战性的水下图像条件,并扩展数据集以结合更广泛的珊瑚种类和时空变化。
摘要。本研究的重点是分析和探索您只看一次(YOLO)算法。具体来说,本文分析了对象检测中三个版本(Yolov1,Yolov5和Yolov8)的演变和性能。研究开始于详细介绍对象检测的基本概念以及该领域常用的数据集。然后,它深入研究了与每个Yolo版本相关的特定体系结构和实验结果。分析表明,尽管Yolov8引入了高级功能和改进,但诸如Yolov5之类的早期版本在某些条件下可能会提供卓越的稳定性和性能,尤其是在特定任务(例如汽车检测)中。讨论强调了批处理大小等因素对模型性能的重要影响,这表明对这些参数进行微调可以优化特定应用的算法。该研究得出的结论是,Yolo发展的未来在于探索和完善不同的变体,尤其是Yolov8的变体,以更好地满足各种要求。通过专注于五个不同的Yolov8变体,该研究旨在增强Yolo框架在各种物体检测挑战中的适应性和有效性,从而对这项技术的持续发展产生宝贵的见解。
摘要:背景:近年来,针对皮肤状况的计算机辅助诊断已取得了重大进展,主要是由人工智能(AI)解决方案驱动的。,尽管取得了这种进步,但支持AI的系统的效率仍然受到高质量和大规模数据集的稀缺性的阻碍,这主要是由于隐私问题所致。方法:本研究通过使用生成的对抗网络(GANS)创建具有不同痤疮严重程度(轻度,中度和严重)的人脸的合成数据集来规避与现实世界痤疮数据集相关的隐私问题。此外,三个对象检测模型 - Yolov5,Yolov8和detectron2-用于评估增强数据集检测痤疮的功效。结果:将StyleGAN与这些模型集成在一起,结果证明了平均平均精度(MAP)分数:Yolov5:73.5%,Yolov8:73.6%,检测2:37.7%。这些得分超过没有gan的地图。结论:这项研究强调了GAN在产生合成面部痤疮图像中的有效性,并强调了利用gans和卷积神经网络(CNN)模型的重要性,以进行准确的痤疮检测。
摘要 运动相关的脑损伤是一个紧迫的问题,特别是在冰球等高强度运动中,撞击速度在确定头部撞击程度和随后的受伤风险方面起着重要作用。然而,现有的测量撞击速度的方法,如 GPS 跟踪和手动视频分析,成本高昂,难以使用,尤其是对于青少年联赛而言。本研究介绍了一种使用计算机视觉从 2D 视频中确定球员速度的自动化、经济高效的方法。第一步是定位场地,通过一种新方法使用 YOLOv5 检测冰面上的特定地标。凭借超过 9,900 张带注释图像的数据集,YOLOv5 表现出色,在 80% 的置信水平下实现了 0.99 的 F1 分数和精确召回率,在 IoU 阈值为 0.5 和 0.5:0.95 时分别实现了 98.5% 和 64.5% 的 mAP 分数。通过每帧检测至少四个地标,计算单应性矩阵以获得自上而下的视图,从而完成定位过程。这种方法实现了 0.96 的平均 IoU,验证了其在现场定位中的准确性,并展示了其在提高冰球撞击速度测量的可及性和成本效益方面的潜力。
摘要 - 物理对对象 - 探测攻击对自动驾驶系统(ADS)引起了安全关注,并且是其广泛采用的重要障碍。为了增强广告解决此类问题的能力,我们旨在提出一个人类协作框架,以使人类进入循环以减轻攻击。在这项WIP工作中,我们研究了Yolo系列(Yolov5和Yolov8)中两个对象探测器的表现,以针对Carla模拟器中不同驾驶环境中的三种物理对对象弹性攻击。使用静态图像,我们发现Yolov8在攻击检测中通常超过了Yolov5,但在特定情况下仍然容易受到某些攻击的影响。研究结果表明,当考虑到系统级特征时,没有任何攻击在动态测试中取得了很高的攻击成功率。尽管如此,对于每种攻击,这种检测结果在不同位置的不同位置有所不同。总的来说,这些结果表明,自主驾驶中的感知(与手动驾驶中的人类感知相同)也可能依赖于上下文。此外,我们的结果揭示了人类驾驶员预期的制动距离处的对象检测故障,这表明有必要让人类驾驶员参与未来的评估过程。
