对手术仪器的准确识别对于术中人工智能(AI)系统的发展至关重要。在这项研究中,我们评估了Yolov8模型在识别机器人辅助腹部手术中的机器人和腹腔镜仪器方面的功效。具体来说,我们评估了其检测,分类和分段七种不同类型的手术工具的能力。从四个公共和私人来源编辑了一个多样化的数据集,其中包括代表各种手术环境和工具的7,400帧和17,175个注释。yolov8进行了训练和测试,用于二进制检测的平均平均精度为0.77,多仪器分类的平均精度为0.72。最佳性能。该模型还显示出极好的分割精度,达到0.91的平均骰子得分,平均交点为0.86,单极弯曲的剪刀得出最高的精度。值得注意的是,与腹腔镜工具相比,Yolov8对机器人仪器表现出了出色的识别性能,这可能归因于训练集中机器人仪器的更大表示。此外,该模型的快速推理速度为每帧1.12毫秒,突出了其对实时临床应用的适用性。这些发现证实了Yolov8使用全面的多源数据集对精确有效识别手术工具的潜力。
摘要:本研究提出了一种开创性的方法,可以增强Yolov8模型在对象检测中的准确性,主要集中于解决各种图像类型中检测对象的局限性,尤其是对于小物体。这项工作的拟议策略结合了上下文注意块(CAB),以有效定位和识别图像中的小物体。此外,提出的工作可提高特征提取能力,而不会增加模型复杂性,从而提高了粗到1(C2F)块的厚度。此外,已经对空间注意力(SA)进行了修改以加速检测性能。增强的Yolov8模型(即Yolov8-CAB)强烈强调通过利用CAB块来利用多尺度特征图和迭代反馈来检测较小的物体的性能,从而优化了对象检测机制。因此,创新设计有助于出色的特征提取,尤其是“弱特征”,上下文信息保存和有效的特征融合。对上下文(可可)数据集中的共同对象进行了严格的测试,以证明提出的技术的功效。这对标准Yolo模型产生了显着改善。yolov8-cab模型达到的平均平均精度为97%的检测率,与常规模型相比增加了1%。本研究强调了我们改进的Yolov8方法检测对象的功能,代表了一个突破,为实时对象检测技术的进步设定了阶段。索引术语 - 人工智能,深度学习,计算机视觉,对象检测。
摘要近年来人们对体育运动的兴趣和热情显着增加。这使人们越来越重视各种运动的高质量视频录制,以捕获最小的细节。录制和分析在诸如五人制的体育运动中变得极为重要,五人五个复杂而快速的事件。球检测和跟踪以及玩家分析,已经成为许多分析师和研究人员感兴趣的领域。教练依靠视频分析来评估团队的表现并做出明智的决定以取得更好的成绩。此外,教练和体育侦察员可以通过审查过去的比赛来使用此工具为才华横溢的玩家侦察。球检测对于帮助裁判在比赛的关键时刻做出正确的决定至关重要。但是,由于球的不断运动,其形状和外观会随着时间的流逝而变化,并且通常会被玩家所阻挡,因此在整个游戏中跟踪其位置的挑战。本文提出了一种基于深度学习的Yolov8模型,用于在广播五人制视频中检测球和玩家。关键字yolov8,roboflow,球检测,球员检测,五人
准确的车辆检测对于开发智能运输系统,自动驾驶和交通监控至关重要。本文介绍了Yolo11的详细分析,这是Yolo系列深度学习模型的最新进步,专门针对车辆检测任务。Yolo11在其前辈的成功之下,介绍了旨在在复杂环境中增强检测速度,准确性和鲁棒性的建筑进象。使用包含多种车辆类型的全面数据集(卡车,卡车,公共汽车,摩托车和自行车),我们使用诸如精度,召回,F1得分和平均平均精度(MAP)等指标来评估Yolo11的性能。我们的发现表明,Yolo11超过了先前的ver(Yolov8和Yolov10),可以在保持较小和更具遮挡的车辆的同时保持竞争性推理时间,从而适合实时应用。比较分析表明,复杂车辆几何形状的检测显着改善,进一步有助于开发高效且可扩展的车辆检测系统。这项研究强调了Yolo11增强自动驾驶汽车性能和交通监控系统的潜力,为该领域的未来发展提供了见解。
在过去的几年中,由于计算成本和检测性能之间的有效平衡,Yolos已成为实时对象检测领域的主要范式。研究人员探索了建筑设计,优化目标,数据增强策略以及其他方面的造型,取得了显着的进步。但是,对后处理的非最大抑制(NMS)的依赖阻碍了Yolos的端到端部署,并不利地影响了推断潜伏期。此外,Yolos中各个组件的设计缺乏全面而彻底的检查,从而导致了明显的计算冗余,并限制了模型的能力。它提高了次优效率,并具有相当大的提高性能。在这项工作中,我们旨在从后处理和模型体系结构中进一步提高Yolos的性能效率边界。为此,我们首先介绍了对Yolos的无NMS培训的一致双分配,这同时带来了竞争性能和较低的推理潜伏期。此外,我们介绍了Yolos的整体效率 - 准确性驱动模型设计策略。我们从效率和准确性的角度都全面优化了Yolos的各种组成部分,从而大大降低了计算开销并增强了功能。我们努力的结果是新一代的Yolo系列,用于实时端到端对象检测,称为Yolov10。广泛的实验表明,Yolov10在各种模型尺度上实现了最先进的性能和效率。
摘要。松散的棕榈果(LPF)是一种油棕果,已从其堆中成熟并掉落,含有高油脂含量。LPF的每个损失都会影响石油提取率并导致财务损失。现有的LPF收集方法不是很有效,因为它们需要人类的控制和监督。常规方法,例如机械和滚筒型LPF收集器,由于LPF散布在广泛的人工林上,因此效率低下。因此,必须使用自主LPF检测系统。但是,基于图像的检测系统通常受到诸如亮度和草的环境因素的干扰,而LPF位置随机器人和摄像头的位置而变化。这项研究的一般目标是开发一种基于图像的LPF检测算法。这需要基于深度学习的实时应用的有效检测算法。另外,使用图像深度(RGB-D)准确地确定LPF位置是必不可少的。该项目采用高效率和准确性的Yolov4对象检测器来实现实时LPF检测。使用深度图像和Intel Realsense D435i相机的视野,LPF位置是通过LPF边界框的中心坐标与相机之间的距离确定的。该系统已集成到机器人操作系统(ROS)中,以确保机器人的可用性。该系统达到了98.74%的平均准确性(MAP@IOU 0.5),平均损失为0.124,检测时间为5.14ms。对于LPF位置确定,算法的计算位置和手动测量之间的差异仅为X坐标的3.82厘米,而Y坐标的差异仅为1.80厘米。
1* Autdr-Hub,Andhra University,Visakhapatnam,AP,印度。2 Inder Technology,Anits,Anits,印度Visakhapatnam。 *通讯作者。 电子邮件:balvinder546@gmail.com;在印度等发展中国家,道路上的交通维护是一定的至关重要的任务。 车辆检测起着重要作用,并且是自动监视流量的基本步骤。 车辆检测是从摄像机获得的图像或视频中识别车辆的过程。 它在各种应用中具有重要作用,包括交通监控,监视,自动驾驶汽车和智能运输系统。 具有卷积神经网络(CNN)的深度学习(DL)模型的出现已显示出通往车辆检测问题的途径。 文献中已经提出了几种带有CNN的DL模型,以解决车辆检测问题。 所有这些模型都没有达到标记以产生结果,尤其是由于忙碌的行进条件而引起的印度情况。 为了解决这个问题,本文介绍了一种使用增强的神经体系结构搜索印度SCE NARIO的新车辆检测方法。 实验发现表明,在FGVD和IRUVD数据集上,该模型的表现分别优于Yolo NAS 10.94%和1.29%,精度率为84.51%和96.61%。 关键字:车辆检测,深度学习,Yolo-NAS,平均精度2 Inder Technology,Anits,Anits,印度Visakhapatnam。*通讯作者。电子邮件:balvinder546@gmail.com;在印度等发展中国家,道路上的交通维护是一定的至关重要的任务。 车辆检测起着重要作用,并且是自动监视流量的基本步骤。 车辆检测是从摄像机获得的图像或视频中识别车辆的过程。 它在各种应用中具有重要作用,包括交通监控,监视,自动驾驶汽车和智能运输系统。 具有卷积神经网络(CNN)的深度学习(DL)模型的出现已显示出通往车辆检测问题的途径。 文献中已经提出了几种带有CNN的DL模型,以解决车辆检测问题。 所有这些模型都没有达到标记以产生结果,尤其是由于忙碌的行进条件而引起的印度情况。 为了解决这个问题,本文介绍了一种使用增强的神经体系结构搜索印度SCE NARIO的新车辆检测方法。 实验发现表明,在FGVD和IRUVD数据集上,该模型的表现分别优于Yolo NAS 10.94%和1.29%,精度率为84.51%和96.61%。 关键字:车辆检测,深度学习,Yolo-NAS,平均精度电子邮件:balvinder546@gmail.com;在印度等发展中国家,道路上的交通维护是一定的至关重要的任务。车辆检测起着重要作用,并且是自动监视流量的基本步骤。车辆检测是从摄像机获得的图像或视频中识别车辆的过程。它在各种应用中具有重要作用,包括交通监控,监视,自动驾驶汽车和智能运输系统。具有卷积神经网络(CNN)的深度学习(DL)模型的出现已显示出通往车辆检测问题的途径。文献中已经提出了几种带有CNN的DL模型,以解决车辆检测问题。所有这些模型都没有达到标记以产生结果,尤其是由于忙碌的行进条件而引起的印度情况。为了解决这个问题,本文介绍了一种使用增强的神经体系结构搜索印度SCE NARIO的新车辆检测方法。实验发现表明,在FGVD和IRUVD数据集上,该模型的表现分别优于Yolo NAS 10.94%和1.29%,精度率为84.51%和96.61%。关键字:车辆检测,深度学习,Yolo-NAS,平均精度
摘要:对象检测是每个驱动程序自主系统(DAS)功能之一。但是,当前使用的对象检测结果限于检测大物体,而对于小于80 * 80像素的小物体,使用Yolo时检测准确性可能小于60%。基于上面的低对象检测准确性结果,本研究将尝试将Yolo输入图像中的网格数量从7*7、10*10、13*13、13、16*16和19*19中的Yolo输入中提高,以提高对象检测精度的大小。获得的图像数据分为两个部分:培训数据的70%,测试30%。根据测试的结果,对80 * 80像素的物体进行了7 * 7的网格,众所周知,检测结果的准确性达到90%。同时,网格的数量10 * 10、13 * 13、16 * 16和19 * 19仍在进一步测试中。
本研究探索了 YOLO v10 模型在 CT 图像中检测和分类脑肿瘤的应用。YOLO 以其实时物体检测功能而闻名,为解决医学成像挑战提供了一种有前途的方法。该研究利用 Kaggle 的脑肿瘤数据集,结合 437 张阴性图像和 488 张阳性图像进行训练,并使用其他数据集进行验证。与 AlexNet、VGG16、ResNet101V2 和 MobileNetV3-Large 等传统模型相比,YOLO v10 模型表现出了卓越的性能。它实现了 0.920 的精度、0.890 的召回率、0.900 的 F1 分数和 0.910 的准确率。这些结果凸显了它在准确识别和分类肿瘤方面的有效性,为临床应用提供了巨大的潜力。该模型的架构允许高效处理高分辨率 CT 扫描,并能很好地适应各种肿瘤大小和形状。该研究还讨论了提高不同数据集的计算效率和泛化能力所面临的挑战和未来方向。这些令人鼓舞的发现表明,YOLO v10 可以成为医学诊断的有力工具,提高肿瘤检测的准确性和速度,并有助于改善患者的治疗效果。这项研究为进一步探索和开发基于 YOLO 的医疗保健模型奠定了基础。关键词:YOLO v10、脑肿瘤检测、CT 成像、医学诊断、实时物体检测。1. 简介