摘要。目的:这项研究的目的是使用Yolov8n,Yolov8s和Yolov8M在各种图像条件下检测车辆类型,并进行增强。方法:本研究利用黎明数据集上的Yolov8方法。该方法涉及使用预训练的卷积神经网络(CNN)处理图像并输出所检测到的对象的边界框和类。此外,还应用了数据增强来提高模型从不同方向和观点识别车辆的能力。结果:测试结果的MAP值如下:没有数据扩展,Yolov8n达到了约58%,Yolov8S得分左右约为68.5%,而Yolov8M的MAP值约为68.9%。然而,在应用水平翻转数据扩大后,Yolov8n的地图增加到约60.9%,Yolov8s提高到约62%,而Yolov8M的地图卓越,地图约为71.2%。使用水平翻转数据增强提高了所有三种Yolov8模型的性能。Yolov8M模型达到了71.2%的最高地图值,表明其在应用水平翻转增强后检测物体的有效性很高。新颖性:这项研究通过采用最新版本的Yolo,Yolov8来介绍新颖性,并将其与Yolov8n,Yolov8s和Yolov8M进行比较。使用数据增强技术(例如水平翻转)增加数据变化的使用也很新颖,在扩展数据集并提高模型识别对象的能力方面。关键字:CNN,数据增强,黎明,对象检测,Yolov8于2023年11月收到 /修订2024年2月 / 2024年2月接受此工作,该工作已在创意共享署名4.0国际许可下获得许可。
最近,智能运输系统(ITS)已成为应对城市交通管理日益严重的挑战的重要组成部分。随着车辆密度的指数升高和道路安全问题的增加,发展有效且可扩展的交通解决方案已变得必不可少。本文探讨了最先进的计算机视觉技术的整合,以有效地应对这些挑战。交通监控系统的演变:交通监控的根源可以追溯到传统方法,例如手动监视和静态传感器,尽管在特定方案中有效,但在可伸缩性,实时适应性和精度方面有限制。多年来,人工智能和计算机视觉的进步改变了这一景观,从而实现了实时和自动化的交通分析。引入了诸如YOLO(您只看一次)和高级跟踪算法(例如Bytetrack)等深度学习模型的引入进一步提高了流量监控系统的准确性和鲁棒性。Yolov8是Yolo系列中的最新迭代,它带来了改进的对象检测功能,包括更高的精度和更快的推断。Bytetrack是一种尖端的多对象跟踪算法,即使在诸如遮挡和高速运动之类的具有挑战性的条件下,也可以确保跨视频帧的稳定和可靠的跟踪。
技术领导者 - 钦奈奥拉加达姆全球汽车研究中心学者。摘要全球环境问题主要归因于汽车行业,即与温室气体排放,资源消费和产生废物有关。随着全球越来越多地支持可持续性,汽车行业承受着越来越多的压力,无法实施更可持续的实践。本文研究了用于促进环境可持续性的车辆制造和设计中使用的众多策略和技术进步。它着眼于减少废物,材料的选择,制造过程中的能源效率,使用生命周期方法的车辆设计以及技术在促进可持续发展中的作用。本文还解决了可持续汽车制造的障碍和潜在途径,强调了整个行业合作,立法支持和持续创新的必要性。关键字:环境可持续性,汽车制造,生命周期方法,创新,循环经济。1。引言由于需要解决资源耗竭,气候变化和环境恶化,因此环境可持续性已成为全球企业的关键问题。具有巨大的环境影响,汽车行业对于这一变化至关重要。汽车的生产历史上与高水平的废物生产,能源消耗和污染有关。2。但是,汽车设计和生产的范式转变是对可持续实践的需求日益增长的(BMW Group,2021; Ford Motor Company,2021)。重点是设计和开发阶段,本文旨在对汽车行业内环境可持续性的发展进行详尽的回顾。将包括用于汽车生产的生命周期方法,开发技术的整合,能节能的制造过程,可持续的材料选择和减少废物减少技术都将包括在内(国际能源机构,2020年)。可持续车辆设计的生命周期方法2.1生命周期评估概述(LCA)概述产品的环境效应在整个生命周期中进行了整个生命周期的环境效应,从生产和使用在其使用寿命结束时进行回收或处置,使用称为Lifecycle评估(LCA)。LCA在汽车领域越来越多地利用了可能会降低环境影响的位置(世界经济论坛,2021;欧洲委员会,2019年)。
Methods: This paper aims at the problem of target detection of Yunnan Xiaomila under complex background environment, in order to reduce the impact caused by the small color gradient changes between xiaomila and background and the unclear feature information, an improved PAE-YOLO model is proposed, which combines the EMA attention mechanism and DCNv3 deformable convolution is integrated into the YOLOv8 model, which improves the model ' s feature extraction capability and小米在复杂环境中的推理速度,并实现了轻巧的模型。首先,EMA注意机制与Yolov8网络中的C2F模块结合使用。C2F模块可以很好地从输入图像中提取本地特征,而EMA注意机制可以控制全局关系。两者相互补充,从而增强了模型的表达能力;同时,在骨干网络和头网络中,引入了DCNV3卷积模块,该模块可以根据输入特征映射自适应地调整采样位置,从而有助于针对不同尺度和轻量级网络的目标目标更强的功能捕获功能。它还使用深度摄像头来估计小米的姿势,同时分析和优化不同的遮挡情况。通过消融实验,模型比较实验和态度估计实验验证了所提出的方法的有效性。
本研究重点利用先进的深度学习技术对 MRI 图像进行特征检测,利用全面的脑肿瘤分割 (BraTS) 2018 数据集,其中包含 3,588 张 MRI 图像。本研究突出介绍了 You Only Look Once 版本 8 (YOLOv8) 算法的应用,该算法因其在复杂图像分析中出色的实时处理和准确性而被选中。该方法涉及详细的数据收集和精确的注释过程,采用 RoboFlow 进行高效的数据标记。该模型的训练经过精心设计,以平衡最佳学习和防止过度拟合。值得注意的是,该模型实现了 97.9% 的平均精度 (mAP),在 MRI 图像中的特征检测中表现出很高的准确性和可靠性。本文强调了 YOLOv8 在医学成像中的功效,并为医疗诊断中不断发展的人工智能领域做出了贡献。
摘要 - 对象检测是自动驾驶汽车和高级驾驶员辅助系统(ADA)的重要感知任务。虽然已经对相机图像中的对象检测进行了广泛的研究,但通过光检测和范围(LIDAR)数据来解决此任务,这是由于其固有的稀疏性带来了独特的挑战。这项研究引入了一种基于激光雷达的对象检测的开创性方法,其中Lidar Point Cloud数据巧妙地转换为伪RGB图像格式,随后将最初用于基于相机的对象检测设计的Yolov8网络。在Kitti数据集中受过训练和严格评估,我们的方法表现出出色的性能,达到了令人印象深刻的平均平均精度(MAP)超过86%。该模型还在Tihan IITH iith自主导航数据集(TIAND)的某个点云上进行了测试。这个了不起的结果强调了拟议方法在利用LiDAR数据以进行健壮对象检测时的效率,从而有助于在自主驾驶和ADAS应用中提高感知能力。索引项 - Yolov8,点云,BEV,LIDAR,对象检测,ADAS
摘要。您只看一次(YOLO)的对象探测器显示出显着的自动脑肿瘤检测精度。在本文中,我们通过结合双级路由关注,广义特征金字塔网络和第四个检测到Yolov8的探测来开发一种新型的BGF-Yolo架构。bgf-yolo包含一种注意机制,可以通过将高级半智能特征与空间细节合并,以更多地关注重要特征,并具有金字塔网络来丰富特征表示。此外,我们研究了不同注意力机制和特征融合的影响,检测脑肿瘤检测准确性的检测头构造。实验结果表明,与Yolov8x相比,BGF-Yolo的MAP 50绝对增加4.7%,并且在脑肿瘤检测数据集BR35H上实现了最先进的地图。该代码可在https://github.com/mkang315/ bgf-yolo上找到。
对手术仪器的准确识别对于术中人工智能(AI)系统的发展至关重要。在这项研究中,我们评估了Yolov8模型在识别机器人辅助腹部手术中的机器人和腹腔镜仪器方面的功效。具体来说,我们评估了其检测,分类和分段七种不同类型的手术工具的能力。从四个公共和私人来源编辑了一个多样化的数据集,其中包括代表各种手术环境和工具的7,400帧和17,175个注释。yolov8进行了训练和测试,用于二进制检测的平均平均精度为0.77,多仪器分类的平均精度为0.72。最佳性能。该模型还显示出极好的分割精度,达到0.91的平均骰子得分,平均交点为0.86,单极弯曲的剪刀得出最高的精度。值得注意的是,与腹腔镜工具相比,Yolov8对机器人仪器表现出了出色的识别性能,这可能归因于训练集中机器人仪器的更大表示。此外,该模型的快速推理速度为每帧1.12毫秒,突出了其对实时临床应用的适用性。这些发现证实了Yolov8使用全面的多源数据集对精确有效识别手术工具的潜力。
利用高级计算机视觉技术,例如深度学习和对象跟踪算法,手球视频中有能力的主动玩家检测功能可以自动在高速匹配中自动跟踪玩家的运动。这项创新不仅丰富了教练对球员绩效和团队动态的见解,而且还通过实时分析和增强现实增强来提高观众的参与度。在基于实践的手球视频的背景下,多个玩家经常出现,并非所有参与者都从事特定的练习或采用推荐的手球技术。本研究探讨了采用基于CNN的YOLOV8预训练模型与转移学习技术相结合的新方法,以增强手球识别。Yolov8 Architecture的高级功能是利用的,以解决玩家跟踪,球轨迹预测和复杂玩家互动中的现有差距。通过转移学习,该模型是使用特定于手球的数据进行微调的,从而在识别玩家,球和关键元素方面进行适应和专业化。该方法利用Yolov8的实时处理和多尺度分析来提高动态游戏方案的准确性,克服诸如遮挡和快速运动之类的挑战。通过将Yolov8预训练的模型与转移学习相结合,这种方法在实现全面有效的手球识别方面展现了有希望的进步,可以显着增强对玩家动态,球运动和整体游戏玩法的见解。Yolov8与转移学习的融合涉及利用Yolov8的预训练的特征来提取对象特征,然后对手球特异性数据的模型进行微调,以增强其在手球识别的背景下识别球员,球和其他基本要素的能力。我们使用751个手球场景视频的自定义数据集系统地评估了拟议的方法,该视频在培训年轻学员和男孩和男孩的年轻学员和手球学校期间捕获了[22]。测试涵盖了近60,000帧,并结合了诸如灵敏度,特异性和准确性之类的指标。结果表明,我们的方法超过了最新技术,展示了准确性的提高。值得注意的是,提出的方法表现出提高的效率,达到敏感性92.18%,特异性91.13%,精度分别为93.57%和F-评分94.33%。
在医学领域,由于患者人群中肿瘤的稀有性,对图像的可靠检测和分类仍然是巨大的挑战。在异常情况下检测肿瘤病例的能力对于确保及时干预和改善患者预后至关重要。这项研究通过利用深度学习(DL)技术来检测和分类具有挑战性的情况下的脑肿瘤来解决这一挑战。本研究采用深度学习(DL)技术来应对这一挑战,利用来自国家脑图实验室(NBML)的数据集,其中包括约81例患者,其中包括30例患者,其中包括30例肿瘤病例和51例正常情况。我们的方法包括两个阶段:检测和分类。在第一阶段,广泛的数据预处理模拟现实世界的条件,调整数据集以反映每种1例肿瘤病例的9例正常情况的异常分布。接下来,对Yolov8n模型进行了微调以检测肿瘤区域。为了评估该模型在患者水平上的表现,我们引入了患者对患者(PTP)度量,该指标评估了在整个人群中识别肿瘤病例的能力,而不是测量单个切片的性能。这种方法提供了模型可靠性更临床相关的评估。该模型的F1得分为0.98,PTP-F1得分为1.0,正确分类了测试人群中的所有患者。在分类阶段,数据有效的图像变压器(DEIT)用于从RESNET152教师模型中提取视觉变压器(VIT)模型。DEIT被选为其在小数据集上有效训练的能力。蒸馏分类器在20个时期后达到0.92,而RESNET152模型达到0.97,尽管计算成本较高,但达到了0.97。这项研究表明,在具有挑战性的情况下对脑肿瘤的可靠检测和分类方面有了显着的进步,从而提供了实用应用的潜力。
