摘要 - 本文引入了一种创新的机器人解决方案,以应对农业中的sl骨损害的挑战。sl,尤其是灰色场sl,代表了一种全球植物害虫,对各种农作物构成了重大威胁。它们损害农作物的能力不仅会影响产品的质量,而且会导致超市中无法销售的蔬菜,这使其成为园丁和农民的紧迫关注。现有的SLUG控制方法通常涉及劳动密集型手工挑选或使用化学药品,这可能会对环境和人类健康产生不利影响。这项研究提出了一种环保和智能的解决方案,可确保sl的福祉,同时有效地应对这一农业挑战。机器人操作系统(ROS)基于自动移动机器人,配备了相机,并采用Yolov5(您只看一次)模型进行SLUG检测,自主使用全球定位系统技术自动浏览农业环境,以确保精确的本地化。收集机制旨在捕获sl,而无需损害它们。与其他杀人机器人相比,该解决方案侧重于slug的安全性,使其成为一种友好的方法。然后将收集的s骨安全地存放在指定的存储区域中。最终的概念验证机器人既有功能又具有成本效益,为可扩展生产提供了潜力。
摘要 - 本文介绍了一项有关使用深度学习技术的手写签名验证的全面研究。本研究旨在应对离线签名验证的挑战,在此任务是自动区分真正的签名与伪造的挑战。所提出的方法利用了最新的深度学习模型,包括Mobilenet,Resnet50,InceptionV3和VGG19与Yolov5结合使用,以实现高精度分类和可靠的伪造检测。在多个基准数据集上评估了该系统,包括Kaggle签名,Cedar,ICDAR和SIGCOMP,在各种现实世界中展示了其有效性和鲁棒性。所提出的方法包括数据预处理技术,以增强输入手写签名图像的质量,从而使模型能够捕获基本功能和模式以进行准确的分类。结果表明,与现有的最新方法相比,提出的方法的优越性在识别真正的特征并准确检测伪造方面达到了出色的准确率(89.8%)。此外,该模型对变化数据集大小和配置的适应性进一步支持其在签名验证任务中实际部署的潜力。这项研究有助于脱机签名验证技术的发展,为确保各种应用程序中手写签名的安全性和真实性提供了可靠,有效的解决方案。
近年来,人工智能 (AI) 在肿瘤学中的应用发展迅速,并取得了丰硕成果。这项工作旨在评估深度卷积神经网络 (CNN) 算法在口腔摄影图像中对口腔潜在恶性疾病 (OPMD) 和口腔鳞状细胞癌 (OSCC) 进行分类和检测的性能。将包含 980 张口腔摄影图像的数据集分为 365 张 OSCC 图像、315 张 OPMD 图像和 300 张非病理图像。使用 DenseNet-169、ResNet-101、SqueezeNet 和 Swin-S 创建多类图像分类模型。使用 faster R-CNN、YOLOv5、RetinaNet 和 CenterNet2 构建多类物体检测模型。最佳 CNN 模型 DenseNet-196 的多类图像分类的 AUC 在 OSCC 和 OPMD 上分别为 1.00 和 0.98。最佳多类 CNN 基础物体检测模型 Faster R-CNN 在 OSCC 和 OPMD 上的 AUC 分别为 0.88 和 0.64。相比之下,DenseNet-196 在 OSCC 和 OPMD 上的 AUC 分别为 1.00 和 0.98,获得了最佳多类图像分类性能。这些值与专家的表现一致,并且优于全科医生 (GP)。总之,基于 CNN 的模型具有在口腔摄影图像中识别 OSCC 和 OPMD 的潜力,有望成为协助全科医生早期发现口腔癌的诊断工具。
摘要:这项研究研究了在医疗技术领域内企业家生态系统和3d 11深度学习技术相结合的变革潜力。具体来说,我们将12重点放在使用Yolov5深度学习模型的心脏成像上,以提高诊断13精度。利用开源和3D心脏MRI数据集,我们的研究深入研究了14个生态系统如何加快15个心脏成像中3D深度学习(3D深度学习)的开发和实施。我们引入了一种交互式应用程序,即“ AI驱动的3D心脏成像应用程序”,使用简化框架开发了16,该框架的精度约为96.4%。这一进步17 17强调了当企业家生态系统鼓励18种AI方法的整合时,Medtech领域内的创新潜力。它不仅吸引了投资,还可以促进技能发展。此外,我们的19项研究阐明了这种技术进步对决策的影响,强调了对企业家生态系统的20种强大支持,以促进未来的医疗技术创新。这项研究21强调了AI整合在医疗保健中的变革性影响,但它也强调了对22种全面研究,跨学科合作和自适应决策的必要性,以与快速的23技术发展保持同步。26通过将3D深度学习技术整合到企业家生态系统中,这项24项研究阐明了革新心脏护理的途径,为医疗技术提供实用见解25企业家,医疗保健专业人员和政策制定者,以指导他们的决策过程。
摘要 — 确定脑肿瘤的范围是脑癌治疗中的一项重大挑战。主要困难在于对肿瘤大小的近似检测。磁共振成像 (MRI) 已成为一种重要的诊断工具。然而,从 MRI 扫描中手动检测脑肿瘤的边界是一项劳动密集型任务,需要广泛的专业知识。深度学习和计算机辅助检测技术已导致机器学习在这方面取得了显着进步。在本文中,我们提出了一种改进的 You Only Look Once (YOLOv8) 模型来准确检测 MRI 图像中的肿瘤。所提出的模型用检测头中的实时检测变压器 (RT-DETR) 取代了非最大抑制 (NMS) 算法。NMS 会滤除检测到的肿瘤中的冗余或重叠的边界框,但它们是手工设计和预设的。RT-DETR 删除了手工设计的组件。第二项改进是通过用鬼卷积替换正常卷积块进行的。 Ghost Convolution 降低了计算和内存成本,同时保持了高精度并实现了更快的推理速度,使其成为资源受限环境和实时应用的理想选择。第三项改进是在 YOLOv8 的主干中引入视觉变换器模块来提取情境感知特征。我们在提出的模型中使用了公开的脑肿瘤数据集。所提出的模型比原始 YOLOv8 模型表现更好,也比其他物体检测器(Faster R-CNN、Mask R-CNN、YOLO、YOLOv3、YOLOv4、YOLOv5、SSD、RetinaNet、EfficientDet 和 DETR)表现更好。所提出的模型实现了 0.91 mAP(平均精度)@0.5。
摘要随着计算机技术的出现,人工智能(AI)有助于放射科医生诊断脑肿瘤(BT)。可以在医疗保健中提高疾病的早期发现导致进一步的治疗,其中典型的AI系统应用在时间和节省的方面发挥了至关重要的作用。磁共振(MR)图像通过图像增强技术增强,以改善对比度和颜色的效果。此外,对于BT的几种类型的MR成像问题,传统方法是无偿的。深度学习技术可以扩展,以帮助克服常规肿瘤检测中遇到的常见问题。因此,在这项工作中,已经提出了基于MR图像的BT检测的即兴Yolov5技术。最终,使用混合网格搜索优化器算法(HGSOA)应用高参数优化(HPO)的想法,以增强拟议深神经网络中超级参数的肿瘤检测性能。为了评估提出的模型的有效性,麦卡洛克的算法rithm用于定位肿瘤区域分割的图像,并且还使用真实注释的图像检查了分割结果。使用MW脑测试图像进行了各种实验,以测量提出的微调模型的准确性。最后,将分类指标与现有的最新技术进行比较,包括MSE,PSNR,SSIM,FSIM和CPU时间,以证明所提出的模型的有效性。在MRI-BT的分类学中,CNN实现了更大的精确性。
摘要。对象检测的主题,涉及使汽车能够感知其环境的能力引起了更多的关注。为了更好地性能,对象检测算法通常需要大量的数据集,这些数据集经常被手动标记。此过程是充分的且耗时的。相反,模拟环境可以完全控制所有参数,并启用自动图像注释。Carla是一个专门用于自动驾驶研究的开源项目,就是这样的模拟器。本研究检查是否可以使用卡拉自动注释的模拟器数据来培训可以识别实际流量项目的对象检测模型。实验的发现表明,使用Carla的数据以及一些实际数据优化训练有素的模型令人鼓舞。Yolov5模型使用预验证的CARLA重量训练,与在2000 Kitti图像上受过训练的一项训练有素相比,所有性能指标均表现出改进。虽然它没有达到6000图像Kitti模型的性能水平,但增强确实很重要。MAP0.5:0.95得分的增强率约为10%,行人级别的改善最为明显。此外,可以证明,可以通过训练使用Carla数据的基本模型并使用Kitti数据集的较小部分对其进行微调来实现实质性的提升。此外,Carla Lidar图像在减少所需的真实图像的体积时的潜在效用是显而易见的。我们的代码可在以下网址找到:https://tinyurl.com/3fdjd9xb。
摘要功率分销网络的检查和维护对于有效地向消费者提供电力至关重要。由于电源分配网络线的高电压,手动现场直线操作很难,有风险和不足。本文研究了一个具有自主工具组装功能的功率分配网络实时运营机器人(PDLOR),以替代各种高风险电气维护任务中的人。为了应对PDLOR的动态和非结构化工作环境中工具组装的挑战,我们提出了一个框架,该框架包括深层视觉引导的粗糙本地化以及先验知识以及模糊逻辑驱动的深层确定性策略梯度(PKFD-DPG)高级装配算法。首先,我们提出了基于Yolov5的多尺度识别和本地化网络,该网络使PEG-HOLE可以快速接近并减少无效的探索。第二,我们设计了一个主要的合并奖励系统,其中主线奖励使用事后的经验重播机制,而辅助奖励基于模糊的逻辑推理机制,解决了学习过程中无效的探索和稀疏奖励。此外,我们通过模拟和物理实验来验证提出算法的有效性和优势,并将其性能与其他组装算法进行比较。实验结果表明,对于单芯组装任务,PKFD-DPG的成功率比具有功能的奖励功能的DDPG高15.2%,比PD力控制方法高51.7%。对于多工具组装任务,PKFD-DPG方法的成功率比其他方法高17%和53.4%。
1通讯作者:shital.pawar@bharatividyapeeth.edu收到:2024年5月13日修订:2024年6月11日接受:2024年7月11日出版:2024年7月27日,摘要 - 空白空间,商店和大型市场上的货架上的货架上的物品较少,而大型市场经常通过在需要的情况下使客户无法使用这些物品,从而使客户不满意。在商店和大型市场的货架上,空间和较少的物品通常会在需要时使不可用的物品使客户失望。这也反映了商店员工对工作的承诺。结果,销售量减少和卖方与客户之间的信任分解。对象检测用于识别较少项目的空空间和架子。通常用于对象检测的算法包括CNN,Yolo和SSD。使用了大型,可自由可用的标准数据集,例如Pascal(板号1)和Pascal(板号2),每个数据集都被使用,每个数据集包含约20个班级的货架项目检测。物品被标记为“库存”及其名称。此标签有助于视觉表示这些项目。对象检测通常需要GPU和网络摄像头。系统已经开发了一个包含四类杂货项目的数据集。项目的标签已从其各自的图像中得出,并将注释存储在单独的图像文件中。该系统已经使用Yolov5算法进行训练。由显示空货架或低项目计数的图像组成的输出已连接到电报API,以通知商店工作人员根据需要进行补货,从而简化了RETSOCKing Process。此多功能应用程序可用于库存管理,研究和开发,也可以与商业零售商店集成,并利用CCTV摄像机进行监视。
自主驾驶(AD)技术的快速进步显着强调了准确可靠的感知系统的发展,尤其是对于3D对象检测。本论文的重点是通过利用激光摄像机融合来增强自主驾驶中的3D对象。主要目的是开发一个可靠的系统,该系统将激光雷达的精确距离测量能力与相机信息提供的丰富上下文信息集成在一起,从而提高在多样化和动态驱动环境中对象检测的准确性和可靠性。本研究的目标包括开发传感器融合的系统,实施深度学习模型来处理融合数据以及通过实验验证所提出的方法。采用了预训练的Yolov5模型来检测相机捕获的2D图像中的对象。然后使用LiDAR数据将检测到的对象投影到3D空间中,该数据已同步并与相机数据校准。融合过程涉及将LIDAR点云转换为2D图像平面,以将深度信息与检测到的对象相关联,从而促进准确的3D对象。结果表明,整合LiDAR和相机数据可改善3D对象检测的效果。评估过程,其中包括将估计深度与实际测量结果进行比较,显示出最小的差异,从而证明了系统的高准确性和可靠性。本文通过在3D对象检测中提供了经过验证的IMELAIMEN-IMELAIMENT系统,从而有助于自动驾驶的领域。这些发现强调了传感器融合在增强自动驾驶汽车中感知系统的鲁棒性和准确性方面的重要性。未来的工作可能会集中在不利的天气条件下改善系统的绩效,集成其他传感器,例如雷达等其他传感器,并探索更先进的深度学习模型,以进一步推动自主驾驶技术的capabilies。
