梨是最广泛消耗的水果之一,它们的质量直接影响消费者的满意度。表面缺陷,例如黑点和小斑点,是梨质量的关键指标,但由于视觉特征的相似性,检测它们仍然具有挑战性。这项研究提出了Pearsurfacedects,这是一个自我结构的数据集,包含六个类别的13,915张图像,其中有66,189个边界框注释。这些图像是使用定制的图像采集平台捕获的。在数据集上建立了27种版本的27个最先进的Yolo对象探测器的Yolo对象检测器,Yolor,Yolov5,Yolov5,Yolov6,Yolov7,Yolov7,Yolov7和Yolov9。为了进一步确保评估的全面性,还包括了三个高级非Yolo对象检测模型,T-DETR,RT-DERTV2和D-FINE。通过实验,发现yolov4-p7的检测准确性在map@0.5达到73.20%,而Yolov5n和Yolov6n也显示出极大的潜力,可以进一步提高梨表面缺陷检测的准确性。本研究中用于模型基准的梨表面缺陷检测数据集和软件程序代码都是公开的,这不仅会促进对梨表面缺陷检测和分级的未来研究,而且还为其他水果大数据和类似研究提供了宝贵的资源和参考。
抽象头盔使用对于摩托车骑手来说至关重要,以确保其在道路上的安全。此外,执行交通法规,例如识别没有头盔的车辆并承认其车牌,有助于维护道路安全和执法。在此项目中,我们提出了一个可靠的系统,用于针对摩托车专门量身定制的头盔检测和数板识别。我们利用Yolov5对象检测模型来检测图像或视频中的摩托车,然后确定骑手是否戴头盔。如果在没有头盔的情况下检测到骑手,则系统将使用光学特征识别(OCR)识别摩托车的车牌。我们采用了基于Python的OCR库Easyocr来从车牌图像中提取文本,并将信息保存到CSV文件中以进行进一步处理。拟议的系统提供了一个全面的解决方案,以增强有关头盔使用和摩托车的车牌识别的道路安全和执行交通法规。关键字:头盔检测,板识别,摩托车安全,Yolov5对象检测,光学特征识别(OCR),Easy Orkirlible,道路安全,交通规定,执法,执法,CSV文件处理。
脑癌是一种罕见且致命的疾病,生存的机会很小。神经科医生和放射科医生最重要的任务之一是尽早检测脑肿瘤。最近提出了基于计算机辅助诊断系统可以通过采用磁共振成像(MRI)作为支持技术来诊断脑肿瘤的说法。我们在本研究中使用MRI扫描提出了深度学习模型的转移学习方法,以检测胶质母细胞瘤等恶性肿瘤。本文提出了一种基于深度学习的方法,用于使用态对象检测框架Yolo(您只看一次),用于脑肿瘤识别和分类。Yolov5是一种新颖的对象检测深度学习技术,比其竞争模型需要有限的计算体系结构。该研究使用了来自RSNA-MICCAI脑肿瘤无线电基因组分类的BRAT 2021数据集。该数据集具有从RSNA-MICCAI脑肿瘤无线电基因组竞争数据集中注释的图像,该数据集使用有意义的AI在线工具标记数据集。然后将预处理的数据分为模型的测试和训练。Yolov5模型的精度为88%。最后,我们的模型在整个数据集中进行了测试,得出的结论是,它能够成功地检测脑肿瘤。
1人工智能(AI),机器学习(ML),深度学习(DL),计算机视觉(CV)和对象检测之间的关系。。。。。。。。。。。。4 2通过乘以网格单元中存在的ob ject的概率以及在预测和地面真相边界框之间与联合(iou)相交的概率来计算YOLO中的信心评分。。。。。。。。。。。。。。。。。。。。。。5 3边界框预测图。。。。。。。。。。。。。。。。。。。。。。。。。。。5 4 iou通用公式。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 5 iou二进制公式(tp = true straine,fn = false n = false and and fp =假阳性。)6 6 YOLO架构。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 7边界盒坐标损耗包含对象的网格单元。。。。。。。。。。。7 8包含对象的网格单元的边界框宽度和高度损失。。。。。。。。7 9包含对象的网格单元的置信分数损失。。。。。。。。。。。。。。。。7 10不包含对象的网格单元的置信分数损失。。。。。。。。。。。。。。7 11分类损失在网格细胞中存在对象。。。。。。。。。。。。。。。。。。。7 12目录结构,用于组织食物图像及其相应的标签,用于在Yolo模型中进行训练,验证和测试。。。。。。。。。。。。。。。。。。14 13各种食物类别的yolov5对象检测的精确构态曲线。。17 14 F1分数曲线Yolov5对象在各种食物类别上检测。。。。。。。。。17 15 Yolov5损失曲线和关键指标(精度,召回和地图)在时期。。。18 16混淆矩阵说明了Yolov5模型在分类不同的食物类别中的性能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。18 17各种食物类别的yolov6对象检测的精确构度曲线。19 18 F1分数曲线Yolov6对象检测各种食物类别。。。。。19 19 Yolov6损失曲线和关键指标(精度,回忆和地图)。。。20 20混乱矩阵说明了Yolov6模型在分类不同的食物类别中的性能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。20 21各种食物类别的yolov7对象检测的精确构度曲线。。21 22 22 F1分数曲线在各种食物类别上检测。。。。。。。。。21 23 Yolov7损失曲线和关键指标(精度,召回和映射)在时期。。。。22 24混乱矩阵说明了Yolov8模型在分类不同的食物类别中的性能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。22 25在各种食物类别上用于yolov8对象检测的精确构度曲线。。23 26 F1在各种食物类别上检测Yolov8对象检测的得分曲线。。。。。。。。。23 27 Yolov8损失曲线和关键指标(精度,召回和映射)。。。。24 28混乱矩阵说明了Yolov8模型在分类不同的食物类别中的性能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。24 29 YOLO模型的比较:检测速度和训练时间。。。。。。。。。。26 30跨关键评估大会的YOLO模型的全面绩效比较。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。26 31用户帐户注册提示用户输入其个人信息和健康数据以进行个性化卡路里跟踪。。。。。。。。。。。。。。。。。。。。。。29 32登录页面。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。30 33带有输入接口的主页,具有使用设备相机捕获图像或从设备存储中上传现有图像的选项。。。。。。。。30 34卡路里跟踪页面,显示每日卡路里限制,当天消耗卡路里,详细的食物日志以及每月的日历,突出显示每日卡路里的摄入量。。。。31
摘要:使用固定式水下摄像机是一种现代且适应性强的方法,可提供持续且经济高效的长期解决方案来监测特别感兴趣的水下栖息地。此类监测系统的共同目标是更好地了解各种海洋生物种群的动态和状况,例如迁徙或商业相关鱼类种群。本文介绍了一种完整的处理流程,用于从固定式水下鱼类观测站 (UFO) 的立体摄像机捕获的立体视频数据中自动确定生物种群的丰度、类型和估计大小。记录系统进行了现场校准,然后使用同步记录的声纳数据进行了验证。视频数据在德国北部波罗的海入口基尔峡湾连续记录了近一年。它展示了水下生物的自然行为,因为使用被动低光摄像机代替主动照明来减弱吸引力并实现尽可能少的侵入性记录。记录的原始数据通过自适应背景估计进行预过滤,以提取具有活动的序列,然后由深度检测网络(即 Yolov5)进行处理。这提供了在两个摄像机的每个视频帧中检测到的生物的位置和类型,用于按照基本匹配方案计算立体对应关系。在后续步骤中,使用匹配的边界框的角坐标来近似所描绘生物的大小和距离。本研究中使用的 Yolov5 模型是在一个新颖的数据集上训练的,该数据集包含 10 类海洋动物的 73,144 张图像和 92,899 个边界框注释。该模型实现了 92.4% 的平均检测准确率、94.8% 的平均精度 (mAP) 和 93% 的 F1 得分。
图3说明了Yolov5分类结果的实现。网络摄像头将捕获鱼类对象的实时图像,并且网络摄像头记录的输出将在Python程序中处理,其中已将ONNX文件作为学习模型合并。随后,系统将在显示器上显示鱼的图像,并配以相机捕获的鱼类。该系统成功地在监视器上成功显示了被检测到的鱼的实时图像,并伴有其各自的物种。此外,我们优化了该模型以提高速度和准确性,评估了性能指标,例如响应时间和准确率。实时鱼类分类系统展示了在渔业监测,环境研究和水产养殖行业中的潜在应用,为准确性和技术整合的持续进步铺平了道路。
摘要。包括Yolov4和Yolov5在内的Yolo系列对象检测算法在各种医学诊断任务中表现出卓越的表现,在某些情况下超过了人类的能力。但是,他们的黑盒性质限制了他们在需要模型决策的信任和解释性的医学应用中的采用。为了解决这个问题,已经以热图的形式提出了对AI模型的视觉解释,该模型突出了输入区域中最大程度贡献特定决策的输入区域。基于梯度的方法,例如Grad-CAM [1]和非基于梯度的方法,例如EIGEN-CAM [2],适用于Yolo模型,不需要新的层实现。本文评估了Grad-CAM和EIGEN-CAM在Vindrcxr胸部X射线异常检测数据集上的性能[3],并讨论了这些方法的局限性,以向数据科学家解释模型决策。
摘要 — 本项目旨在通过集成先进的硬件和软件技术,为视障人士提供安全独立的厨房导航。硬件模块采用 ESP32 微控制器,并集成了多个安全组件。温度传感器监测食物或烹饪食材的热量,并通过语音提醒是否适合食用。气体传感器通过检测泄漏并自动触发气缸旋钮关闭机制来确保安全。火灾探测由专用传感器管理,该传感器在紧急情况下会激活蜂鸣器。称重传感器用于测量物品的重量,当重量低于预设阈值时,系统会发出语音提示,通知用户重新加料。这些功能共同确保了安全便捷的烹饪环境,并根据视障用户的需求量身定制。在软件方面,该系统采用先进的人工智能驱动技术,进一步协助用户。图像转文本技术可以识别和发音包装上标注的成分名称,从而无需进行视觉识别。此外,基于 YOLOv5 的物体检测算法可以识别各种厨房食材、蔬菜和水果,并提供实时语音反馈,从而提升可用性。智能传感器与机器学习算法的结合,打造出强大且用户友好的解决方案,提升了用户的独立性和安全性。这款创新系统弥合了无障碍功能与科技之间的差距,使用户能够轻松自信地完成厨房任务。关键词:无障碍功能、ESP32、AI 驱动的厨房助手、温度检测、气体传感器、火灾探测、称重传感器、图像转文本、YOLOv5、物体检测、语音输出、视障人士支持、实时协助、智能厨房、安全监控。
随着 Vitis AI 3.0 的发布,我们现在支持 YOLOv5、YOLOv6 和 YOLOX。我们的工程团队正在开发 YOLOv7 支持,YOLOv8 也将紧随其后。用户必须了解,这些模型的原始版本是根据 GNU 公共许可证 (GPL) 发布的。GPL 与 Vitis AI 不兼容,后者是根据更宽松的 Apache 2.0 许可证发布的。出于上述原因,我们不会在 Vitis AI Model Zoo 中发布我们的源模型。在商业应用中使用 GPL 源应由最终用户在产品化之前进行评估。我们确实会根据要求向用户提供我们的浮点模型和训练脚本作为源代码。请联系 amd_ai_mkt@amd.com 了解更多详细信息。
