用于实时物体检测的 YOLO 模型:完整指南 | Viam

了解 YOLO 模型如何在实时物体检测方面表现出色,从运动跟踪到安全。本指南涵盖了 YOLO 的演变、主要功能和示例,以帮助您使用其功能。

来源:Viam 博客

想象一下观看快节奏的运动游戏或繁忙的街道,并能够单一一眼就能立即识别和跟踪每个移动对象。这就是动作处理图像和视频的YOLO,以实时检测对象。

视频

但是Yolo的模型到底是什么,为什么这么大?

在本指南中,我将带您通过Yolo的来龙去脉,从其起源和演变到如何自己使用这些模型。

什么是对象检测?

对象检测是一种本地化特定对象在图像中的位置的方式。在此示例中,您可以看到被发现的人和花朵。

要了解Yolo模型及其工作方式,您需要了解对象检测。对象检测涉及在图像中识别和定位对象。

对象检测

这通常是使用由X和Y坐标定义的图像中的边界框区域完成的。这些框可视化为矩形边界,突出并近似场景中每个对象的位置。

显示如何将对象检测应用于带有Viam的应用程序的繁忙街道,并使用边界框来识别人员和汽车的指定对象。
显示如何将对象检测应用于 viam的应用 ,使用边界框来识别人员和汽车的指定对象。

有许多可以实现此目的的算法和模型,每个算法和模型都具有不同级别的准确性,速度和复杂性。

一个类似于HAAR的特征在算法中的作用的例子,例如Viola-Jones探测器。
一个示例,说明HAAR般的特征在算法中起作用,例如Viola-Jones检测器。

这些方法范围从传统方法,例如使用类似HAAR的特征来检测某些模式的算法,例如Viola-Jones检测器到更高级的深度学习模型。

传统方法

是这些实时检测的这些深度学习模型中最受欢迎和最有效的是Yolo。

什么是Yolo模型?

如果iou = 0: