详细内容或原文请订阅后点击阅览
YOLO - 你只看一次(单次检测器)
单次检测器以及 YOLO 如何用于对象检测和定位
来源:AI夏令营YOLO!!! 那么我们只能活一次吗?我当然不知道。我知道的是,我们只需要看一次。等什么?
没错。如果你想要检测和定位图像中的物体,则无需经历提出感兴趣区域、对它们进行分类并更正其边界框的整个过程。如果你还记得我之前的文章,这正是 RCNN 和 Faster RCNN 等模型所做的。
文章我们真的需要所有这些复杂性和计算吗?好吧,如果我们想要一流的准确性,我们当然需要。幸运的是,还有另一种更简单的方法来执行这样的任务,只需处理一次图像并立即输出预测。这些类型的模型称为单次检测器。
https://github.com/karolmajek/darknet-pjreddie
https://github.com/karolmajek/darknet-pjreddie https://github.com/karolmajek/darknet-pjreddie单次检测器
我们不用专门的系统来提出感兴趣的区域,而是有一组预定义的框来寻找物体,这些框被转发到一堆卷积层来预测类别分数和边界框偏移量。然后,对于每个框,我们预测多个边界框,每个边界框分配一个置信度分数,我们检测一个以该框为中心的物体,并为每个可能的类别输出一组概率。一旦我们拥有了所有这些,我们只需(也许天真地)保留具有高置信度分数的框。而且它有效。实际上,结果非常令人印象深刻。为了更好地阐述整体流程,我们使用最流行的单次检测器之一 YOLO。
然后,对于每个框,我们预测多个边界框,每个边界框分配一个置信度分数,我们检测一个以该框为中心的对象,并为每个可能的类输出一组概率你只看一次(YOLO)
PASCAL VOC首先,我们将图像分成 13x13 的网格,总共有 169 个单元格。
https://pjreddie.com/darknet/yolo/
https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/ 非最大抑制