详细内容或原文请订阅后点击阅览
神经网络时代的语义分割
使用深度学习进行语义分割
来源:AI夏令营图像分割是计算机视觉中与对象识别和检测并列的基本任务之一。在语义分割中,目标是将图像的每个像素归类到特定类别中。与图像分类的不同之处在于,我们不是将整个图像归类为一个类,而是将每个像素归类为一个类。因此,我们有一组预定义的类别,我们想在图像的每个像素中分配一个标签。我们根据图像中不同对象的上下文进行此分配。
将图像的每个像素归类为特定类别用于高分辨率图像实时语义分割的 ICNet
用于高分辨率图像实时语义分割的 ICNet 用于高分辨率图像实时语义分割的 ICNet我们可以在上图中看到一个真实世界的例子。图像的每个像素都被分配了一个特定的标签,并用不同的颜色表示。红色代表人,蓝色代表汽车,绿色代表树木等。
值得一提的是,语义分割不同于实例分割,在实例分割中,我们区分同一类实例的标签。在这种情况下,人都会有不同的颜色。
但我们真的在乎吗?(顺便说一句,如果你不知道 frak 是什么意思,那就去看太空堡垒卡拉狄加吧。它很棒)。为什么我们需要这种高细节处理?
事实证明,语义分割有许多不同的应用。你可以从上面的图片猜出第一个。自动驾驶汽车。自动驾驶汽车需要知道它们看到了什么。他们需要知道一切。每一个该死的像素。另一个流行的用途当然是在机器人领域(工业或非工业领域)。我不能再列举更多了。地理传感、农业、医学图像诊断、面部分割、时尚。
自动驾驶汽车如果您确信,让我们看看我们如何完成这项任务。这并不难理解。