详细内容或原文请订阅后点击阅览
使用 U-Net 进行图像分割
在图像分割中,图像的每个像素都被分配一个类别。根据应用,类别可以是不同的细胞类型;或者任务可以是二进制的,如“癌细胞是或否?”。无论应用领域如何,首选的既定神经网络架构都是 U-Net。在这篇文章中,我们展示了如何预处理数据并在 Kaggle Carvana 图像分割数据上训练 U-Net 模型。
来源:RStudio AI博客当然,当我有一张某个物体的图片时,神经网络可以告诉我这是什么类型的物体,这真是太好了。更现实的情况是,那张图片中可能有几个显著的物体,神经网络会告诉我它们是什么,在哪里。后一项任务(称为物体检测)似乎是当代人工智能应用的典型,这些应用在智力上令人着迷,在伦理上却值得怀疑。这与本文的主题不同:成功的图像分割有许多不可否认的有用应用。例如,它是医学、神经科学、生物学和其他生命科学的必要条件。
物体检测 图像分割那么,从技术上讲,图像分割是什么?我们如何训练神经网络来做到这一点?
图像分割概述
假设我们有一张有一群猫的图像。在分类中,问题是“那是什么?”我们想要听到的答案是:“猫”。在物体检测中,我们再次问“那是什么”,但现在“什么”隐含着复数,我们期望的答案是“有一只猫,一只猫,还有一只猫,它们在这里,这里,还有这里”(想象一下网络通过绘制边界框,即围绕检测到的物体的矩形来指向)。在分割中,我们想要更多:我们希望整个图像被“框”覆盖——不再是框,而是像素大小的“小框”的联合——或者换句话说:我们希望网络标记图像中的每个像素。
分类 物体检测 边界框 分割 我们希望网络标记图像中的每个像素。以下是我们稍后要讨论的论文中的一个例子。左侧是输入图像(HeLa 细胞),接下来是基本事实,第三是学习到的分割掩码。
图 1:Ronneberger 等人 2015 年的示例分割。
类分割 实例分割 类分割介绍 U-Net
Inception V[n] ResNet ResNext步幅
(Ronneberger、Fischer 和 Brox 2015)
连接
掩码
unet
::