如何将预通量的数据导入标签工作室并使用Docker

从VOC到JSON:导入预通道使如何将预通道的数据导入标签工作室,并与Docker一起运行完整的堆栈,这首先出现在数据科学方面。

来源:走向数据科学

对象检测培训工作流程的数据集准备可能需要很长时间,并且常常令人沮丧。 Label Studio是一种开源数据注释工具,可以通过提供一种简单的方法来注释数据集来借给手。它支持各种各样的注释模板,包括计算机视觉,自然语言处理以及音频或语音处理。但是,我们将专门关注对象检测工作流程。

标签工作室

但是,如果您想利用预先注释的开源数据集(例如Pascal VOC数据集)怎么办?在本文中,我将向您展示如何在设置整个堆栈的同时轻松地将这些任务导入标签工作室的格式,包括PostgreSQL数据库,Minio对象存储,NGINX反向代理和Label Studio Backend。 Minio是一种与S3兼容的对象存储服务:您可以在生产中使用云原始存储,但您也可以在本地运行它进行开发和测试。

minio

在本教程中,我们将仔细研究以下步骤:

    转换Pascal VOC注释 - 将边界框从XML转换为JSON格式的标签工作室任务。 S3兼容的桶。连接Minio标记工作室 - 将云存储存储桶添加到您的项目中,以便标签工作室可以直接获取图像和注释。
  • 将Pascal VOC注释转换 - 将边界框从XML转换为JSON格式的标签工作室任务。
  • 转换Pascal VOC注释
  • 运行完整的堆栈 - 使用PostgreSQL,Minio,Nginx和使用Docker Compose的后端启动标签工作室。
  • 运行完整的堆栈
  • 设置标签工作室项目 - 在标签工作室界面内配置新项目。
  • 设置标签工作室项目
  • 将图像和任务上传到Minio - 将数据集存储在与S3兼容的存储桶中。
  • Xmin ymin