一种提高计算机视觉准确性的新方法

研究人员使用了一组不同的简单图像生成程序来创建用于训练计算机视觉模型的数据集。这种方法可以提高在合成数据上训练的图像分类模型的性能。

来源:Qudata

一种提高计算机视觉准确度的新方法

所提出的方法使用合成数据来提高识别图像的 AI 模型的准确度。

为了使机器学习模型能够执行诊断医学图像中的疾病的任务,必须对其进行训练。训练图像分类模型通常需要庞大的数据集,数百万个类似图像的示例。这就是问题出现的地方。

使用来自真实医学图像的数据并不总是合乎道德的。毕竟,这可能是对人们隐私的侵犯、版权侵犯,或者数据集可能对特定种族或民族群体存在偏见。为了最大限度地降低这种风险,可以放弃真实图像数据集,而使用图像生成程序。这种方法将创建一个用于训练图像分类模型的合成数据集。然而,这些方法是有限的,因为通常需要专业知识来手动开发可以创建有效训练数据的图像生成程序。

麻省理工学院、MIT-IBM Watson AI Lab 等研究人员分析了生成图像数据集时遇到的所有问题,并提出了不同的解决方案。他们拒绝开发自定义图像生成程序,而是从互联网上公开可用的程序中收集了大量用于特定训练任务的基本图像生成程序。

他们的程序集由 21 000 个不同的程序组成,这些程序能够创建具有简单纹理和颜色的图像。这些程序很小,通常只占用几行代码。研究人员没有改变这些程序,而是立即用它们生成了一组图像。

进行的研究让我们重新思考数据预训练的过程。机器学习模型通常是预先训练的。它们首先在一组数据上进行训练,然后创建参数,然后它们可用于解决其他问题。

文章