图像数据关键词检索结果

现实世界用例:使用 Tabnet 和 Optuna 预测服务利用率

Real world Use Cases: Forecasting Service Utilization Using Tabnet and Optuna

Dall-e 生成的图像数据科学在现实世界中发挥着最佳作用。我打算分享我参与过的各种生产化项目的见解。在我担任数据科学家的这些年里,我遇到了很多有兴趣成为数据科学家的学生,或者刚刚毕业的刚起步的学生。像任何领域一样,开始数据科学的职业生涯需要陡峭的学习曲线。我经常被问到的一个非常好的问题是:我已经学到了很多关于数据科学的理论方面,但现实世界的例子是什么样的?我想分享一些我职业生涯中一直在从事的不同项目的小作品。即使有些作品可能已经是几年前的了,我只会写一些我仍然认为相关的主题。我会尽量保持总体情况的清晰和简洁,以便有抱负的新同事能够了解接下来可能发生的事情。但我也想停下来研究一下细节,我希望更

Clarifai 10.6:单击、注释、使用自动注释进行控制

Clarifai 10.6: Click, Annotate, Dominate with Auto-Annotation

只需单击即可自动注释整个图像数据集,将 Embedchain 框架与 Clarifai 集成,并探索新发布的模型 Florence-2-large 和 Claude 3.5 Sonnet,以及其他新功能和更新。

23 年 5 月产品综述 | Viam

May '23 product roundup | Viam

现在,您可以在 Viam 中直接在图像数据上训练对象检测模型。查看这篇文章中的方法,以及我们让控制机器人变得更容易的一些其他方法。

发现机器学习模型所犯的系统性错误

Discovering the systematic errors made by machine learning models

使用跨模态嵌入发现系统性错误在这篇博文中,我们介绍了 Domino,这是一种发现机器学习模型系统性错误的新方法。我们还讨论了定量评估 Domino 等方法的框架。链接:📄 论文(ICLR 2022)🌍 更长的演练💻 GitHub📘 文档📒 Google Colab 实现高总体准确率的机器学习模型通常会在连贯的验证数据切片上犯系统性错误。什么是切片?切片是一组具有共同特征的数据样本。例如,在大型图像数据集中,老式汽车的照片构成一个切片(即切片中的所有图像都有一个共同的主题)。术语切片有许多您可能更熟悉的同义词(例如子组、子群体、地层)。这些术语基本上可以互换,但在本文中我们将坚持使用“切片”。如

发现机器学习模型的系统性错误

Discovering the systematic errors made by machine learning models

使用跨模态嵌入发现系统性错误在这篇博文中,我们介绍了 Domino,这是一种发现机器学习模型系统性错误的新方法。我们还讨论了定量评估 Domino 等方法的框架。链接:📄 论文(ICLR 2022)🌍 更长的演练💻 GitHub📘 文档📒 Google Colab 实现高总体准确率的机器学习模型通常会在连贯的验证数据切片上犯系统性错误。什么是切片?切片是一组具有共同特征的数据样本。例如,在大型图像数据集中,老式汽车的照片构成一个切片(即切片中的所有图像都有一个共同的主题)。术语切片有许多您可能更熟悉的同义词(例如子组、子群体、地层)。这些术语基本上可以互换,但在本文中我们将坚持使用“切片”。如

了解利用未标记数据的深度学习算法,第 1 部分:自我训练

Understanding Deep Learning Algorithms that Leverage Unlabeled Data, Part 1: Self-training

深度模型需要大量的训练样本,但标记数据很难获得。这激发了利用未标记数据的重要研究方向,而未标记数据通常更容易获得。例如,可以通过爬取网络获取大量未标记的图像数据,而 ImageNet 等标记数据集则需要昂贵的标记程序。在最近的实证发展中,使用未标记数据训练的模型已开始接近全监督性能(例如 Chen 等人,2020 年,Sohn 等人,2020 年)。本系列博客文章将讨论我们的理论工作,该工作旨在分析使用未标记数据的最新实证方法。在第一篇文章中,我们将分析自我训练,这是一种非常有影响力的半监督学习和领域自适应算法范式。在第 2 部分中,我们将使用相关理论思想来分析自监督对比学习算法,这种算法对于

了解利用未标记数据的深度学习算法,第 1 部分:自我训练

Understanding Deep Learning Algorithms that Leverage Unlabeled Data, Part 1: Self-training

深度模型需要大量的训练样本,但标记数据很难获得。这激发了利用未标记数据的重要研究方向,而未标记数据通常更容易获得。例如,可以通过爬取网络获取大量未标记的图像数据,而 ImageNet 等标记数据集则需要昂贵的标记程序。在最近的实证发展中,使用未标记数据训练的模型已开始接近全监督性能(例如 Chen 等人,2020 年,Sohn 等人,2020 年)。本系列博客文章将讨论我们的理论工作,该工作旨在分析使用未标记数据的最新实证方法。在第一篇文章中,我们将分析自我训练,这是一种非常有影响力的半监督学习和领域自适应算法范式。在第 2 部分中,我们将使用相关理论思想来分析自监督对比学习算法,这种算法对于

神经网络将热门烹饪电视节目变成了恐怖电影

Нейросеть превратила популярное кулинарное телешоу в фильм ужасов

人工智能算法在许多任务上表现出色,但它们无法理解上下文——一项新实验再次证明神经网络无法进行创造性思考。研究人员使用英国热门烹饪电视节目“The Great Britain Bakeoff”中的参赛者、菜肴和摊位的图像数据库来训练 NVIDIA StyleGan 2 系统,并添加了松鼠的照片。