图像数据关键词检索结果

用于气候变化分析的图像数据收集

Image Data Collection for Climate Change Analysis

初学者指南埃特纳火山的卫星图像。来源:美国地质调查局 (USGS) 在 Unsplash 上的照片。I. 简介深度学习在地球观测中成功传播。它的成就导致了更复杂的架构和方法。然而,在这个过程中,我们忽略了一些重要的东西。拥有更多优质数据比拥有更好的模型更好。不幸的是,EO 数据集的开发一直很混乱。如今,它们有数百个。尽管我们努力编译数据集,但可以说它们散布在各处。此外,EO 数据已经激增以满足非常具体的需求。矛盾的是,这正是我们应该用它们前进的相反方向,特别是如果我们希望我们的深度学习模型更好地工作的话。例如,ImageNet 编译了数千张图像以更好地训练计算机视觉模型。然而,EO 数据比 I

用于训练面部识别模型的 15 个免费人脸图像数据集的综合列表

Open Source Face Recognition Datasets: A Complete Resource

计算机视觉是人工智能的一个分支,它使计算机能够从图像和视频中提取有用的信息。然后,机器学习模型对提取的信息采取行动。虽然计算机视觉充当计算机的眼睛——观察和理解世界,但人工智能让它思考。计算机的目的 […]

新的图像数据库可实现真实的计算机视觉测试

Новая база изображений позволяет провести реалистичные испытания компьютерного зрения

计算机视觉模型已经可以识别照片中的物体,其准确度超出了人类在实验室测试中的能力。然而,在现实条件下,算法的准确性显着下降,引发了人们对自动驾驶和其他基于计算机视觉的技术的担忧。

机器视觉:MVTEC通过其深度学习工具的新版本扩展了深度学习组合

Machine Vision: MVTec Expands Deep Learning Portfolio with New Versions of its Deep Learning Tool

•深度学习工具可以通过直观的用户界面启用简单的图像数据标记•通过新的商业专业专业版和具有增强功能的OEM版本扩展免费的基本版本•客户可以将新的商业深度学习工具版转售为自己的解决方案的一部分

使用Amazon Bedrock和Amazon OpenSearch Service组合关键字和语义搜索文本和图像

Combine keyword and semantic search for text and images using Amazon Bedrock and Amazon OpenSearch Service

在这篇文章中,我们将使用OpenSearch Service构建混合搜索解决方案,该服务由亚马逊泰坦多模式多模式嵌入G1模型通过Amazon Bedrock提供的多模式嵌入。该解决方案演示了如何使用户提交文本和图像作为查询,以从示例零售图像数据集中检索相关结果。

使用双子座机器人技术,Google的目标是智能机器人

With Gemini Robotics, Google Aims for Smarter Robots

生成的AI模型正越来越接近在现实世界中采取行动。大型人工智能公司已经在介绍可以为您服务的基于Web的忙碌,订购杂货或进行晚餐预订的AI代理商。今天,Google DeepMind宣布了两种旨在为明天的机器人提供动力的生成AI模型。这些模型均建立在Google Gemini上,Google Gemini是一个多式联运基础模型,可以处理文本,语音和图像数据以回答问题,提供建议以及通常提供帮助。 DeepMind称为新模型,Gemini Robotics,这是一种“先进的视觉语言动作模型”,这意味着它可以采用所有相同的输入,然后输出机器人的身体动作指令。这些型号旨在与任何硬件系统一起使用,但大多在去

从机器学习工程师那里学习 - 第2部分:数据集

Learnings from a Machine Learning Engineer — Part 2: The Data Sets

在第1部分中,我们讨论了收集良好图像数据并为您的图像分类项目分配适当标签的重要性。另外,我们讨论了您数据的类和子类。这些似乎很简单,但是要对未来有一个扎实的理解很重要。因此,如果您还没有,请[…]从机器学习工程师那里进行的帖子学习 - 第2部分:数据集首先出现在数据科学上。

InsectNet 技术可识别世界各地和农场周围的昆虫

InsectNet technology identifies insects around the world and around the farm

爱荷华州立大学的研究人员领导开发了 InsectNet,以帮助世界各地的农民。该应用程序由 1200 万张昆虫图像数据集支持,其中包括许多由公民科学家收集的图像,可以识别和预测超过 2500 种昆虫,准确率超过 96%。

人工智能对 7 亿张极光图像进行分类,以便更好地预测地磁风暴

AI categorizes 700 million aurora images for better geomagnetic storm forecasting

极光,又称北极光,以夜空中令人惊叹的光影而闻名,但这种近地现象是由太阳的爆炸性活动引起的,并由太阳风携带,也会中断地球上重要的通信和安全基础设施。新罕布什尔大学的研究人员利用人工智能对有史以来最大的极光图像数据库进行了分类和标记,这可以帮助科学家更好地理解和预测破坏性的地磁风暴。

VideaHealth 创始人兼首席执行官 Florian Hillen——访谈系列

Florian Hillen, Founder & CEO of VideaHealth – Interview Series

Florian Hillen 是 VideaHealth 的创始人兼首席执行官,VideaHealth 是一个人工智能平台,旨在通过提高诊断准确性、简化工作流程和以一致和高效的方式支持患者治疗结果来增强牙科护理。VideaAI 受到领先牙科组织的信任,可与主要成像和实践管理系统无缝集成。它利用大量牙科图像数据集和 […]文章 VideaHealth 创始人兼首席执行官 Florian Hillen - 访谈系列首先出现在 Unite.AI 上。

雄性座头鲸为了繁殖而旅行创纪录的距离

Male humpback whale travels record-breaking distance for breeding purposes

一个由海洋生物学家、海洋学家和鲸类专家组成的国际团队发现了一头雄性座头鲸游出创纪录距离的证据,很可能是为了繁殖。在发表于《皇家学会开放科学》杂志的研究中,该团队分析了图像数据库中的图片,并在两个相当遥远的地区发现了同一头雄性座头鲸的证据。

解释:窥视深海的新方法

Explained: new ways to peer deep under our oceans

澳大利亚和美国的海洋研究人员开发了一个创新的开源框架,他们说这个框架改变了研究图像数据组的管理、处理和共享方式,为科学合作、公民科学和数据可访问性树立了新标准。这项工作建立在各种项目的基础之上,这些项目正在为科学家揭开水下世界的神秘面纱 […]

从 RAG 到结构:在 GenAIIC 构建真实 RAG 的经验教训 - 第 2 部分

From RAG to fabric: Lessons learned from building real-world RAGs at GenAIIC – Part 2

本博文重点介绍如何在异构数据格式上执行 RAG。我们首先介绍路由器,以及它们如何帮助管理不同的数据源。然后,我们给出如何处理表格数据的提示,最后介绍多模式 RAG,特别关注处理文本和图像数据的解决方案。

Airborne 10.30.24:ArkanSTOL 暂停、Stratolaunch 扩展、Artemus III

Airborne 10.30.24: ArkanSTOL Suspended, Stratolaunch Expands, Artemus III

还有:波音公司将出售太空业务?海军飞行员荣誉,螺旋桨事故,更多 B-21?ArkanSTOL 执行团队宣布其年度活动和比赛将无限期暂停。他们以“不断发展的职业和个人责任”为由,鉴于这些草根航空活动需要大量投入和规划,这一说法当然令人信服。这一不幸但可以理解的决定是在去年独特成功的活动之后做出的。Stratolaunch 最近完成了一系列旨在扩大其 Roc 空中发射飞机范围的飞行测试。Roc 翼展 385 英尺,比迄今为止的任何其他飞机都要大。这一系列飞行测试于 5 月和 6 月举行。他们证实了 Roc 能够支持高达 0.63 马赫的速度,在高达 35,000 英尺的高度运行,并在缩短休息时间后

Airborne 10.30.24:ArkanSTOL 暂停、Stratolaunch 扩展、Artemus III

Airborne 10.30.24: ArkanSTOL Suspended, Stratolaunch Expands, Artemus III

还有:波音公司将出售太空业务?海军飞行员荣誉,螺旋桨事故,更多 B-21?ArkanSTOL 执行团队宣布其年度活动和比赛将无限期暂停。他们以“不断发展的职业和个人责任”为由,鉴于这些草根航空活动需要大量投入和规划,这一说法当然令人信服。这一不幸但可以理解的决定是在去年独特成功的活动之后做出的。Stratolaunch 最近完成了一系列旨在扩大其 Roc 空中发射飞机范围的飞行测试。Roc 翼展 385 英尺,比迄今为止的任何其他飞机都要大。这一系列飞行测试于 5 月和 6 月举行。他们证实了 Roc 能够支持高达 0.63 马赫的速度,在高达 35,000 英尺的高度运行,并在缩短休息时间后

未充分研究物种的骨骼库

A Skeleton Bank of Understudied Species

借助新的医学图像数据库,动物园和野生动物兽医终于可以看到健康的罕见动物(从犀牛和狨猴到穿山甲和海星)的内部应该是什么样子。

ML 蜕变:链接 ML 模型以获得优化结果

ML Metamorphosis: Chaining ML Models for Optimized Results

知识提炼、模型压缩和规则提取的通用原则图 1。此图像和其他图像均由作者在 recraft.ai 的帮助下创建机器学习 (ML) 模型训练通常遵循熟悉的流程:从数据收集开始,清理和准备数据,然后进行模型拟合。但如果我们可以进一步推进这个过程会怎样?正如一些昆虫在成熟之前会经历剧烈的变化一样,ML 模型也可以以类似的方式进化(参见 Hinton 等人 [1])——我称之为 ML 蜕变。此过程涉及将不同的模型链接在一起,从而产生最终模型,该模型的质量明显优于从头开始直接训练的模型。其工作原理如下:从一些初始知识(数据 1)开始。在此数据上训练 ML 模型(模型 A,例如神经网络)。使用模型 A 生成

批判性审视 AI 图像生成

A Critical Look at AI Image Generation

图像生成 AI 究竟能告诉我们关于这个世界的什么信息?照片由 Math 在 Unsplash 上拍摄我最近有机会对一个有趣的项目进行分析,而我要说的太多了,无法在一篇文章中全部涵盖,所以今天我将讨论我对它的更多想法。研究人员在这个项目中采用的方法是向不同的生成 AI 图像生成工具提供一系列提示:Stable Diffusion、Midjourney、YandexART 和 ERNIE-ViLG(由百度提供)。这些提示特别针对不同的世代——婴儿潮一代、X 世代、千禧一代和 Z 世代,并要求在不同背景下拍摄这些群体的图像,例如“与家人在一起”、“度假”或“在工作”。虽然结果非常有趣,也许揭示了一些