视觉关键词检索结果

谷歌的 Nano Banana 2:可以重新定义视觉创造力的 AI 图像模型

Google’s Nano Banana 2: The AI Image Model That Could Redefine Visual Creativity

谷歌正准备发布迄今为止最雄心勃勃的人工智能图像模型之一。随着 Gemini 生态系统中 Nano Banana 2 的推出,该公司似乎已准备好将文本到图像生成带入全新领域。早期报告表明,这不仅仅是一个调整或改进——它实际上是一次重新发明。想象一下更好的照明控制、更清晰的边缘、更智能的文本渲染以及那种让您再看一眼并想知道您所看到的是真实的还是只是照片的真实感。或者至少,如果这些幕后视频关于 [...]

彻底改变机器视觉:京瓷推出用于高级物体识别的三镜头 AI 深度传感器

Revolutionizing Machine Vision: Kyocera Unveils Triple Lens AI Depth Sensor for Advanced Object Recognition

新型高分辨率相机可检测精细和半透明物体,为改进检查流程、手术和农业机器人铺平道路

人工智能解码视觉大脑活动并为其编写字幕

AI Decodes Visual Brain Activity—and Writes Captions for It

非侵入性成像技术可以将您头脑中的场景转化为句子。它可以帮助揭示大脑如何解释世界

案例分享:人工智能视觉检测助力风扇印刷质量控制

Case Sharing: Improving Quality Control in Fan Printing with AI-Powered Visual Inspection

客户:嘉浩印刷企业股份有限公司是台湾一家领先的印刷公司,专注于为各种产品提供高质量的定制印刷解决方案。 应用:印刷扇子产品的自动视觉检测。 挑战:嘉浩印刷在生产线上面临着关键的评估挑战,尤其是在检查印刷扇子方面。当他们的装料和 […]案例分享:使用人工智能视觉检测改善扇子印刷的质量控制首先出现在 Techman Robot 上。

如何将视觉语言模型应用于长文档

How to Apply Vision Language Models to Long Documents

了解如何应用强大的 VLM 来执行长上下文文档理解任务《如何将视觉语言模型应用于长文档》一文首先出现在《走向数据科学》上。

Nebius AI Studio 推出企业级图像生成——它可能会永远改变企业创建视觉效果的方式

Nebius AI Studio Unveils Enterprise-Grade Image Generation—And It Might Just Change How Businesses Create Visuals Forever

Nebius AI Studio 刚刚推出了一款专为大联盟打造的全新文本到图像平台,承诺实现闪电般的快速渲染和令人惊叹的清晰度。想想 2000×2000 像素精度、企业级可扩展性以及如此之低的价格,感觉就像是一个恶作剧。根据 Trend Hunter 的说法,这是关于使创造力民主化——一次调用一个 API。但真正令人着迷的是 Nebius 不仅仅追逐漂亮的图片,它还向整个行业示好。从营销团队连夜制作品牌内容到研究人员生成合成数据集,这一举措可以使企业人工智能工具比以往任何时候都更容易使用。我尝试想象这如何适应更广泛的[...]

基于视觉 AI 的机器关闭:viAct 在安全自动化中的作用

Vision AI Based Machine Shutdowns: viAct's Role in Safety Automation

预防事故并提高安全性。 viAct 的人工智能可自动关闭机器,以实现主动风险控制。更智能、更安全的工作场所。

通过 ColPali 将视觉语言智能引入 RAG

Bringing Vision-Language Intelligence to RAG with ColPali

释放知识库中非文本内容的价值这篇文章《与 ColPali 一起将视觉语言智能引入 RAG》首先出现在《走向数据科学》上。

为什么船舶制造商青睐实时视觉而不是严格的 CAD 系统 |维亚姆

Why marine manufacturers are embracing real-time vision over rigid CAD systems | Viam

两位工程师解释了 Viam 为何采用不同的自动打磨方法,以及为何实时 3D 成像会改变该应用的游戏规则。

视觉方法规则,解释。

Visual Approach Rules, Explained.

以下是它们的工作原理。

物流中的计算机视觉:关键用例和优势

Computer Vision in Logistics: Key Use Cases & Benefits

计算机视觉在物流中的关键用例——从仓库自动化到实时安全和效率改进。

输入、点击、繁荣 — Snapchat 的全新想象镜头将文字变成狂野的视觉效果

Type It, Tap It, Boom — Snapchat’s New Imagine Lens Turns Words into Wild Visuals

Snapchat 刚刚推出了一些非常疯狂的东西——一个让你的想象力完全占据屏幕的工具。 The new Imagine Lens turns simple text prompts into full-blown AI-generated images, and it’s now available to users in the U.S. If you’ve ever wanted to see yourself as a cyberpunk samurai or floating through space in a coffee cup, this feature’s got your

Apera AI 宣布推出 Vue 9.51、Forge 增强功能和大幅面 VuePorts,以加速 4D 视觉引导机器人技术

Apera AI Announces Vue 9.51, Forge Enhancements, and Large Format VuePorts to Accelerate 4D Vision-Guided Robotics

最新更新提供了新的校准见解、简化的拆架管道、直接 Forge-to-Vue 部署以及适用于最大规模 4D Vision 自动化项目的扩展相机尺寸。

我们的“心灵之眼”的工作方式可能与我们的视觉完全不同

Our 'mind's eye' may work entirely differently to our vision

根据国际研究,人类似乎使用大脑的不同部分在“心灵之眼”中描绘图像,而不是实时观察世界。为了调查大脑是否重用与视觉和空间意识相关的通路来进行想象力,研究人员开发了一项实验,要求人们在脑海中想象一张法国地图,并注意地图上的不同区域。在第二个实验中,参与者在屏幕上看到一幅图像,并要求他们关注不同的区域。通过监测大脑活动,研究人员表示,在一个实验中,与另一个实验相比,大脑似乎依赖于完全不同的大脑区域,这表明我们的视觉想象力是一个非常不同的过程。

ANN 每日航空术语 (10.16.25):增强型飞行视觉系统 (EFVS)

ANN's Daily Aero-Term (10.16.25): Enhanced Flight Vision System (EFVS)

增强型飞行视觉系统 (EFVS) 增强型飞行视觉系统 (EFVS) EFVS 是一种安装的飞机系统,它使用电子方式通过成像传感器(包括但不限于前视红外、毫米波辐射测量、毫米波雷达或微光图像增强)显示前方外部场景地形(某个地点或区域的自然或人造特征,特别是显示其相对位置和高度)。 EFVS 包括显示元件、传感器、计算机和电源、指示和控件。运营商进行 EFVS 操作的授权可能包含允许飞行员在报告的天气低于要飞行的 IAP 规定的最低天气时进行 IAP 的规定。

EncQA:图表视觉编码的视觉语言模型基准测试

EncQA: Benchmarking Vision-Language Models on Visual Encodings for Charts

多模态视觉语言模型 (VLM) 在图表理解基准上的得分不断提高。然而,我们发现这一进展并没有完全体现解释图表所必需的视觉推理能力的广度。我们引入了 EncQA,这是一种基于可视化文献的新颖基准,旨在提供对图表理解至关重要的视觉编码和分析任务的系统覆盖。 EncQA 提供 2,076 个合成问答对,实现六个视觉编码通道的均衡覆盖(位置、长度、面积、颜色……

2025年计算机视觉国际会议(ICCV)

International Conference on Computer Vision (ICCV) 2025

Apple 将在两年一度的国际计算机视觉会议 (ICCV) 上展示新作品,该会议将于 10 月 19 日至 23 日在夏威夷檀香山举行。该会议每年与欧洲计算机视觉会议(ECCV)交替举行,重点讨论计算机视觉领域的重要主题。

大黄蜂学习阅读简单的“摩尔斯电码”

Bumblebees Learn to Read Simple 'Morse Code'

ScienceDaily 伦敦玛丽女王大学的研究人员发现,一种昆虫,即大黄蜂 Bombus terrestris,可以通过识别视觉的持续时间来选择在哪里收集食物。