视觉关键词检索结果

IEEE Transactions on Neural Networks and Learning Systems,第 36 卷,第 11 期,2025 年 11 月

IEEE Transactions on Neural Networks and Learning Systems, Volume 36, Issue 11, November 2025

1) 用于少样本图像识别的知识引导语义迁移网络作者:李泽超、唐浩、彭志茂、齐国军、唐金辉页数:19474 - 194882) 基于脑电图情绪识别的可解释性分层动态图卷积网络作者:叶梦清、C. L. Philip陈同张页数:19489 - 195003) 鲁棒旋转等变对比学习作者:白盖瑞、奚伟、洪小鹏、刘新辉、岳阳、赵松文页数:19501 - 195144) 图形互信息最大化的多智能体强化学习作者:丁世飞、杜伟、凌丁,张健,郭莉莉,安博页面:19515 - 195245)大视觉语言模型攻击调查:资源,进展和未来趋势作者:Daizong Liu,Mingyu Yang,Xiaoye Qu,Pan

智能 EHS 系统如何帮助降低 SIF 率

How Smart EHS Systems Help Reduce SIF Rates

智能 EHS 在视频源上使用计算机视觉来实时发现高风险行为和不合规行为(例如没有个人防护装备)。

simpleshow 的新功能将幻灯片转换为旁白视频

simpleshow's New Feature Converts Slides Into Narrated Videos

新功能将静态演示文稿(例如 PowerPoint 文件)转换为动态的、由头像讲述的视频,将现有幻灯片与拟人演示者、自动配音和可定制的视觉风格相结合。这篇文章首先发表在 eLearning Industry 上。

您的手机走向专业版 - Nano Banana 2 如何将工作室级 4K AI 图像生成功能装进您的口袋

Your Phone’s Going Pro – How Nano Banana 2 Could Put Studio-Level 4K AI Image Generation in Your Pocket

他们说你永远不会在手机上创作真正的艺术 - 但似乎有人没有告诉即将推出的 Nano Banana 2 背后的人。坊间传闻,新一代 Google 实验性 AI 图像技术可以直接从你的口袋里制作出成熟的 4K 视觉效果。根据 Tom’s Guide 的详细报道,这次升级(内部称为 GemPix 2)继承了第一个版本的所有元素——那些风格化的 3D 肖像、生动的灯光、绘画纹理——并以更高的分辨率、更智能的即时理解和惊人的速度提升来增强它。 [...]

周五视频:这架无人机无缝驾驶和飞行

Video Friday: This Drone Drives and Flies—Seamlessly

Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA 2026:2026 年 6 月 1-5 日,维也纳享受今天的视频!与现有的混合动力设计不同,Duawlfin 仅利用其标准四旋翼电机并引入带有单向轴承的差速传动系统,从而无需额外的执行器或螺旋桨驱动的地面推进装置。空中和地面模式之间的无缝转换进一步强调了我们的方法在城市物流和室内导航等应用中的实用性和有效性。[ HiPeR Lab ]我欣赏 NEO 的柔软设计,但这些手指看起来非常脆弱。

信息图:“可视化美国人如何花钱”

Infographic: “Visualizing How Americans Spend Their Money”

我将这张视觉资本主义信息图添加到“人们如何度过一天的最佳可视化”中。

李飞飞荣获伊丽莎白女王工程奖

Fei-Fei Li wins Queen Elizabeth Prize for Engineering

这位斯坦福大学 HAI 联合创始人因推进计算机视觉和深度学习以及倡导以人为本的人工智能而受到认可。

[古生物学 • 2025] Paradoxophidion richardoweni • 来自英国霍德尔悬崖始新世晚期的一种新的奇特早期分歧蛇类(蛇类)

[Paleontology • 2025] Paradoxophidion richardoweni • A New peculiar early diverging caenophidian Snake (Serpentes) from the late Eocene of Hordle Cliff, England

Paradoxophidion richardoweni Georgalis & Jones,2025 sciencepress.mnhn.fr x.com/DrGeorgalis 由 Jaime Chirinos 创作的艺术品。我们在这里描述了一种新的蛇属和物种,其基于几个躯干和尾椎,起源于英格兰霍德尔悬崖的始新世晚期 (MP 17a)。我们通过视觉显微镜和微计算机断层扫描(μCT)扫描对化石材料进行了研究,重点关注其柱内变化,并将其与来自英格兰和欧洲大陆的其他古近纪蛇类群进行了广泛比较。这种新的小型分类单元具有一系列奇异而独特的脊椎特征,可以将其与所有其他蛇区分开来。其形态与罗素类相似;然

经典航空电视:METARmap 的持久吸引力

Classic Aero-TV: The Enduring Appeal of METARmaps

2023 年起(YouTube 版):艺术与信息的融合 METAR 地图由飞行员、飞机所有者和企业家 Richard Freilich 开发,是视觉艺术和实时气象观测的融合,在独特且实用的墙壁装饰中得到体现。 METAR 地图由 VFR 剖面图(或剖面图、复合图或其集合)的精心再现组成,并配有微型处理器,可控制图表地理边界内代表 METAR 报告机场的 LED 灯的照明和颜色。主题 LED 描绘了其代表的机场普遍的实时天气状况。

采用自我监督表示作为高效生成的潜在空间

Adapting Self-Supervised Representations as a Latent Space for Efficient Generation

我们引入了 Representation Tokenizer (RepTok),这是一种生成建模框架,它使用从自监督视觉转换器获得的单个连续潜在标记来表示图像。在预先训练的 SSL 编码器的基础上,我们仅微调语义标记嵌入,并将其与使用标准流匹配目标联合训练的生成解码器配对。这种适应通过低级的、与重建相关的细节丰富了令牌,从而实现了忠实的图像重建。为了保留原始 SSL 空间的有利几何形状,我们添加了余弦相似度损失......

输出塑造:思考人工智能内容创作的道德和使用的新方式

Output Shaping: A New Way to Think About the Ethics and Use of AI for Content Creation

我们创造的东西比如何创造更重要 一位图书馆员最近问了我一个完美地反映了我们现在处境的问题:“我们如何才能确保我们不会购买由人工智能编写的书籍?”我认为我的回答让她感到惊讶:“如果书的内容确实有价值,你会在乎吗?”她的问题反映了我们如何相信创作过程决定了所创造内容的价值。但这已经不再是我们实际体验大多数事情的方式了。我想建议我们可能是时候承认这种转变了。摄影标准在上一篇文章中,我谈到了自动和数字摄影如何使视觉叙事民主化。摄影曾经依赖于摄影师对曝光和显影技巧的掌握。但我们实际上是根据输出来判断照片的。大多数人并不关心一张令人惊叹的照片是用胶片相机、数码单反相机还是 iPhone 拍摄的。我们真的不

永远不会忘记面孔的人背后的科学

The science behind people who never forget a face

超级识别者在面部记忆方面表现出色,因为他们专注于关键的面部特征,而不仅仅是广泛的视觉信息。文章“永远不会忘记面孔的人背后的科学”首先出现在《科学询问者》上。

柾国的“GOLDEN: The Moments”展览将于今年 12 月在孟买首次亮相印度

Jung Kook’s ‘GOLDEN: The Moments’ exhibition to debut in India, opening in Mumbai this December

庆祝 Jung Kook 个人专辑的全球展览“GOLDEN: The Moments”将于 2025 年 12 月 12 日至 2026 年 1 月 11 日在印度孟买 Mehboob 工作室首次亮相。这种身临其境的体验由 BookMyShow Live 和 HYBE 合作,通过音乐、视觉和纪念品追溯他的艺术演变,标志着印度 K-pop 的重要时刻。

ANN 每日航空术语 (11.03.25):航线指示

ANN's Daily Aero-Term (11.03.25): On-Course Indication

航向指示 仪器上的指示,为飞行员提供了确定飞机位于给定导航航迹的中心线上的视觉方式,或者雷达示波器上的指示,表明飞机位于给定航迹上。

绘画记忆:立陶宛研究人员探索街头艺术如何塑造城市身份

Painting memory: Lithuanian researchers explore how street art shapes urban identity

考纳斯理工大学 (KTU) 的语言学家对立陶宛第二大城市的壁画进行了分析,将其视为“语言景观”的元素——这一概念将语言视为视觉和空间。他们的研究表明,考纳斯的街头艺术是文化活动和集体记忆的一种形式,融合了语言、图像和历史叙事。

3 个问题:人工智能如何帮助我们监控和支持脆弱的生态系统

3 Questions: How AI is helping us monitor and support vulnerable ecosystems

麻省理工学院博士生兼 CSAIL 研究员 Justin Kay 描述了他将人工智能和计算机视觉系统相结合来监控支持我们星球的生态系统的工作。

约翰霍普金斯大学入选亚马逊人工智能奖学金计划的九所学校

Johns Hopkins among nine schools selected for Amazon AI fellowship program

七名研究机器学习、计算机视觉和自然语言处理的约翰霍普金斯大学博士生通过新项目获得两年奖学金

“设计与众不同”:哈佛大学推出大卫·鲁宾斯坦树屋

‘Designed to be different’: Harvard unveils David Rubenstein Treehouse

“视觉联系”和可持续性是第一个全校会议中心的主要特点