多模关键词检索结果

周五视频:多模式人形步行、飞行、驾驶

Video Friday: Multimodal Humanoid Walks, Flies, Drives

Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。IROS 2025:2025 年 10 月 19 日至 25 日,中国杭州享受今天的视频!加州理工学院自主系统与技术中心 (CAST) 和阿联酋阿布扎比技术创新研究所最近进行了 X1 演示,这是两个研究所三年合作开发的多机器人系统。在演示过程中,CAST 开发的多模式机器人 M4 从人形机器人的背部以无人机模式发射。它着陆并转换为驾驶模式,然后根据需要再次返回。该演示强调了来自自主系统和技术前沿的

使用 Amazon Bedrock AgentCore Runtime 直接代码部署加快迭代速度

Iterate faster with Amazon Bedrock AgentCore Runtime direct code deployment

Amazon Bedrock AgentCore 是一个代理平台,用于大规模安全地构建、部署和操作有效的代理。 Amazon Bedrock AgentCore Runtime 是 Bedrock AgentCore 的完全托管服务,它提供低延迟无服务器环境来部署代理和工具。它提供会话隔离,支持多种代理框架(包括流行的开源框架),并处理多模式 [...]

视频星期五:机器人万圣节快乐!

Video Friday: Happy Robot Halloween!

Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA 2026:2026 年 6 月 1-5 日,维也纳享受今天的视频!伦敦大学学院祝您万圣节快乐![伦敦大学学院]KIMLAB 祝您万圣节快乐![动能智能机器实验室]DRAGON 实验室祝您万圣节快乐![东京大学 DRAGON 实验室]谢谢,Moju!Agility Robotics 祝您万圣节快乐![Agility Robotics]HEBI Robotics 祝您万圣节快乐![HEBI

构建高性能数据和人工智能组织(第二版)

Building a high performance data and AI organization (2nd edition)

对于人工智能来说,四年就是一生。自 2021 年发布第一版研究以来,人工智能的能力一直在快速发展,而且自生成式人工智能取得突破以来,这种进步并没有放缓。例如,多模态——不仅可以处理文本信息,还可以处理音频信息的能力……

Pico-Banana-400K:用于文本引导图像编辑的大规模数据集

Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

多模态模型的最新进展展示了卓越的文本引导图像编辑功能,GPT-4o 和 Nano-Banana 等系统树立了新的基准。然而,由于缺乏根据真实图像构建的大规模、高质量且可公开访问的数据集,研究界的进展仍然受到限制。我们推出 Pico-Banana-400K,这是一个用于基于指令的图像编辑的综合 400K 图像数据集。我们的数据集是通过利用 Nano-Banana 从 OpenImages 集合中的真实照片生成不同的编辑对来构建的。有何区别......

比较毒液组学表明蜘蛛毒液从捕食到防御的进化适应

Comparative venomics suggests an evolutionary adaption of spider venom from predation to defense

比较毒液组学表明蜘蛛毒液从捕食到防御的进化适应摘要大多数蜘蛛会使用麻痹性毒液来捕获猎物,但护士刺指 (Cheiracanthium punctorium) 的成虫会产生主要是防御性的毒液来保护它们的后代。在这里,我们描述了 C. punctorium 毒液的分子库,以阐明其进化历史。与其他蜘蛛的毒液不同,C. punctorium 毒液主要包含具有神经毒性的双结构域神经毒素 19 家族 (CSTX) 肽和酶,例如磷脂酶 A2 (PLA2)。代表两种下目的四只蜘蛛的毒液组学比较表明,CSTX 是在 mygalomorph-araneomorph 通过祖先基因复制和功能特化分裂约 300 mya

IEEE 进化计算汇刊,第 29 卷,第 5 期,2025 年 10 月

IEEE Transactions on Evolutionary Computation, Volume 29, Issue 5, October 2025

1) 客座社论进化动态优化作者:Danial Yazdani、罗文建、杨胜翔页数:1458 - 14622) 动态事件如何改变旅行商问题的适应度?作者:佟浩、李米青、刘家林、姚鑫页数:1463 - 14743) 历史 动态多模态优化的信息辅助动态响应集成和自适应利基方法作者:Kunjie Yu, Xuyang Zhang, Dezheng Zhang, Jing Liang, Yumeng Li, Heshan Wang, Ke Chen, Caitong YuePages: 1475 - 14894) 使用进化贪心的动态级联流程车间调度 算法作者:Qiu-Ying Li、Quan-Ke Pa

Agibot 推出下一代工业级交互式实体机器人 Agibot G2

Agibot Unveils Next-Gen Industrial-Grade Interactive Embodied Robot Agibot G2

它将快速学习和部署能力与多模态语音交互功能相结合,适用于工业生产、物流、导览等多种场景,有望重塑工业级实体机器人的应用格局。

IEEE Transactions on Cognitive and Developmental Systems,第 17 卷,第 5 期,2025 年 10 月

IEEE Transactions on Cognitive and Developmental Systems, Volume 17, Issue 5, October 2025

1) 客座社论:室内机器人中的嵌入式人工智能特刊:桥接感知、交互和自主作者:Yaran Chen、Chengguang Yang、Chaomin Luo、Dongbin ZhaoPages:1047 - 10492) 在哪里学习:由视觉语言模型规划的嵌入式感知学习作者:Juan Wang、Di 郭华平刘页数: 1050 - 10603) CS-SLAM: 一种用于动态场景的轻量级语义 SLAM 方法作者: 郭振东, 董娜, 张泽辉, 麦晓明, 李东辉页数: 1061 - 10734) 室内移动机器人导航与安全的多模态感知 操纵作者:张银龙、刘元浩、刘帅、梁伟、王初、王凯页数:1074 - 10

EncQA:图表视觉编码的视觉语言模型基准测试

EncQA: Benchmarking Vision-Language Models on Visual Encodings for Charts

多模态视觉语言模型 (VLM) 在图表理解基准上的得分不断提高。然而,我们发现这一进展并没有完全体现解释图表所必需的视觉推理能力的广度。我们引入了 EncQA,这是一种基于可视化文献的新颖基准,旨在提供对图表理解至关重要的视觉编码和分析任务的系统覆盖。 EncQA 提供 2,076 个合成问答对,实现六个视觉编码通道的均衡覆盖(位置、长度、面积、颜色……

将毒液转化为药物:氯毒素在胶质母细胞瘤诊断和治疗中的作用的全面综述

Translating Venom to Medicine: A Comprehensive Review on the Role of Chlorotoxin in Glioblastoma Diagnosis and Therapy

将毒液转化为医学:氯毒素在胶质母细胞瘤诊断和治疗中的作用的全面综述摘要胶质母细胞瘤是最具侵袭性的原发性脑肿瘤,预后不佳,尽管采用标准治疗,中位生存期仍不足 15 个月。这主要是由于肿瘤的浸润性、血脑屏障的限制性和瘤内异质性。氯毒素 (CTX) 是一种从蝎毒中提取的 36 个氨基酸肽,已成为一种有前景的多功能药物,对神经外胚层肿瘤具有高度特异性。在这篇全面的综述中,我们强调 CTX 有潜力通过桥接诊断和治疗方式来解决当前神经胶质瘤治疗的关键局限性。诊断方面的进步包括用于荧光引导手术的 CTX 偶联近 IF 荧光团和纳米颗粒以及可提高术中准确性的多模态成像。在治疗方面,CTX 能够靶向递送 siR