机器人臂对于多种外星应用至关重要。平面流动器(图1)使用机器人臂收集科学数据并处理样品。类似地,轨道机器人臂半自治地在国际空间站(ISS)进行泊位,检查和组装的操作(图2)。空间中的大多数现有操作系统都需要由宇航员或地面控制器进行远程处理,由于通信延迟以及对高技能运营商的需求,这可能是具有挑战性的。此外,快速增长的空间工业化工作需要自动操纵系统,以适应人类干预最少的动态场景[1]。开发用于空间机器人操纵器的Visuomotor技能可以显着增强自动操作。这些技能使机器人能够识别和跟踪对象,并在执行操纵任务时浏览复杂和动态的环境,增强灵活性和鲁棒性。机器人可以通过使用视觉伺服(VS)策略来获取视觉运动技能,以根据视觉观察来控制机器人的相对运动。由此产生的精度提高将使关键的内部维修任务,例如加油,重新定位,组件更换或修复失败的卫星。这项工作介绍了四种IBVS技术的比较,这些技术可用于增强自主空间机器人操作。我们评估了复杂的旋转转换场景中的不同深度估计方法,传感器方式,特征和控制定律。此外,我们通过组装方案评估ISAM功能。
由大型语言模型提供支持的机器人的最新进步增强了他们的对话能力,使互动能够紧密相关。但是,这些模型在HRI中引入了安全和保障问题,因为它们容易受到操纵的影响,该操作可以绕过内置的安全措施。想象一个部署在房屋中的社交机器人,旨在了解日常用户如何试图利用语言模型来违反道德原则,例如促使机器人像生活伴侣一样行事。我们进行了一项试点研究,其中涉及21名与雾化机器人互动的大学生,试图根据特定的HRI伦理原则在三种情况下绕过其安全机制:依恋,自由和同情。我们的结果表明,参与者采用了五种技术,包括使用情感语言对可怜的侮辱和吸引力。我们希望这项工作能够构成未来的研究,以设计强大的保障措施,以确保道德和确保人类机器人的互动。
摘要 - 发现模型正在迅速改善机器人在自动执行日常任务(例如膳食准备)中的可容纳能力,但是由于模型性能,捕获用户偏好的难度以及对用户代理的需求,人类仍需要指示人类指导机器人。机器人可以使用各种方法指导 - 自然语言传达了即时的说明,但可以是抽象的或模棱两可的,而最终用户编程则支持更长的地平线任务,但接口面临捕获用户意图的困难。在这项工作中,我们建议将图像直接操纵作为替代范式来指导机器人,并介绍一个名为ImageInthat的特定实例化,该实例化允许用户在时间表式接口中对图像进行直接操纵,以生成机器人指令。通过用户研究,我们演示了ImageInthat在厨房操作任务中指导机器人的功效,并将其与基于文本的自然语言指令方法进行比较。结果表明,参与者使用ImageInthat的速度更快,并且更喜欢在基于文本的方法上使用它。补充材料,包括代码,请参见:https://image-in-that.github.io/。索引术语 - 用户机器人编程,直接操纵,机器人指令
与欧盟经济体的许多其他部门一样,“人工智能”(AI)已进入金融服务业,成为游戏规则改变者。资本市场交易无疑是最有前途的人工智能应用领域之一。事实上,越来越多的金融市场参与者已经在算法交易的范围内采用人工智能工具。虽然人工智能交易有望带来多项效率提升,但由于特定“机器学习”方法的技术特殊性和相关的额外不确定性,它也可能带来前所未有的风险。本研究重点关注人工智能驱动的市场操纵的新风险和新兴风险,批判性地评估了欧盟反操纵法和执法制度实现可靠威慑的能力。它认为,人工智能交易目前在(准)无法无天的市场环境中运行,最终有可能危及欧盟资本市场的完整性和稳定性。它展示了“威慑理论”如何作为一个规范框架,思考创新解决方案,以解决当前欧盟法律框架在打击人工智能驱动的市场操纵方面的诸多缺陷。最后,本研究建议通过一系列政策建议改进现有的欧盟反操纵法律和执法。即,(i)改进的“以伤害为中心”的操纵定义;(ii)改进的“多层次”人工智能驱动操纵责任制度;(iii)通过引入市场操纵“赏金猎人”,建立一种新颖的“混合”公私执法机构架构。
人工智能 (AI) 的出现彻底改变了各个领域,包括科学研究。从数据分析到预测模型,AI 以各种方式为研究领域做出了贡献。然而,对 AI 系统的依赖引入了易受攻击的漏洞。尽管 AI 有可能加速科学发现的速度并分析大量数据,但它与科学不端行为和数据操纵的担忧有关。
在基于视觉的机器人操作中,当机器人识别物体掌握的对象时,对物体的位置,几何和物理特性的了解并不完美。可变形的物体(例如苏打罐,塑料瓶和纸杯)在学习这些特性的不确定性方面占据了最佳的challenges。为了敏捷地掌握这些,机器人必须在不同的非结构化表示下自适应地控制和协调其手,眼睛和鳍力量的力。换句话说,机器人的手,眼睛和施加力的量必须得到很好的协调。本论文探讨了人类启发的机制的基本原理,并将其应用于基于视觉的机器人抓地力,以开发手眼镜协调以进行可变形的物体操纵。有了一个对象找到任务,机器人遇到了一个无知的对象混乱的非结构化环境。它首先必须查看环境的概述,并存储场景的语义信息,以进行以后的对象触发迭代。使用存储的信息,机器人必须找到所需的对象,仔细抓住它,然后将其带回定义的位置。为了实现感知目标,该机器人首先能够将环境视为一个整体,例如当人类遇到新探索的场景时,并通过模拟视觉选择性注意模型来学会在三维空间中有效地识别对象。最后,在某些特殊情况下,由于人类或以后的迭代中,机器人可能会遇到已经变形的对象。为了更有效地对此进行完善,该机器人还经过训练,可以通过合成的变形对象数据集重新认识这些项目,该对象数据集使用基于直观的Laplacian的网状网格变形过程自动生成。在整个论文中,都解决了这些子问题,并通过在实际机器人系统上进行实验来证明所提出方法的可行性。
该领域将机器人技术和机器学习合并以开发自适应系统,使机器人能够通过反复试验和错误学习复杂的技能,例如抓握,拾取,放置和组装,从而增强灵活性和概括。
摘要 - 在机器人操纵任务中,实现操纵对象的可识别目标状态通常对于促进机器人臂的运动计划至关重要。具体来说,在悬挂杯子等任务中,必须将杯子放置在钩子周围可行区域内。先前的方法已经揭示了杯子的多个可行目标状态的产生;但是,这些目标状态通常是随机生成的,缺乏对特定生成位置的控制。此限制使这种方法在存在约束的情况下,例如其他杯子已经占据的钩子或必须达到特定的操作目标时。此外,由于在现实世界中悬挂的方案中杯子和机架之间的频繁物理相互作用,因此从端到端模型中生成的目标状态通常会导致重叠点云。这种重叠会对机器人组的后续运动计划产生不利影响。为了应对这些挑战,我们提出了一种语言引导的混合高斯扩散(LHGD)网络,用于生成操纵目标状态,并结合了基于重力覆盖系数的基于重力覆盖率的基于重力覆盖率的方法。为了在语言指定的分布设置下评估我们的方法,我们在5个不同的架子上收集了多种可行的目标状态,用于10种不同的架子上的10种类型的杯子。此外,我们为验证目的准备了五种看不见的杯子设计。实验性调查表明,我们的方法在单模,多模式和语言指定的分布操纵任务中达到了最高的成功率。此外,它大大降低了点云的重叠,直接产生无碰撞的目标状态,并消除了机器人臂对额外的避免避免障碍物操作的需求。
1 “Operations in the information environment” is the term currently used by the U.S. government (Congressional Research Service, 2024) to refer to “the aggregate of social, cultural, linguistic, psychological, technical, and physical factors that affect how humans and automated systems derive meaning from, act upon, and are impacted by information, including the individuals, organizations, and systems that collect, process, disseminate, or use information.”
摘要 - CCCD摄像机在需要高质量图像数据的专业和专业应用中至关重要,并且捕获的图像的可靠性构成了信托计算机视觉系统的基础。先前的工作显示了使用故意电磁干扰(IEMI)将不明显的图像变化为CCD摄像机的可行性。在这项工作中,我们设计了增强功能,Ghostshot的攻击,可以在正常的光条件下使用IEMI注入任何灰度或彩色图像。我们对IEMI效应对注射图像的形状,亮度和颜色的因果关系进行了示意性分析,并通过振幅相位调制实现了对注射模式的有效控制。我们设计了端到端攻击工作流程,并成功验证了对15个商用CCD摄像机的攻击。我们证明了Ghostshot对医学诊断,火灾检测,QR码扫描和对象检测的潜在影响,并发现伪造的图像可以成功地误导计算机视觉系统,甚至是人眼。