摘要 - 我们提出了一种新颖的基于端到端扩散的轨迹生成方法DTG,用于无地图的全球导航,以挑战户外场景,并具有遮挡和非结构化的越野特征,例如草,建筑物,灌木丛等。给定一个遥远的目标,我们的方法计算出满足以下目标的轨迹:(1)最大程度地降低目标的旅行距离; (2)通过选择不位于不良区域的路径来最大化遍历性。具体来说,我们为扩散模型提供了一种新颖的条件RNN(CRNN),以有效地产生轨迹。此外,我们提出了一种自适应训练方法,以确保扩散模型产生更多可遍历的轨迹。我们在各种室外场景中评估了我们的方法,并将性能与赫斯基机器人的其他全球导航算法进行比较。实际上,我们观察到的行进距离至少提高了15%,遍历性提高了7%。视频和代码:https://github.com/jinggm/dtg.git。
摘要 - 人类通过专注于与导航相关的特定视觉区域,在没有碰撞的情况下有效地通过人群导航。但是,大多数机器人视觉导航方法都依赖于对视觉任务进行预训练的深度学习模型,这些模型优先考虑显着对象,而不一定与导航和潜在的误导有关。替代方法从头开始训练专业导航模型,需要大量计算。另一方面,自我监督的学习彻底改变了计算机视觉和自然语言处理,但是由于难以定义有效的自学信号,因此其在机器人导航中的应用仍未被忽略。是由这些观察结果激励的,在这项工作中,我们为视觉导航预训练(VANP)提出了一种自我监督的视觉动作模型。而不是检测对分类或检测等任务有益的显着对象,而是学会仅专注于与导航任务相关的特定视觉区域。为了实现这一目标,VANP使用了视觉观察的历史记录,未来的动作和一个自upervision的目标图像,并使用两个小型变压器编码器嵌入它们。然后,通过使用共同信息最大化目标函数,VANP最大化嵌入之间的信息。我们证明了大多数VANP提取的功能与人类导航直觉匹配。vanp的性能可相当,因为模型学习了端到端的一半训练时间和在大规模,完全监督的数据集(即Imagenet)上进行培训的模型,只有0.08%的数据。1
10 差旅费 ICG 将向符合条件的国际参与者提供有限的差旅费资助。尼泊尔的参与者不提供国内旅行的差旅费资助。该资助仅涵盖参与者最近的国际机场和加德满都特里布万国际机场之间的往返经济舱机票。所有其他费用(酒店、保险和日常餐饮费用等)必须由参与者支付。当地组织者将提供与签证、酒店预订和其他交通相关事宜相关的后勤支持。但是,所有费用均由参与者承担。
摘要:本文介绍了在打印工厂混乱且不断变化的环境中自动叉车导航应用程序的完整体系结构。根据可用导航轨道从现有的道路网络中选择全局路径。然后,一个本地路径规划仪与路径跟踪控制器相结合,可以使自主机器人导航。有限状态机器(FSM)体系结构确保在任务期间机器人的不同操作模式之间的过渡,包括避免障碍物。导航走廊是动态定义的,并通过跟踪控制约束的定义来尊重,并始终考虑安全有效的导航,并考虑到拥挤的工厂中叉车的空间约束。在ROS凉亭中模拟了一个叉车机器人及其环境,以验证该方法,然后在实际机器人原型上进行深入的实验,并在现实的操作场景中实时估算其实时性能。
摘要 - 无人机技术的快速发展已扩大了其应用程序,包括递送服务,环境监控以及搜索和救援操作。然而,这些应用中的许多应用在受GPS污染的环境中遇到了重大挑战,例如密集的城市地区和森林森林森林茂密的地区,传统导航方法却摇摇欲坠。本文提出了一种新型的多传感器融合算法,旨在提高自主无人机的定位准确性而不依赖GPS。通过整合来自惯性测量单元(IMU),LIDAR和视觉传感器的数据,提出的方法有效地补偿了单个传感器的局限性,从而在复杂的环境中实现了可靠的导航。实验结果表明,该算法在城市地区达到1.2米的平均定位精度,在森林环境中达到1.5米,从而展示了其针对传感器噪声和环境挑战的弹性。循环封闭技术的实施进一步提高了长期导航准确性,使其适合长时间的任务。这项研究有助于自动无人机导航的知识越来越多,并为增强现实情况下无人机的操作能力带来了重大影响。未来的工作将集中于整合其他传感器,探索机器学习技术以进行自适应融合,并进行广泛的现场试验以验证系统在动态环境中的性能。
摘要 - 对象目标导航(ObjectNav)是指在看不见的环境中导航到对象的代理,这是完成复杂任务时通常需要的能力。尽管它引起了体现的AI社区研究人员的越来越多的关注,但对ObjectNAV的当代和全面调查并没有。在这项调查中,我们通过总结了70多个最近的论文来概述该领域。首先,我们给出了ObjectNav的前期:定义,模拟器和指标。然后,我们将现有作品分为三个类别:1)直接将观测值映射到操作的端到端方法,2)由映射模块,策略模块和路径计划模块组成的模块化方法,以及3)使用零量的零摄像方法,使用零量量学习来进行导航。最后,我们总结了现有作品的性能和主要故障模式,并讨论了ObjectNAV的挑战。本调查将为该领域的研究人员提供完整的信息,以更好地了解ObjectNAV。
2历史11 2.1早期:水手和维京人。。。。。。。。。。。。。12 2.2年龄的到来:Voyager。。。。。。。。。。。。。。。。。。。。。16 2.3创新和解决方法:伽利略。。。。。。。。。。。。。。18 2.4地标:附近的鞋匠。。。。。。。。。。。。。。。。。21 2.5到期:卡西尼。。。。。。。。。。。。。。。。。。。。。。。。。22 2.6自治:深空1,星尘,深影响。。。。。。。23 2.7飞行硬件。。。。。。。。。。。。。。。。。。。。。。。。。。26 2.8发展技术的发展。。。。。。。。。。。。。。27 2.9星目录。。。。。。。。。。。。。。。。。。。。。。。。。。。28 2.10立体局限器法。。。。。。。。。。。。。。。。。。。。。。29 2.11未来的任务。。。。。。。。。。。。。。。。。。。。。。。。。。30 2.12 JPL外的光导航。。。。。。。。。。。。。。。。。30 2.13摘要。。。。。。。。。。。。。。。。。。。。。。。。。。。。。31
用于文本分析的抽象数字工具长期以来对于数字化库集合的可访问性和可访问性至关重要。最近的计算机视觉进步引入了类似的视觉材料功能,基于深度学习的嵌入显示了分析视觉遗产的希望。鉴于许多书籍还具有文本外,还具有视觉效果,因此利用这些突破对于使图书馆的收藏馆开放和易于访问至关重要。在这项工作中,我们提出了概念验证图像搜索应用程序,用于探索挪威国家图书馆1900年前的书籍中的图像,比较视觉变压器(VIT),对比性语言图像预训练(CLIP)和语言损失的语言损失 - 图像预训练(Siglip)(Siglip)的嵌入图像检验和分类。我们的结果表明,该应用程序在精确的图像检索中表现良好,在检索和分类任务中,siglip嵌入片段略优于剪辑和VIT。此外,基于siglip的图像分类可以有助于从数字化管道中清洁图像数据集。
在复杂环境中的机器人导航仍然是一项关键的研究挑战。值得注意的是,由于四足机器人的地形适应性和移动敏捷性,四足动导航已取得了重大进展。但是,传统的导航任务将机器人限制在预定义的自由空间中,并专注于避免障碍物,从而限制了它们在更具挑战性的环境中的适用性,例如缺乏可行的目标途径的场景。我们提出了一种交互式导航方法,该方法利用敏捷四足动物的运动来适应各种地形并与环境互动,更改工作区以应对开放且复杂的环境中挑战性的导航任务。我们提出了一棵原始树,用于使用大语言模型(LLM)的高级任务计划,从而促进了长期任务的有效推理和任务分解。树结构允许添加动态节点和修剪,从而对新观测值进行自适应响应,并在导航过程中增强鲁棒性和实时性能。对于低级运动计划,我们采用强化学习来预先培训技能库,其中包含复杂的运动和互动行为,以执行任务。此外,我们引入了一种基于认知的重型方法,该方法由顾问和树木师组成,以应对实时自我的观察。该提出的方法已在多个模拟场景中得到了验证,该方法在不同的情况下阐明了其在各种情况下的有效性和在部分可观察的条件下的实时适应性。