通过Vision-...___XiaoMi-AI 助力科研平台

通过Vision-...

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过Vision-...

¥ 1.0

热度

对象导航（ObjectNav）要求代理在看不见的环境中导航以找到查询对象。许多以前的方法试图通过依靠经过跨越或强化学习来解决此任务，在该学习中，它们在具有近距离对象的有限家庭数据集上进行了培训。然而，尚未解决两个主要挑战：了解自由形式的自然语言指令，要求开放式观察，并以零拍的方式推广到新环境。旨在解决这两个挑战，在本文中，我们提出了OpenFM- NAV，这是一个基于零照射对象导航的基于odel m ODEL M ODEL的框架。我们首先释放了大型语言模型（LLMS）的推理能力，以从满足用户需求的自然语言指令中提取拟议的观察。然后，我们利用大型视觉语言模型（VLM）的普遍性来积极地从场景中发现和脱离候选对象，建立多功能语义得分图（VSSM）。然后，通过对VSSM进行常识推理，我们的方法可以对场景进行有效的语言引导探索和剥削，并最终达到目标。通过利用基础模型的推理和概括，我们的方法可以理解自由形式的人类指示并在不同环境中进行有效的开放式零射门导航。在HM3D ObjectNAV基准上进行的广泛实验表明，我们的方法超过了所有指标上的所有强基础，证明了我们方法的有效性。1此外，我们执行真实的机器人演示，以验证我们方法对现实环境的开放定点性和普遍性。

添加pdf代下载 VIP点击下载文件

通过Vision-...

主要关键词

通过Vision-...PDF文件第1页

通过Vision-...PDF文件第2页

通过Vision-...PDF文件第3页

通过Vision-...PDF文件第4页

通过Vision-...PDF文件第5页

可下载资源数量

已经购买

下载数量：1

通过Vision-...

通过Vision-...

相关文件推荐

3D Vision

对δ-...

在AI-...

β-...

rkvy-...

在pre-...

通过AI-...

Vision 2050

cu催化的α-...

Virtek Vision

dual-...

新颖的β-...

soft-...

通过Black-...

在'post-...

用Designer-...

Vision语句

neurdb：关于Ai-...

Laser-...

一种治疗β-...

3D Gross-...

温度对β-...

Synecosys®-...

Pre -...

TKH Vision

2030 Vision

DIA-...

使用Physics-...

使用Real-...

CSIR Vision 2030

XiaoMi-AI