仓鼠：...___XiaoMi-AI 助力科研平台

仓鼠：...

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

仓鼠：...

¥ 2.0

热度

大型模型已显示出对视觉和语言中复杂问题的强烈开放概括，但是它们在机器人技术中的部署相对较难。这一挑战主要源于缺乏可扩展的机器人训练数据，因为这需要昂贵的机器人收集。对于可扩展的培训，这些模型必须显示跨域的大量传输，以利用廉价可用的“偏离”数据，例如视频，手绘草图或模拟数据。在这项工作中，我们认为，层次视觉语言 - 行动模式可以比标准的单片视觉语言行动模型更有效地在域上传输行为。尤其是我们研究了一类Hier-Archical Vision-Language-Action模型，其中高级视觉语言模型（VLMS）在相对便宜的数据上训练，以产生具有语义意义的中间预测，例如2D路径，表明所需的行为。这些预先指定的2D路径是3D感知且能够精确操作的低级控制策略的指导。在这项工作中，我们表明将预先字典分开为语义高级预测，而3D感知的低级预测可以使这种层次结构的VLA策略可以跨越重要的域间隙转移，从模拟到现实世界或跨场景，具有巨大变化的视觉效果。这样做可以使用廉价，丰富的数据源，除了遥控的机上数据，从而实现了广泛的语义和视觉通用。我们证明了如何通过模拟和现实世界中的实验进行语义，视觉和几何概括来实现语义，视觉和几何概括的机器人操作，以实现机器人操作。

添加pdf代下载 VIP点击下载文件

仓鼠：...

主要关键词

工作中昂贵的遥控的机器人广泛的概括的扩展的数据变化的实现层次结构标准的概括 3D 丰富的视觉廉价可用的模拟数据策略的数据源语义模型结构的语言 2D 操作模拟重要的便宜的所需的操作的指定的复杂问题控制策略

仓鼠：...PDF文件第1页

仓鼠：...PDF文件第2页

仓鼠：...PDF文件第3页

仓鼠：...PDF文件第4页

仓鼠：...PDF文件第5页

可下载资源数量

已经购买

下载数量：1

仓鼠：...

仓鼠：...

相关文件推荐

在...

An ...

...

...

...

在...

在...

可以在...

通过...

在...

与...

在两个...

...

由于...

在...

...

在...

...

与...

关于...

...

在...

在...

在...

高 - ...

与...

...

在...

...

S- ...

XiaoMi-AI