视觉表示对齐___XiaoMi-AI 助力科研平台

视觉表示对齐

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

视觉表示对齐

¥ 2.0

热度

在为人提供服务时，机器人需要优化与最终用户偏好保持一致的奖励。由于机器人将依靠原始的感知输入，因此他们的奖励将不可避免地使用视觉表示。最近，使用预训练的视觉模型的表示形式引起了人们的兴趣，但是在机器人技术中使这些工作的关键是微调的，这通常是通过动力学预测或执行时间周期矛盾的代理任务来完成的。但是，所有这些代理任务绕过了人类对他们重要的事物的输入，加剧了弹性相关性，并最终导致行为与用户偏好不一致。在这项工作中，我们建议机器人应利用人类的反馈将其视觉表示与最终用户保持一致，并解散该任务的内容。我们提出了representation-基于P参考的L奖（RAPL），这是一种通过基于偏好的学习和最佳运输的镜头来解决视觉表示对准问题和视觉奖励学习问题的方法。在X魔术和机器人手术中的实验中，我们发现Rapl的奖励始终产生具有较高样品效率的首选机器人行为，并在从不同的体现中学到与机器人的实现时显示出强烈的零光概括。

添加pdf代下载 VIP点击下载文件

视觉表示对齐

主要关键词

工作中强烈的参考的问题机器人输入保持一致时间周期表示偏好相关性模型的动力学重要的视觉模型人类最终用户不同的运输的任务奖励原始的行为完成的训练的不一致视觉代理工作的一致的

视觉表示对齐PDF文件第1页

视觉表示对齐PDF文件第2页

视觉表示对齐PDF文件第3页

视觉表示对齐PDF文件第4页

视觉表示对齐PDF文件第5页

可下载资源数量

已经购买

下载数量：1

视觉表示对齐

视觉表示对齐

相关文件推荐

通过对齐已知类表示

视觉

视觉

视觉

视觉调优

视觉导航的体积环境表示

单峰和多模式模型中的视觉表示

糖：机器人技术的预训练3D视觉表示

计算机视觉

计算机视觉

表示采矿

机器视觉

机器视觉

计算机视觉

计算机视觉

计算机视觉

微气候视觉

结果表示24

机器视觉

视觉护理

趋势视觉一

计算机视觉

计算机视觉

计算机视觉

视觉零策略

何时在婴儿的大脑中出现视觉类别表示？

知识表示

视觉任务

何时在婴儿的大脑中出现视觉类别表示？ 1

视觉治疗

XiaoMi-AI