1。与语言的视觉互动___XiaoMi-AI 助力科研平台

1。与语言的视觉互动

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

1。与语言的视觉互动

¥ 1.0

热度

我的目标是构建可以帮助实现现实任务的人的交互式AI系统，例如使机器人能够根据语言教学“洗衣服”执行家庭任务，或者允许数字助手通过与他们交谈来帮助盲目的视觉挑战。为了构建类似的系统，我进行了跨学科研究，该研究涵盖了计算机视觉，自然语言处理和机器人技术的交集。我的研究重点是基础：将语言与感知（主要是视觉）和动作联系起来，使机器能够理解物理世界的语义。通过整合这些不同学科的见解，我试图促进可以看到，交谈和采取行动的AI代理的发展，从而为解决社会需求并推动AI能力界限的解决方案做出了贡献。视觉是人类智力最重要的方式之一。为了弥合视觉和语言之间的差距，我开发了视觉上的交互式系统，这些系统可以与人类有关图像的连续沟通[1,2,3]。训练这些系统的主要瓶颈是缩放视觉接地的对话数据的困难。为了应对这一挑战，我引入了一种新方法，该方法会自动生成有关从网络获得数百万张图像的合成对话数据。通过利用综合数据来训练视觉接地的对话系统，我发现它们在与人交谈时会对图像产生准确而强大的响应。我已经将基于图像的系统扩展到基于视频的交互式系统[4]。我们提出了一种方法，以有效地融合以语言为基础的时间和空间信息，考虑到视频数据的独特属性。幼儿不仅通过感知来了解物理世界的语义，而且还通过与环境互动来操纵他们的感知[5]。这种观点帮助我将视觉扎根的系统扩展到体现的AI系统[6，7，8]，这些系统通过与人类的语言互动执行现实世界任务。我的工作专注于语言引导的机器人操纵，在该机器人手臂上应根据人类用户的自然语言指导来操纵对象。我研究了一种新的方案，其中初始指令在不提及目标对象的情况下模棱两可。体现的系统应通过查看和与用户对话来消除目标对象。我的工作成功 - 完全与人类互动以最小的互动来执行真实的任务。

添加pdf代下载 VIP点击下载文件

1。与语言的视觉互动

主要关键词

系统最小的机器人研究引导的技术的根据基础的新方法数据图像盲目的重要的计算机空间信息接地的考虑到视频数据任务系统的视觉代理的类似的模棱两可世界的语言 AI 界限的强大的互动跨学科人类交互式真实的对话

1。与语言的视觉互动PDF文件第1页

1。与语言的视觉互动PDF文件第2页

1。与语言的视觉互动PDF文件第3页

可下载资源数量

已经购买

下载数量：1

1。与语言的视觉互动

1。与语言的视觉互动

相关文件推荐

视觉

视觉

视觉调优

使用计算机视觉分析社交互动

视觉和视听语言的神经相关性...

3D计算机视觉

人类互动

视觉排序算法

艺术/视觉艺术

如何与行业互动

视觉治疗

计算机视觉

交换互动

语言的轻推和与机器人，智能扬声器和人类的言语互动

2.2.5人机器人互动

家庭互动计划

视觉零行动计划

视觉治疗

语言的经济原则

视觉策略

学习阅读如何改变视觉和语言的皮质网络

语言的起源

视觉策略

视觉任务计划

计算机视觉

计算机视觉

什么是视觉策略？

视觉人工智能

AI 视觉，更早行动

开放互动

XiaoMi-AI