摘要:机器视觉是一门旨在在计算机中复制人类视觉感知的跨学科领域,它取得了快速发展并做出了重大贡献。本文追溯了机器视觉的起源,从早期的图像处理算法到它与计算机科学、数学和机器人技术的融合,从而产生了一个独特的人工智能分支。机器学习技术(尤其是深度学习)的整合推动了其在日常设备中的增长和应用。本研究重点关注计算机视觉系统的目标:复制人类的视觉能力,包括识别、理解和解释。值得注意的是,图像分类、物体检测和图像分割是需要强大数学基础的关键任务。尽管取得了进展,但挑战依然存在,例如澄清与人工智能、机器学习和深度学习相关的术语。精确的定义和解释对于建立坚实的研究基础至关重要。机器视觉的发展反映了模拟人类视觉感知的雄心勃勃的旅程。跨学科合作和深度学习技术的整合推动了模拟人类行为和感知的显著进步。通过这项研究,机器视觉领域继续塑造计算机系统和人工智能应用的未来。
摘要 - 双方机器人由于其拟人化设计,在各种应用中提供了巨大的潜力,但其结构的复杂性阻碍了它们的控制。当前,大多数研究都集中在基于本体感受的方法上,这些方法缺乏克服复杂地形的能力。虽然视觉感知对于在以人为中心的环境中运作至关重要,但其整合使控制进一步复杂化。最近的强化学习(RL)方法已经显示出在增强腿部机器人运动方面的希望,特别是基于本体感受的方法。然而,地形适应性,尤其是对于两足机器人,仍然是一个重大挑战,大多数研究都集中在平坦的情况下。在本文中,我们介绍了专家教师网络RL策略的新型混合物,该策略通过一种简单而有效的方法来增强基于视觉投入的教师策略的绩效。我们的方法将地形选择策略与教师政策结合在一起,与传统模型相比,表现出色。此外,我们还引入了教师和学生网络之间的一致性损失,而不是强制实施相似之处,以提高学生驾驶各种地形的能力。我们在Limx Dynamic P1 Bipedal机器人上实验验证了我们的方法,证明了其跨毛线地形类型的可行性和鲁棒性。索引术语 - Bipedal机器人,增强学习,视觉感知的控制
ROMB Technologies是一家大学衍生公司,该公司开发,集成和商业化自主导航软件。我们的重点是需要高定位准确性和可重复性的应用,例如自动化材料处理。在实习期间,学生将参与自动叉车的控制,感知和用户界面软件的开发和测试。该位置需要计算机编程的知识(C ++和/或Python)。对控制系统,机器人运动学,视觉感知,信号处理,SLAM,ROS或Web开发的知识是一种奖励。该职位适合硕士学生。
自然发生的集体运动是一种引人入胜的现象,其中蜂拥而至的自发和协调其运动。许多蜂群的理论模型都假定理想化,完美的感知能力,而忽略了基本的感知过程,尤其是对于依靠视觉感知的代理商而言。具体而言,许多蝗虫等许多蜂群中的生物视觉利用了单眼非镜像视觉,从而防止了距离和速度的完美获得。此外,蜂群的同伴可以在视觉上相互阻塞,从而进一步引入估计错误。在这项研究中,我们探索了使用非镜镜,单眼视觉在受限条件下出现有序集体运动的必要条件。我们提出了一种基于视觉的聚集运动模型,用于蝗虫样药:拉长形状,平行于水平平面的全向视觉传感器,缺乏立体深度感知。该模型解决了(i)距离和速度的非镜镜估计,(ii)视野中存在闭塞。我们考虑并比较代理商可能用来以视觉感知过程所需的计算复杂性为代价来解释部分视觉信息的三种策略。在各种几何环境(环形,走廊和环形领域)进行的计算机模拟实验表明,这些模型可以导致有序的或近地有序状态。同时,它们在达到顺序的速度上有所不同。此外,结果对代理的伸长敏感。在几何受限的环境中进行的实验揭示了模型之间的差异,并阐明了使用它们来控制蜂群剂时可能的权衡。这些建议用于进一步研究生物学和机器人技术的途径。
“艺术家往往是洞察人类视觉系统如何运作的先驱。大约 5 万年前,艺术家们发现了如何通过在印度尼西亚的一个洞穴墙壁上画出猪的轮廓来引起人们对猪的印象。意大利建筑师菲利波·布鲁内莱斯基早在科学家想到线性透视之前就发现了它。直到今天,艺术家们仍然通过对如何描绘事物的直觉把握来启发对视觉感知的研究——无论是人物、地点、情感、心情等等。科学家和艺术家可以组成强大的团队来探索这些描绘背后的视觉过程。
视觉和空间认知、人机交互、思维漫游 我的研究考察了人类和其他动物用来解决各种视觉和空间问题的基本原理,以及如何在人工系统中实现这些原理,包括视觉感知(光流和自我运动判断、物体和场景识别、时间整合、视觉搜索等)、空间记忆和导航(参考框架、空间更新、重新定位、空间记忆中的系统性偏差、四维和非欧几里得空间中的学习等)、人机交互和生物信息人工智能(例如,人类与深度神经网络的类别学习)。此外,我还研究