自主机器人系统近年来引起了越来越多的关注,在这种环境中,环境是机器人导航,人类机器人互动和决策的关键步骤。现实世界机器人系统通常会从多个传感器中收集视觉数据,并经过重新识别以识别许多对象及其在复杂的人拥挤的设置中。传统的基准标记,依赖单个传感器和有限的对象类和场景,无法提供机器人对策划导航,互动和决策的需求的综合环境理解。作为JRDB数据集的扩展,我们揭开了一种新颖的开放世界式分割和跟踪基准,介绍了一种新型的开放世界式分割和跟踪基准。JRDB-Panotrack包括(1)各种数据室内和室外拥挤的场景,以及
摘要 - 在许多机器人应用中重建三维(3D)场景至关重要。机器人需要识别哪些对象及其位置和形状,以通过给定的任务精确地操纵它们。移动机器人,尤其是通常使用轻质网络在RGB图像上细分对象,然后通过深度图进行定位;但是,他们经常会遇到掩盖物体过度掩盖的分布场景。在本文中,我们通过使用非参数统计方法来完善分割错误来解决3D场景重建中的跨分割质量的问题。为了提高掩模的精度,我们将预测的遮罩映射到深度框架中,以通过内核密度估算它们的分布。然后,对异常值进行深度感知的拒绝,而无需以自适应方式进行额外的pa-rameters,以使其分布外情景,然后使用投影签名的距离函数(SDFS)进行3D重建。我们在合成数据集上验证了我们的方法,该方法显示了全景映射的定量和定性结果的改进。通过现实世界测试,结果还显示了我们方法在实体机器人系统上部署的能力。我们的源代码可在以下网址提供:https://github.com/mkhangg/refined Panoptic映射。
摘要 - 在许多机器人应用中重建三维(3D)场景至关重要。机器人需要识别哪些对象及其位置和形状,以通过给定的任务精确地操纵它们。移动机器人,尤其是通常使用轻质网络在RGB图像上细分对象,然后通过深度图进行定位;但是,他们经常会遇到掩盖物体过度掩盖的分布场景。在本文中,我们通过使用非参数统计方法来完善分割错误来解决3D场景重建中的跨分割质量的问题。为了提高掩模的精度,我们将预测的遮罩映射到深度框架中,以通过内核密度估算它们的分布。然后,对异常值进行深度感知的拒绝,而无需以自适应方式进行额外的pa-rameters,以使其分布外情景,然后使用投影签名的距离函数(SDFS)进行3D重建。我们在合成数据集上验证了我们的方法,该方法显示了全景映射的定量和定性结果的改进。通过现实世界测试,结果还显示了我们方法在实体机器人系统上部署的能力。我们的源代码可在以下网址提供:https://github.com/mkhangg/refined Panoptic映射。
人类对世界的看法是由多种观点和方式塑造的。许多现有数据集从某个角度专注于场景理解(例如以中心的或第三人称的视图),我们的数据集提供了一个全景视角(即具有多种数据模式的多个观点)。具体而言,我们封装了第三人称全景和前视图,以及以富裕方式,包括视频,多频道音频,定向双耳延迟,位置数据数据和文本场景描述,在每个场景中,呈现世界的全面实现,呈现了全世界的全面实现。据我们所知,这是第一个涵盖具有多种数据模式的多个观点的数据库,以模仿现实世界中如何访问每日信息。 通过我们的基准分析,我们在建议的360+x数据集上介绍了5个不同的场景理解任务,以评估综合场景理解中每种数据模式和观点的影响和好处。 我们希望这个独特的数据集能够扩大理解场景的范围,并鼓励社区从更多样化的角度解决这些问题。据我们所知,这是第一个涵盖具有多种数据模式的多个观点的数据库,以模仿现实世界中如何访问每日信息。通过我们的基准分析,我们在建议的360+x数据集上介绍了5个不同的场景理解任务,以评估综合场景理解中每种数据模式和观点的影响和好处。我们希望这个独特的数据集能够扩大理解场景的范围,并鼓励社区从更多样化的角度解决这些问题。
摘要 - 随着自动驾驶的快速进步,为其感应系统配备更全面的3D感知变得至关重要。但是,广泛探索的任务(例如3D检测或点云语义分段)重点是解析对象(例如汽车和行人)或场景(例如树木和建筑物)。在这项工作中,我们建议解决基于激光雷达的全景分段的具有挑战性的任务,该任务旨在以统一的方式解析对象和场景。特别是我们提出了动态转移网络(DS-NET),该网络是Point Cloud Realm中有效的全景分割框架。ds-net具有用于复杂LIDAR点云分布的动态移位模块。我们观察到,BFS或DBSCAN(例如BFS或DBSCAN)的常用聚类算法无法处理具有非均匀点云分布和不同实例大小的复杂自主驾驶场景。因此,我们提出了一个有效的可学习聚类模块,动态转换,该模块可以随时适应内核功能。为了进一步探索时间信息,我们将单扫描处理框架扩展到其时间版本,即4D-DS-NET,以进行4D Panoptic分割的任务,其中应为多个框架提供相同的ID ID预测。我们建议以更统一的方式求解4D Panoptic分割,而不是将跟踪模块附加到DS-NET上。该代码可在https://github.com/hongfz16/ds-net上公开获取。具体而言,4D-DS-NET首先通过对齐连续的LiDAR扫描来构造4D数据量,然后在其上执行时间统一的实例聚类以获得最终结果。进行了两个大规模自动驾驶激光雷达数据集(Semantickitti和Panoptic Nuscenes)的广泛实验,以证明所提出的溶液的有效性和出色性能。
自20世纪人工智能概念诞生以来,其影响力日渐凸显。经过几十年的发展,人工智能已经非常完善,甚至比人类的工作效率更高。在日常生活中,红绿灯、电子警察等人工智能随处可见。过去,研究人员认为人工智能为人们提供了便利,规范了人们的行为,因此人工智能应该广泛应用于社会管理。然而,没有人注意到人工智能对人类生活有轻微的控制,尤其是当人工智能与政府相关时。人工智能与政府管理有什么关系?这种关系如何影响人们的日常生活?作者将通过观察人们对社会规则的反馈来寻找这些信息。通过弄清楚这些问题,人们可能会更好地理解社会,并能够适应社会规则。例如,跟着交通信号灯走。
摘要:本研究关注的是读心术机器将如何连接起来,最初是通过弱人工智能,然后是与强人工智能相结合,这一方面将不再像现在这样具有简单的医疗作用,而是监视和监控个人——这一方面正引领我们走向未来的技术全景奇点。因此,本文的总体目标是提出人性的本体论稳定性问题,在读心术机器的技术奇点范围内,这会导致自主性的丧失和人类思想自由度的降低。在这个范式中,未来技术奇点时代的假设被预示为各种因素的累积,其中人工智能在人类监督的技术全景系统中以权力表现/施加的新世界秩序的形式相对于人类主体占据主导地位——即“单例”。理论目标分析了福柯全景机制(Foucault,1995、2003、2006、2008)的“去领土化”现象(Deleuze & Guattari,2000、2005)——该机制基于“生物权力”的“生命政治”体系——及其在技术全景奇点“领土”中的“再领土化”,其中强人工智能“单例”场景(Bostrom,2004、2006)代表了存在向硬技术决定论的异化。