Panoptic

2024-04-07 机构名称:

360+X：一个庞大的多模式场景理解数据集

人类对世界的看法是由多种观点和方式塑造的。许多现有数据集从某个角度专注于场景理解（例如以中心的或第三人称的视图），我们的数据集提供了一个全景视角（即具有多种数据模式的多个观点）。具体而言，我们封装了第三人称全景和前视图，以及以富裕方式，包括视频，多频道音频，定向双耳延迟，位置数据数据和文本场景描述，在每个场景中，呈现世界的全面实现，呈现了全世界的全面实现。据我们所知，这是第一个涵盖具有多种数据模式的多个观点的数据库，以模仿现实世界中如何访问每日信息。通过我们的基准分析，我们在建议的360+x数据集上介绍了5个不同的场景理解任务，以评估综合场景理解中每种数据模式和观点的影响和好处。我们希望这个独特的数据集能够扩大理解场景的范围，并鼓励社区从更多样化的角度解决这些问题。据我们所知，这是第一个涵盖具有多种数据模式的多个观点的数据库，以模仿现实世界中如何访问每日信息。通过我们的基准分析，我们在建议的360+x数据集上介绍了5个不同的场景理解任务，以评估综合场景理解中每种数据模式和观点的影响和好处。我们希望这个独特的数据集能够扩大理解场景的范围，并鼓励社区从更多样化的角度解决这些问题。

查看详细

File

2024-01-07 机构名称:

统一的3D和4D全景分割通过动态移动网络

摘要 - 随着自动驾驶的快速进步，为其感应系统配备更全面的3D感知变得至关重要。但是，广泛探索的任务（例如3D检测或点云语义分段）重点是解析对象（例如汽车和行人）或场景（例如树木和建筑物）。在这项工作中，我们建议解决基于激光雷达的全景分段的具有挑战性的任务，该任务旨在以统一的方式解析对象和场景。特别是我们提出了动态转移网络（DS-NET），该网络是Point Cloud Realm中有效的全景分割框架。ds-net具有用于复杂LIDAR点云分布的动态移位模块。我们观察到，BFS或DBSCAN（例如BFS或DBSCAN）的常用聚类算法无法处理具有非均匀点云分布和不同实例大小的复杂自主驾驶场景。因此，我们提出了一个有效的可学习聚类模块，动态转换，该模块可以随时适应内核功能。为了进一步探索时间信息，我们将单扫描处理框架扩展到其时间版本，即4D-DS-NET，以进行4D Panoptic分割的任务，其中应为多个框架提供相同的ID ID预测。我们建议以更统一的方式求解4D Panoptic分割，而不是将跟踪模块附加到DS-NET上。该代码可在https://github.com/hongfz16/ds-net上公开获取。具体而言，4D-DS-NET首先通过对齐连续的LiDAR扫描来构造4D数据量，然后在其上执行时间统一的实例聚类以获得最终结果。进行了两个大规模自动驾驶激光雷达数据集（Semantickitti和Panoptic Nuscenes）的广泛实验，以证明所提出的溶液的有效性和出色性能。

查看详细

File

2024-07-02 机构名称:

使用移动机器人的内核密度估计

摘要 - 在许多机器人应用中重建三维（3D）场景至关重要。机器人需要识别哪些对象及其位置和形状，以通过给定的任务精确地操纵它们。移动机器人，尤其是通常使用轻质网络在RGB图像上细分对象，然后通过深度图进行定位；但是，他们经常会遇到掩盖物体过度掩盖的分布场景。在本文中，我们通过使用非参数统计方法来完善分割错误来解决3D场景重建中的跨分割质量的问题。为了提高掩模的精度，我们将预测的遮罩映射到深度框架中，以通过内核密度估算它们的分布。然后，对异常值进行深度感知的拒绝，而无需以自适应方式进行额外的pa-rameters，以使其分布外情景，然后使用投影签名的距离函数（SDFS）进行3D重建。我们在合成数据集上验证了我们的方法，该方法显示了全景映射的定量和定性结果的改进。通过现实世界测试，结果还显示了我们方法在实体机器人系统上部署的能力。我们的源代码可在以下网址提供：https：//github.com/mkhangg/refined Panoptic映射。

查看详细

JRDB-Panotrack：一个开放世界的全景进行分割和跟踪拥挤的人类环境中的机器人数据集

File

1900-01-01 机构名称:

JRDB-Panotrack：一个开放世界的全景进行分割和跟踪拥挤的人类环境中的机器人数据集

自主机器人系统近年来引起了越来越多的关注，在这种环境中，环境是机器人导航，人类机器人互动和决策的关键步骤。现实世界机器人系统通常会从多个传感器中收集视觉数据，并经过重新识别以识别许多对象及其在复杂的人拥挤的设置中。传统的基准标记，依赖单个传感器和有限的对象类和场景，无法提供机器人对策划导航，互动和决策的需求的综合环境理解。作为JRDB数据集的扩展，我们揭开了一种新颖的开放世界式分割和跟踪基准，介绍了一种新型的开放世界式分割和跟踪基准。JRDB-Panotrack包括（1）各种数据室内和室外拥挤的场景，以及

查看详细

File

2024-10-12 机构名称:

我们的 Panoptic 和 Epiphany 平台利用 AI 来帮助识别多付款错误以及加剧这些错误的流程弱点。我们还广泛接触供应商，以获取供应商的对账单，查找未申请或错过的信用额、错误的多付款、未分配或错误发布的现金 - 查找应付款但未记录在会计系统中的资金。我们定期管理全球

查看详细

XiaoMi-AI文件搜索系统

Panoptic

360+X：一个庞大的多模式场景理解数据集

统一的3D和4D全景分割通过动态移动网络

使用移动机器人的内核密度估计

JRDB-Panotrack：一个开放世界的全景进行分割和跟踪拥挤的人类环境中的机器人数据集

使用移动机器人的内核密度估计

[IROS-24]通过移动机器人的内核密度估计

clausmite

协作视觉文本表示为开放式摄取分段（补充材料）优化

FRANÇOIS STIEGER - 企业家和天使投资人

人工智能和机器学习如何改变恢复审计

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI